10 / 6 / 5
Регистрация: 04.04.2017
Сообщений: 14
|
||||||
1 | ||||||
Устранение узкого места в многопроцессной программе07.12.2019, 19:39. Показов 570. Ответов 2
Метки нет (Все метки)
Доброго времени суток, столкнулся с узким местом при разработке много процессной программы на питоне.
Программа подсчитывает количество вхождений ключевой фразы в текстовом файле, оба параметра (путь к файлу и ключевая фраза) задаются в командной строке. Свой личный опыт программирования на других языках говорит о том, что узкое место связано с разделением данных (объект lines) между процессами - а именно то, что объект lines поддерживаем доступ к данным лишь для одного процесса в одно и тоже время. Следовательно была предпринята попытка создать разрезы данных (дополнительные ссылки, в коде отмечено тройным восклицательным знаком после комментария) для каждого процесса, но результат не впечатлил. Исходный код и результаты тестов для одного и двух процессов приведены ниже по тексту. Прошу вашего мнения по методу оптимизации данной программы...
Код
C:\Users\DPC\Desktop>python ./keyseqfinder.py -f ".\Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 11.7325519 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f ".\Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 10.1927612 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f ".\Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.8788877 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f ".\Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.7096962 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f ".\Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.2697762 C:\Users\DPC\Desktop> Код
C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 8.733194699999999 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 8.6498893 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 8.703362700000001 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 8.5597862 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 8.717497 C:\Users\DPC\Desktop>
0
|
07.12.2019, 19:39 | |
Ответы с готовыми решениями:
2
Устранение узкого места в многопоточной программе Поиск "узкого" места и варианты решения Устранение ошибок в программе Устранение ошибок в программе с NAudio |
Просто Лис
|
|
07.12.2019, 20:30 | 2 |
Воркеры чуточку не так пишутся. Вы создали очередь, но не используете её. Главный поток должен класть задания в очередь, а воркеры забирать (и крутиться в вечном цикле, ожидая задания из очереди).
Если написать воркеры так, то можно нарезать входной файл на одинаковые кусочки (10-20-сколько угодно) и выдавать задания воркерам. У вас, скорей всего, много данных, поэтому прирост производительности от параллелизма будет "съедаться" на пересылку данных процессам. Добавлено через 1 минуту Уточнение: очередей должно быть две: входная и выходная.
1
|
10 / 6 / 5
Регистрация: 04.04.2017
Сообщений: 14
|
||||||
08.12.2019, 23:19 [ТС] | 3 | |||||
Сделал примерно так, как сказал Рыжий Лис, но вместо объекта Process используется объект Pool:
Код
C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.741935000000002 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.9012215 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.848994 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.721278000000002 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 9.761334900000001 C:\Users\DPC\Desktop> Код
C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 6.8526908 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 6.853741800000001 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 6.8378956 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 6.7401488 C:\Users\DPC\Desktop>python ./keyseqfinder.py -f "Всякие записи.txt" -k "Абишев Данияр" Counter: 396144 Elapsed: 7.0934037 C:\Users\DPC\Desktop> Господа продвинутые питонщики, наверника вам приходилось заниматся увеличением производительности, расскажите о своем личном опыте, привидите пожалуйста простые примеры того - как добится наибольшей скорости обработки данных. Скорее всего я где-то ошибся при использовании процессов и пуллов процессов - потому-что результат увеличения производительности совсем не велик...
0
|
08.12.2019, 23:19 | |
08.12.2019, 23:19 | |
Помогаю со студенческими работами здесь
3
fstream в многопроцессной среде Узкие места в программе Как закрыть фрейм из другого места в программе? Выбор места для хранения текста в программе Инжект более узкого скоупа в широкий Подключение дополнительного рабочего места для работы в программе через файл-сервер Устройство для создания узкого воздушного потока Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи | |||||
Книги и учебные ресурсы по C#
InfoMaster 08.01.2025
Базовые учебники и руководства
Одной из лучших книг для начинающих является "C# 10 и . NET 6 для начинающих" Эндрю Троелсена и Филиппа Джепикса . Книга последовательно раскрывает основные концепции. . .
|
Что такое NullReferenceException и как исправить?
InfoMaster 08.01.2025
NullReferenceException - одно из самых распространенных исключений, с которым сталкиваются разработчики на C#. Это исключение возникает при попытке обратиться к членам объекта (методам, свойствам или. . .
|
Что такое Null Pointer Exception (NPE) и как это исправить?
InfoMaster 08.01.2025
Null Pointer Exception (NPE) - это одно из самых распространенных исключений в Java, которое возникает при попытке использовать ссылку на объект, значение которой равно null. Это исключение относится. . .
|
Русский язык в консоли C++
InfoMaster 08.01.2025
При разработке программ на C++ одной из частых проблем, с которой сталкиваются русскоязычные программисты, является корректное отображение кириллицы в консольных приложениях. Эта проблема особенно. . .
|
Telegram бот на C#
InfoMaster 08.01.2025
Разработка ботов для Telegram стала неотъемлемой частью современной экосистемы мессенджеров. C# предоставляет мощный и удобный инструментарий для создания разнообразных ботов, от простых. . .
|
Использование GraphQL в Go (Golang)
InfoMaster 08.01.2025
Go (Golang) является одним из наиболее популярных языков программирования, используемых для создания высокопроизводительных серверных приложений. Его архитектурные особенности и встроенные. . .
|
Что лучше использовать при создании класса в Java: сеттеры или конструктор?
Alexander-7 08.01.2025
Вопрос подробнее:
На вопрос: «Когда одновременно создаются конструктор и сеттеры в классе – это нормально?» куратор уточнил: «Ваш класс может вообще не иметь сеттеров, а только конструктор и геттеры. . .
|
Как работать с GraphQL на TypeScript
InfoMaster 08.01.2025
Введение в GraphQL и TypeScript
В современной разработке веб-приложений GraphQL стал мощным инструментом для создания гибких и эффективных API. В сочетании с TypeScript, эта технология. . .
|
Счётчик на базе сумматоров + регистров и генератора сигналов согласования.
Hrethgir 07.01.2025
Создан с целью проверки скорости асинхронной логики: ранее описанного сумматора и предополагаемых fast регистров. Регистры созданы на базе ранее описанного, предполагаемого fast триггера. То-есть. . .
|
Как перейти с Options API на Composition API в Vue.js
BasicMan 06.01.2025
Почему переход на Composition API актуален
В мире современной веб-разработки фреймворк Vue. js продолжает эволюционировать, предлагая разработчикам все более совершенные инструменты для создания. . .
|
Архитектура современных процессоров
inter-admin 06.01.2025
Процессор (центральный процессор, ЦП) является основным вычислительным устройством компьютера, которое выполняет обработку данных и управляет работой всех остальных компонентов системы. Архитектура. . .
|
История создания реляционной модели баз данных, правила Кодда
Programming 06.01.2025
Предпосылки создания реляционной модели
В конце 1960-х годов компьютерная индустрия столкнулась с серьезными проблемами в области управления данными. Существовавшие на тот момент модели данных -. . .
|