С Новым годом! Форум программистов, компьютерный форум, киберфорум
OpenCL
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.60/229: Рейтинг темы: голосов - 229, средняя оценка - 4.60
3460 / 1648 / 236
Регистрация: 26.02.2009
Сообщений: 8,051
Записей в блоге: 5
1

Производительность OpenCL

14.08.2014, 15:35. Показов 43659. Ответов 438
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Доброго времени!
Написал тест для будущих расчётов с использованием OpenCL и проверил на разных системах:
( дрова для AMD 14.4; для nVidia 340.52 )

Radeon HD 7970(2048/925MHz; 384bit; 3Gb/5GHz) и CPU AMD 8120 справились за 4.3 секунды
GeForce GTX 760(1152/980MHz; 256bit; 4Gb/6GHz) и CPU Intel Q9450 справились за 22.5 секунд
GeForce GTS 450(192/750MHz; 128bit; 2Gb/??) и CPU Intel i7 2600 справились за 46.0 секунд
GeForce GT 520M(48/740MHz; 64bit; 2Gb/??) и CPU Intel 2630QM справились за 117.0 секунд

Интересен слив GTX 760 который оказался в 5,2 раза медленней(хотя по цене так не скажешь). Похоже дело в двойной точности(DP) которая у GeForce урезана маркетологами до 1/24 от производительности одинарной точности(SP). Хотя на титанах говорят оставили полную поддержку 1/3 как в Tesla'x(нужно включать спец галочку в дровах). У всех радиков вроде 1/2.
Ну и плюс к этому, наверное, сам OpenCL драйвер не лучшим образом реализован ибо есть своя CUDA, которая при всех остальных равных не нужна будет ни кому.

Поэтому интересуют тесты либо на более слабых радеонах, либо на топовых джифорсах. А лучше и те и те и побольше!
Ищутся счастливые обладатели карт и готовые скачать и запустить тест( ~30 Мбайт ):
GeForce GTX 780(с TI или без)
GeForce GTX TITAN(с BLACK EDITION или без)
Radeon R9 290( с Х или без ) - для этих карт наверно уже результат будет больше зависеть от CPU
Ну и любые другие радики не старше HD 7000.


https://cloud.mail.ru/public/f... L_TEST.rar
Распаковать архив полностью и запусить ехе
Обязательно укажите проц.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
14.08.2014, 15:35
Ответы с готовыми решениями:

OpenCL на С++
Здравствуйте, уважаемые форумчани. Стоит задача написать знаменитую GameOfLife на С++ с...

OpenCL на OS X
Ребят, помогите разобраться как начать работать с OpenCL на OS X? Не понимаю что и где надо скачать...

Программа в OpenCL
Братцы, сроки поджимают и нужно закончить программульку одну. В общем, делал-делал и пришёл я к...

Работа с OpenCL
Добрый вечер уважаемые форумчане, не мог бы кто нибудь помочь вводным курсом в opencl? Есть задача:...

438
8055 / 5424 / 205
Регистрация: 29.08.2011
Сообщений: 39,370
Записей в блоге: 1
16.08.2014, 19:10 21
Author24 — интернет-сервис помощи студентам
AMD Athlon 64 X2 6000+ + HD6250
что там хваленый 4770 набрал 51 000 мил
учитесь как 6000+ делает это за 451 мил
Миниатюры
Производительность OpenCL  
0
3460 / 1648 / 236
Регистрация: 26.02.2009
Сообщений: 8,051
Записей в блоге: 5
16.08.2014, 19:17  [ТС] 22
Цитата Сообщение от K2K Посмотреть сообщение
могу попросить камрадов на 290/290Х прогнать, мож кто откликнется. Интересует?
Конечно интересует!

Добавлено через 2 минуты
Цитата Сообщение от dimank666 Посмотреть сообщение
учитесь как 6000+ делает это за 451 мил
Это какой-то глюк! Быть этого не может. Блин, нужно валидацию данных делать. Но проверка займёт значительно больше времени, так как будет происходить без OpenCL

Добавлено через 4 минуты
dimank666, Вам можно медаль давать за терпение. Целых 20 минут атлончег считал =)
0
8055 / 5424 / 205
Регистрация: 29.08.2011
Сообщений: 39,370
Записей в блоге: 1
16.08.2014, 19:25 23
Цитата Сообщение от snake32 Посмотреть сообщение
Это какой-то глюк! Быть этого не может. Блин, нужно валидацию данных делать. Но проверка займёт значительно больше времени, так как будет происходить без OpenCL
может может

процессоры амд 6000+ серии обладают даром предвидения, они видят сразу окончательный ответ а не занимаются тупыми и долгими расчетами
Добавлено через 1 минуту
Цитата Сообщение от snake32 Посмотреть сообщение
dimank666, Вам можно медаль давать за терпение. Целых 20 минут атлончег считал =)
я успел как рас поужинать

Добавлено через 6 минут
Цитата Сообщение от snake32 Посмотреть сообщение
Походу дрова не свежие для Intel OpenCL
Я использую такие(Win7 x64): https://cloud.mail.ru/public/7... _setup.msi
к стате этот драйвер для интела а я еего на амд поставил
0
дивананалитикаиксперд
13527 / 10142 / 891
Регистрация: 08.01.2013
Сообщений: 35,990
16.08.2014, 19:31 24
Цитата Сообщение от dimank666 Посмотреть сообщение
к стате этот драйвер для интела а я еего на амд поставил
Вот видишь, какие вАлшебные дрАва у интел
Цитата Сообщение от snake32 Посмотреть сообщение
Конечно интересует!
Ща закину клич. Надеюсь, владельцы окажутся более сговорчивыми, чем те, что с блеком.
0
8055 / 5424 / 205
Регистрация: 29.08.2011
Сообщений: 39,370
Записей в блоге: 1
16.08.2014, 19:31 25
Цитата Сообщение от K2K Посмотреть сообщение
Блин, опять амд что-то мухлюет (шучу, шучу)
это интел получается мухлюет раз драйвер ихний так ускоряет процес
0
дивананалитикаиксперд
13527 / 10142 / 891
Регистрация: 08.01.2013
Сообщений: 35,990
16.08.2014, 19:47 26
Цитата Сообщение от dimank666 Посмотреть сообщение
это интел получается мухлюет раз драйвер ихний так ускоряет процес
Ну так они ж не для амд писали Тут вдвойне счастье, что поставился на амд и что ускоряет А ты еще интел винишь во всех бедах
0
дивананалитикаиксперд
13527 / 10142 / 891
Регистрация: 08.01.2013
Сообщений: 35,990
16.08.2014, 20:30 27
Скрина пока(надеюсь) не дали, но, написали, что 7047 ms на R9 290X. Мож кто еще прогонит. Ну и опять же, желающим следить за темой - 290ые.txt
0
дивананалитикаиксперд
13527 / 10142 / 891
Регистрация: 08.01.2013
Сообщений: 35,990
16.08.2014, 20:37 28
Вот 290я, без икс, разгон - 1035/1350 -
Производительность OpenCL

Короче, далее сами следите, кому интересно. Ссылка имеется.
0
3460 / 1648 / 236
Регистрация: 26.02.2009
Сообщений: 8,051
Записей в блоге: 5
16.08.2014, 21:27  [ТС] 29
Блин как-то странно что 290 хуже 7970. Там есть ещё фишка что первый прогон обычно медленнее, так как не мало времени тратиться на компиляцию кернелов(ОпенСЛ кода). После второго прогона уже компиляция не требуется

Добавлено через 9 минут
K2K, что-то там(форуме В данной ветке обсуждаются Только карточки GTX TITAN /GTX 780/GTX 780Ti/GTX TITAN BLACK (GK110. Kepler 28nm)) не нашёл гаваев, Есть только 780 тест 10 секундный

Добавлено через 1 минуту
Хотел проц посмотреть какой

Добавлено через 19 минут
Всё нашёл, Пост твой пропустил

Добавлено через 7 минут
Что за нафиг? Гаваи 7 секунд, а лучший 5,5. Как моя 7970 круче оказалась???
0
K2K
16.08.2014, 22:40
  #30

Не по теме:

Цитата Сообщение от snake32 Посмотреть сообщение
Как моя 7970 круче оказалась???
Где-то подымали похожую тему, типа что-то в 290ых замутили и 7970 майнят и считают не хуже. Что и где не помню и врать не буду. Мож гугл че подскажет.
А вот "вражина" с блеком - редиска :ireful:

0
дивананалитикаиксперд
13527 / 10142 / 891
Регистрация: 08.01.2013
Сообщений: 35,990
16.08.2014, 23:17 31
snake32, а вот и блек

Производительность OpenCL
1
дивананалитикаиксперд
13527 / 10142 / 891
Регистрация: 08.01.2013
Сообщений: 35,990
16.08.2014, 23:51 32
snake32, ты тему о 290Х читаешь? Там народ вопросами заваливает. Всем блин интересно - че за тест и цифры, и че считает .... Ну, я объяснил, как мог Цитируя твои пояснения.
1
3460 / 1648 / 236
Регистрация: 26.02.2009
Сообщений: 8,051
Записей в блоге: 5
16.08.2014, 23:57  [ТС] 33
K2K, Надеюсь владелец титан поставил галочку в драйвере.
А я кстати поймал 3,775 секунд. Правда с галочкой Цикла 1000. На GeForce'ах эта фишка работает крайне нестабильно.
Миниатюры
Производительность OpenCL   Производительность OpenCL  
0
3460 / 1648 / 236
Регистрация: 26.02.2009
Сообщений: 8,051
Записей в блоге: 5
17.08.2014, 00:01  [ТС] 34
Всем участникам теста огромное СПАСИБО!
А K2K отдельная благодарность!
0
K2K
17.08.2014, 00:17
  #35

Не по теме:

Цитата Сообщение от snake32 Посмотреть сообщение
Надеюсь владелец титан поставил галочку в драйвере.
Не знаю. Можешь сам спросить, мне что-то уже поднадоело сарофанить :D
Кстати, те если че надо потестить, то на оверах темки для этого есть и можно свою создать. Желающие обычно находятся. Просто, здесь немного другая аудитория, а там народ бенчи гонять любит. В общем, имей ввиду, мож пригодится инфа.

0
8055 / 5424 / 205
Регистрация: 29.08.2011
Сообщений: 39,370
Записей в блоге: 1
17.08.2014, 00:43 36
а за что отвечает шаг чтения профиля
а то так у меня живенько проходит
Миниатюры
Производительность OpenCL  
0
8055 / 5424 / 205
Регистрация: 29.08.2011
Сообщений: 39,370
Записей в блоге: 1
17.08.2014, 00:57 37
а так я вообще почти 4770 догоняю
Миниатюры
Производительность OpenCL  
1
178 / 153 / 8
Регистрация: 26.12.2012
Сообщений: 676
17.08.2014, 08:58 38
Подтверждаю: повторный прогон показывает лучшие результаты:
Миниатюры
Производительность OpenCL  
0
178 / 153 / 8
Регистрация: 26.12.2012
Сообщений: 676
17.08.2014, 09:03 39
Цитата Сообщение от dimank666 Посмотреть сообщение
а так я вообще почти 4770 догоняю
Ты не в Газпроме™ работаешь? ("Мечты сбываются!"©)
Миниатюры
Производительность OpenCL  
0
3460 / 1648 / 236
Регистрация: 26.02.2009
Сообщений: 8,051
Записей в блоге: 5
17.08.2014, 13:45  [ТС] 40
Цитата Сообщение от dimank666 Посмотреть сообщение
а за что отвечает шаг чтения профиля
Увеличение этой циферки ведёт к уменьшению кол-ва расчётов но и точность расчёта тоже страдает. То есть например вместо 30 точек на 3 км трассе Алгоритм возьмёт всего 2 при значениях больше 3000
0
17.08.2014, 13:45
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
17.08.2014, 13:45
Помогаю со студенческими работами здесь

Где скачать OpenCL C++?
Здравствуйте. Где скачать OpenCL C++? Если тут https://www.khronos.org/opencl/ есть, то скажите...

OpenCL в Builder и не только
Все добрый день! На данный момент встала проблема анализа огромного массива данных, времени...

Глобальная переменная в OpenCL
Всем привет! Кто может подсказать как правильно создать глобальную переменную в OpenCL? ...

OpenCL - ошибка 0xc0000005
Есть прога и использованием OpenCL - модель солнечной системы Проблема одна - чем больше частиц,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
40
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru