Форум программистов, компьютерный форум, киберфорум
GPGPU
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.95/21: Рейтинг темы: голосов - 21, средняя оценка - 4.95
0 / 0 / 0
Регистрация: 06.02.2019
Сообщений: 7

CUDA. Запуск на GPU

08.04.2020, 13:57. Показов 4303. Ответов 1
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Только начал изучать CUDA, написал программу, но не уверен в ее правильности
Прошу оценить и указать на ошибки
Нужно расспараллелить выполнение формулы(во вложении) при помощи GPU
У меня получилась следующая программа:

C++ Скопировано
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <math.h>
 
#define p 10
 
__global__ void calc_gpu(long double x, long double *result, const int N, double z) {   //Функция на GPU
 
    for (int i = blockIdx.x; i <= p; i++) {
        x = i * (N / p);
        *result = (1 + sinf(sqrtf(x + 1))) / (cosf(12 * z - 4));
        printf("Privet iz %d\n", i);                                                   //Исполняется гораздо больше раз, чем необходимо
    }
}
 
int main()
{
    const int N = 10;
    double z = pow(N, 2);
    long double x = 0, result = 0;
 
    long double *dev;
    cudaMalloc((double**)&dev, sizeof(long double));  //выделение памяти
 
    calc_gpu << <p, 1 >> > (x, dev, N, z);   //вызов функции
 
    cudaMemcpy(&result, dev, sizeof(long double), cudaMemcpyDeviceToHost);  //прием данных с GPU
 
 
    printf("Result = %.5f\n", result);
    getchar();
    cudaFree(dev);
    return 0;
}
Изображения
 
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
08.04.2020, 13:57
Ответы с готовыми решениями:

Cuda ошибка при копировании с GPU на CPU
Здравствуйте, столкнулся с такой проблемой. Почему, когда устанавливаю N =10000000 (количество генерируемых ПСЧ) . Появляется ошибка...

Быстрее ли GPU и CUDA для задач длинной арифметики и криптографии?
Быстрее ли было бы использовать - GPU и CUDA для задач длинной арифметики и криптографии? Есть класс IntegerBig, в котором длинное...

При экспорте видео в Adobe Premiere с использованием GPU (CUDA) не используется видеокарта
Ребят, всем привет! Я уже где только не пробовал вопрос задать - безрезультатно.. Попробую местным экспертам и практикам)) В...

1
0 / 0 / 0
Регистрация: 06.02.2019
Сообщений: 7
08.04.2020, 14:08  [ТС]
Немного исправил код, теперь выдает столько printf сколько и должно
Проверьте на правильность
C++ Скопировано
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <math.h>
 
#define p 10
 
double calc(long double x, long double &result, const int N, double z) {
 
    for (int i = 1; i <= p; i++) {
        x = i * (N / p);
        result = (1 + sin(sqrt(x + 1))) / (cos(12 * z - 4));
        return result;
    }
}
 
__global__ void calc_gpu(long double x, long double *result, const int N, double z) {
 
    int i = blockIdx.x;
    if (i <= p) {
        x = i * (N / p);
        *result = (1 + sinf(sqrtf(x + 1))) / (cosf(12 * z - 4));
        printf("Privet iz %d\n", i);
    }
}
 
int main()
{
    const int N = 10;
    double z = pow(N, 2);
    long double x = 0, result = 0;
 
    long double *dev;
    cudaMalloc((double**)&dev, sizeof(long double));
 
    calc_gpu << <p, 1 >> > (x, dev, N, z);
 
    cudaMemcpy(&result, dev, sizeof(long double), cudaMemcpyDeviceToHost);
 
 
    //calc(p, x, result, N, z);
    printf("Result = %.5f\n", result);
    getchar();
    cudaFree(dev);
    return 0;
}
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
08.04.2020, 14:08
Помогаю со студенческими работами здесь

#Вычисления на GPU (GPGPU - вычислений на видеокартах): CUDA, OpenCL, AMD APP и DirectCompute
GPGPU («GPU общего назначения») — техника использования графического процессора видеокарты для общих вычислений, которые обычно проводит...

Adobe Premiere вылетает при рендере с включенным аппаратным ускорением GPU Mercury Playback (CUDA)
Здравствуйте! Столкнулся с такой проблемой, при рендере в Adobe Premiere с включенным аппаратным ускорением GPU Mercury Playback (CUDA)...

CUDA компиляция и запуск
Всем привет! Ребят я начал изучать технологию cuda (параллельные вычисления). Картина заключается в том, что мне нужно настроить данную...

CUDA запуск на ноутбуке
дубль https://www.cyberforum.ru/cpp-beginners/thread1452446.html Всем здравствуйте! Вопрос простой, как 5 копеек: Как...

Не запускается приложение под Cuda (CUDA directory not found)
Здравствуйте, пытаюсь скомпилировать приложение под Cuda но вылазит ошибка, что CUDA directory not found. В чем может быть проблема? Cuda...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
BASH scripting - the best cases [PurpleSchool]
jigi33 08.04.2025
Занятия BASH в PurpleSchool - отличные примеры для внедрения в практику (see screenshots and file names)
Результаты исследования от команды MCM (март 2025 г.)
Programma_Boinc 07.04.2025
Результаты исследования от команды MCM (март 2025 г. ) В рамках наших текущих исследований мы продолжаем изучать гены, которые имеют наибольшую вероятность развития рака легких, выявленные в рамках. . .
Рекурсивные типы в Python
py-thonny 07.04.2025
Рекурсивные типы - это типы данных, которые определяются через самих себя или в сочетании с другими типами, которые в свою очередь ссылаются на исходный тип. В мире программирования такие структуры. . .
C++26: Объединение и конкатенация последовательностей и диапазонов в std::ranges
NullReferenced 07.04.2025
Работа с последовательностями данных – одна из фундаментальных задач, с которой сталкивается каждый разработчик. C++ прошел длинный путь в эволюции средств для манипуляции коллекциями – от. . .
Обмен данными в микросервисной архитектуре
ArchitectMsa 06.04.2025
Когда разработчики начинают погружаться в мир микросервисов, они часто сталкиваются с парадоксальным правилом: "два сервиса не должны делить один источник данных". Эта мантра звучит повсюду в. . .
PostgreSQL в Kubernetes: Автоматизация обслуживания с CNPG
Mr. Docker 06.04.2025
Администраторы баз данных сталкиваются с целым рядом проблем при обслуживании PostgreSQL в Kubernetes: как обеспечить правильную репликацию данных, как настроить автоматическое переключение при. . .
Async/await в TypeScript
run.dev 06.04.2025
Асинхронное программирование — это подход к разработке программного обеспечения, при котором операции выполняются независимо друг от друга. В отличие от синхронного выполнения, где каждая последующая. . .
Многопоточность в C#: Синхронизация потоков
UnmanagedCoder 06.04.2025
Многопоточное программирование стало неотъемлемой частью разработки современных приложений на C#. С появлением многоядерных процессоров возможность выполнять несколько задач параллельно значительно. . .
TypeScript: Классы и конструкторы
run.dev 06.04.2025
TypeScript, как статически типизированный язык, построенный на основе JavaScript, привнес в веб-разработку новый уровень надежности и структурированности кода. Одним из важнейших элементов этой. . .
Многопоточное программирование: Rust против C++
golander 06.04.2025
C++ существует уже несколько десятилетий и его поддержка параллелизма постепенно наращивалась со временем. Начиная с C++11, язык получил стандартную библиотеку для работы с потоками, а в последующих. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru
Выделить код Копировать код Сохранить код Нормальный размер Увеличенный размер