Форум программистов, компьютерный форум, киберфорум
Python: Научные вычисления
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.65/55: Рейтинг темы: голосов - 55, средняя оценка - 4.65
Эксперт Python
5434 / 3857 / 1215
Регистрация: 28.10.2013
Сообщений: 9,553
Записей в блоге: 1
1

Конвертация изображения средствами numpy

07.03.2018, 22:08. Показов 10063. Ответов 7

Author24 — интернет-сервис помощи студентам
Нашел вот такое задание на форуме
без питоновских циклов сконвертируйте цветное изображение в черно-белое по формуле:

C = 0.2989 * R + 0.5870 * G + 0.1140 * B
На самое деле по этой формуле получается grayscale - оттенки серого, но суть не в этом.
Как это сделать на pure python - понятно. К тому же легко гуглятся примеры на хабре.
Однако, попытка написать такое же преобразование чисто на numpy (плюс PIL для открытия изображения) дала код, который работает не то чтобы медленно... ужасно медленно. В 10 раз медленнее, чем с python циклами.
Стало интересно, а можно ли вообще написать нормально работающую реализацию, следуя этому заданию?
Для сравнения также использован пример чисто на встроенных функциях PIL (grayscale_pillow), который работает так и должно все работать.
Вот замеры работы всех функций:

Код
grayscale           :8.58449101448059
grayscale pillow    :0.08200454711914062
grayscale_numpy     :75.70432996749878
black_white         :7.205412149429321
Из всех функций в numpy более-менее подходящей показалась apply_along_axis.
Но именно она - при использование моей функции apply_gray для каждого пикселя - работает крайне неэффективно.
Если кто-то захочет разобраться почему так и как написать правильно, смотрите код.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
import time
import random
import os
from PIL import Image, ImageDraw
import numpy as np
import matplotlib.image as mplimg
 
#-----------------------------------------------
#def load_image_mpl(filename):
#    return mplimg.imread(filename)
 
 
def load_image(filename):
    image = Image.open(filename)
    draw = ImageDraw.Draw(image) # кисть для рисования; не нужна, если использовать putpixel
    pixels = image.load() # загрузка пикселей; <class 'PixelAccess'>
    return image, draw, pixels
 
def save_image(image,filename,postfix='gray'):
    name,ext = os.path.splitext(filename)
    image.save("{}_{}{}".format(name,postfix,ext), "JPEG")
 
# оттенки серого
def grayscale(filename):
    image, draw, pixels = load_image(filename)
    width = image.size[0]  # ширина 
    height = image.size[1] # высота
    
    for i in range(width):
        for j in range(height):
            R,G,B = pixels[i, j] #R,G,B = image.getpixel((i, j)) # через getpixel почему-то медленнее
            #S = (R + G + B) // 3 # другая (более грубая) формула  grayscale
            S = round(0.2989 * R + 0.587 * G + 0.114 * B)
            #draw.point((i, j), (S, S, S))
            image.putpixel((i, j), (S, S, S)) # так быстрее чем через draw
    
    del draw            
    return image  
 
# черно-белое
def black_white(filename,factor=1):
    image, draw, pixels = load_image(filename)
    width = image.size[0]  # ширина 
    height = image.size[1] # высота
    
    for i in range(width):
        for j in range(height):
            R,G,B = pixels[i, j]
            S = R + G + B
            if (S > (((255 + factor) // 2) * 3)):
                R, G, B = 255, 255, 255
            else:
                R, G, B = 0, 0, 0
            
            #draw.point((i, j), (R, G, B))
            image.putpixel((i, j), (R, G, B)) 
    
    del draw        
    return image
 
#-----------------------------------------
def apply_gray(rgb):
    coeff = np.array([0.2989, 0.587 , 0.114 ])
    #S = np.round(0.2989 * rgb[0] + 0.587 * rgb[1] + 0.114 * rgb[2])
    #rgb = np.array([S,S,S],dtype="uint8")
    S = np.round(np.sum(rgb * coeff))
    rgb = np.array([S,S,S],dtype="uint8")
    return rgb
 
 
def grayscale_numpy(filename):
    image,_,_ = load_image(filename)
    data = np.asarray(image, dtype="uint8")
    data = np.apply_along_axis(apply_gray, 2, data)
    return data
 
 
def grayscale_pillow(filename):
    image, draw, pixels = load_image(filename)
    return image.convert('L')
 
if __name__ == "__main__":
    filename="tiger.jpg"
    
    start = time.time()
    image = grayscale(filename)
    save_image(image,filename,postfix='gray') 
    print('{:20}:{}'.format('grayscale',time.time() - start))
    
    start = time.time()
    image = grayscale_pillow(filename)
    save_image(image,filename,postfix='gray2') 
    print('{:20}:{}'.format('grayscale pillow',time.time() - start))
    
    
    start = time.time()
    data = grayscale_numpy(filename)
    image = Image.fromarray(data, "RGB")
    save_image(image,filename,postfix='gray3')
    print('{:20}:{}'.format('grayscale_numpy',time.time() - start))
    
    start = time.time()
    image = black_white(filename)
    save_image(image,filename,postfix='black_white')
    print('{:20}:{}'.format('black_white',time.time() - start))
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
07.03.2018, 22:08
Ответы с готовыми решениями:

Работа с матрицами средствами NumPy
Помогите пожалуйста с написанием... 1) Импортируйте numpy. 2) Создайте матрицу (2D-массив)...

Построчный обход двумерного массива без цикла средствами Numpy
Здравствуйте. Дан двумерный массив. В каждой строке необходимо найти минимальное значение и...

Представление изображения в виде массива NumPy
Здравствуйте стоит следующая задача, необходимо представить изображение в виде двумерного массива,...

Конвертация цветного изображения в черно-белое
Используя numpy, без питоновских циклов сконвертируйте цветное изображение в черно-белое по...

Как сохранить numpy массив в виде изображения, что бы при повторном переводе в массив не было различий
Я решил попробовать записывать информацию в изображение, путем изменения последней цифры каждого...

7
277 / 226 / 93
Регистрация: 27.06.2016
Сообщений: 639
07.03.2018, 23:06 2
Лучший ответ Сообщение было отмечено Garry Galler как решение

Решение

Garry Galler, у numpy вообще говоря каноничное использование - это всячески операции векторизовать.
Вот что я смог выжать постаравшись не напрягаться:
Python
1
2
3
4
5
6
7
8
9
def grayscale_numpy(filename):
    image, _, _ = load_image(filename)
    data = np.asarray(image, dtype="uint8")
 
    coeff = np.array([[[0.2989, 0.587, 0.114]]])
    sums = np.round(np.sum(coeff * data, axis = 2)).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
 
    return data

grayscale :0.2801399230957031
grayscale pillow :0.006412506103515625
grayscale_numpy :0.01502847671508789
black_white :0.22236919403076172
1
1292 / 909 / 479
Регистрация: 05.12.2013
Сообщений: 3,074
07.03.2018, 23:22 3
Почему-то результат grey2, явно отличается от результатов gray и gray3
0
Эксперт Python
5434 / 3857 / 1215
Регистрация: 28.10.2013
Сообщений: 9,553
Записей в блоге: 1
08.03.2018, 00:01  [ТС] 4
Цитата Сообщение от alex white Посмотреть сообщение
numpy вообще говоря каноничное использование - это всячески операции векторизовать.
Да, точно. Неверный подход был с apply_along_axis. Бесполезно было надеяться, что попиксельно будет работать быстро, даже в numpy, но я думал, что apply_along_axis умеет делать магию.
В общем все классно :-). Работает на моем проце, конечно, медленнее, чем в вашем бенчмарке, но хотя бы раз в 8 быстрее, чем в pure python.
-----------------------------------
Цитата Сообщение от ТабуретY Посмотреть сообщение
Почему-то результат grey2, явно отличается от результатов gray и gray3
Это о каких результатах?

Добавлено через 12 минут
То что через через Image.convert быстрее? Так в PIL своя реализация grayscale - уже на чисто на С наверно.
1
1292 / 909 / 479
Регистрация: 05.12.2013
Сообщений: 3,074
08.03.2018, 00:02 5
Цитата Сообщение от Garry Galler Посмотреть сообщение
Это о каких результатах?
Взял картинку в формате jpg, назвал tiger, запустил скрипт, получились еще 4 картинки
tiger_black_white.jpg
tiger_gray.jpg
tiger_gray2.jpg
tiger_gray3.jpg
Почему-то tiger_gray2 отличается от tiger_gray и tiger_gray3, но я уже нашел почему, цветность tiger_gray2 стала 8 бит, а у остальных осталась 24
0
Эксперт Python
5434 / 3857 / 1215
Регистрация: 28.10.2013
Сообщений: 9,553
Записей в блоге: 1
08.03.2018, 14:40  [ТС] 6
Цитата Сообщение от ТабуретY Посмотреть сообщение
tiger_gray2 стала 8 бит
Да, в доках PIL так и написано, что режим "L" возвращает 8-bit pixels.
------------------------------------------------------------------------------------------
Дополню варианты преобразования в grayscale:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# Вариант alex white
def rgb2gray0(data):
    coeff = np.array([[[0.2989, 0.587, 0.114]]])
    sums = np.round(np.sum(coeff * data, axis = 2)).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
 
def rgb2gray1(data):
    r, g, b = data[:,:,0], data[:,:,1], data[:,:,2]
    sums = np.round(0.2989 * r + 0.587 * g + 0.114 * b).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
 
def rgb2gray2(data):
    #sums = np.dot(data,np.array([0.2989, 0.587, 0.114]))
    sums = data @ np.array([0.2989, 0.587, 0.114]) # через  __matmul__ быстрее чем dot
    sums = np.round(sums).astype(np.uint8)
    data = np.repeat(sums, 3).reshape(data.shape)
    return data
Последние два чуть-чуть быстрее:
Код
grayscale_numpy     (rgb2gray0):0.8510487079620361
grayscale_numpy     (rgb2gray1):0.8060460090637207
grayscale_numpy     (rgb2gray2):0.7650439739227295
1
Просто Лис
Эксперт Python
5965 / 3728 / 1097
Регистрация: 17.05.2012
Сообщений: 10,787
Записей в блоге: 9
10.03.2018, 14:21 7
Garry Galler, проверь на скорость этот вариант:

Python
1
2
3
4
def rgb2gray3(data):
    x, y, _ = data.shape
    k = np.array([[[0.2989, 0.587, 0.114]]])
    return np.round(np.sum(data*k, axis=2)).astype(np.uint8).reshape((x, y))
0
Эксперт Python
5434 / 3857 / 1215
Регистрация: 28.10.2013
Сообщений: 9,553
Записей в блоге: 1
10.03.2018, 15:01  [ТС] 8
Цитата Сообщение от Рыжий Лис Посмотреть сообщение
проверь на скорость этот вариант
Проверил.

Код
grayscale_numpy     (rgb2gray0):0.8300013542175293
grayscale_numpy     (rgb2gray1):0.7500016689300537
grayscale_numpy     (rgb2gray2):0.7400014400482178
grayscale_numpy     (rgb2gray3):0.7600016593933105
Результаты чуть разнятся при перезапусках, но видно, что варианты 1, 2, 3 мало отличаются.
Единственная серьезная разница - rgb2gray3 дает 8-битное изображение, раз мы не делаем np.repeat(sums, 3).
0
10.03.2018, 15:01
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
10.03.2018, 15:01
Помогаю со студенческими работами здесь

Пример кодирования изображения BMP в JPG средствами Python
Добрый день коллеги Возникла проблема, сыну, второкурснику задали задание, которое звучит...

Конвертация csv в xml средствами php
Доброго времени. Подскажите как корректно сконвертировать файл CSV в формат XML. Есть файл на...

Конвертация doc/docx документов в HTML средствами PHPWord
Или другими способами; Есть годный мануал?

Построение 3d графика цветового пространства изображения в Qt Creator. OpenCV, PyPlot и NumPy
Здравствуйте! Пытаюсь проанализировать изображение для того, чтобы понять, как лучше...

Конвертация изображения
дрУги! Мне в веб аппликации надо переводить загружаемые .png в .jpg Кто нибудь сталкивалься с...

Конвертация разрешения изображения
День добрый. Имею изображение с исходным разрешением 2475х3500. Очень нужно получить в 1920х1080,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru