|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
|
Парсинг фото товаров с алиэкспресс в крупном разрешении11.08.2017, 12:50. Показов 6976. Ответов 15
Метки python 3.x (Все метки)
Хотел написать парсер фото товаров с алиэкспресс вместе с ссылками на сами товары, но когда, но не нашел ссылки на jpg, на превьюшки есть, а на сами фото не могу найти. Как их достать?
0
|
|
| 11.08.2017, 12:50 | |
|
Ответы с готовыми решениями:
15
Нужны фото материнской платы Asus a53s в крупном плане Парсинг товаров и изображений Некорректно отображаются фото товаров в категории |
|
5906 / 3358 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
||||||
| 11.08.2017, 14:10 | ||||||
|
так вот же
0
|
||||||
|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
|
| 11.08.2017, 14:55 [ТС] | |
|
Здравствуйте, эти фото маленькие превьюшные, мне надо большие, видел их где-то в get запросах, но как туда пролезть не знаю и еще я не знаю javaScript
0
|
|
|
|
|
| 11.08.2017, 15:53 | |
|
0
|
|
|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
|
| 11.08.2017, 16:55 [ТС] | |
|
Нет. А как питоном это достать? Например, набираю категорию и для товаров этой категории собираю фото
0
|
|
|
|
|||||||
| 11.08.2017, 17:29 | |||||||
0
|
|||||||
|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
|
| 11.08.2017, 17:53 [ТС] | |
|
0
|
|
|
|
||
| 11.08.2017, 18:03 | ||
|
Более мне ничего неизвестно из вашей задачи, даже url который вы хотите парсить.
0
|
||
|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
|
| 11.08.2017, 21:03 [ТС] | |
|
Да вы правы: ссылку я не дал простите. Мне нужно чтобы пользователь ввел в поиск на сайте "алиэкспресс" определенный вид товара, потом скопировал ссылку на результат поиска в инпут скрипта, а скрипт вытянул ссылки на заказ каждого товара и его изображение и так по странично, чтобы потом скопировать найденые ссылки в текстовый файл и поместить изображения в папку с этим файлом.
--- Спасибо вам теперь я знаю, что ссылки на фото начинаются с: "https://ae01.alicdn.com/kf..." Добавлено через 45 минут Подскажите какой из написаных парсеров быстрее? Сейчас хочу использовать метод xpath, но не знаю как создать запрос на поиск определенных ссылок, в моем случае: "https://ae01.alicdn.com/kf...." как мне сделать это? Добавлено через 1 час 39 минут https://msdn.microsoft.com/ru-... .120).aspx Руководствуясь этим материалом делал так: ('.//a/@href["https://ae01.alicdn.com/kf"]') Но все равно выдает ссылки не по фильтру, а все что есть.
0
|
|
|
|
||||||||
| 12.08.2017, 01:24 | ||||||||
Сообщение было отмечено DarkChirik как решение
Решениеbs4 и grab это, собственно, не парсеры, а обертки над парсерами lxml\htmllib5\html.parser + дополнительный функционал для граббинга. ---------------------- Простой пример для парсинга ссылок на утюги :-)
Однако вторых почему-то меньше чем первых. С этим разбирайтесь сами. P.P. S. Ссылки на большие фото я видел только на странице заказа. Следовательно, если они нужны - нужно парсить и эту страницу. Добавлено через 4 минуты Бесплатное API у этого сайта интересно есть? А то html у них не самый приятный для парсинга. Добавлено через 29 минут
0
|
||||||||
|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
|
| 12.08.2017, 12:20 [ТС] | |
|
Спасибо. Не подскажите пожалуйста как сделать фильтр по поиску, например, чтобы парсились только ссылки на фото (.jpg)?
0
|
|
|
|
||||||
| 12.08.2017, 13:13 | ||||||
|
Приведите пример конкретной ссылки на страницу с которой нужно взять эти ссылки и укажите какие именно ссылки нужны.
Если приводить обобщенный пример то, например, так:
Ссылки на фото в атрибутах href вы не найдете. Для них используется тэг <img> и атрибут src или image-src (на этом сайте).
0
|
||||||
|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
|
| 12.08.2017, 13:20 [ТС] | |
|
Спасибо. Ссылки я нашел, а это спросил уже, потому что, интересно
0
|
|
|
|
|||||||
| 12.08.2017, 13:46 | |||||||
|
-------------------------------------- Еще пару вариантов с использованием встроенных функций XPath:
0
|
|||||||
|
2 / 2 / 0
Регистрация: 23.06.2017
Сообщений: 72
|
||
| 12.08.2017, 13:53 [ТС] | ||
|
Добавлено через 1 минуту picture = fromstring(get_html(link)).xpath('.//meta[@property="og:image"]') for link in picture: download_img(link.attrib.get('content'))
0
|
||
|
|
|||||||||||
| 12.08.2017, 14:20 | |||||||||||
|
А, так это на странице заказа. Понятно.
Можно также и без цикла сразу извлекать текст атрибута:
Но вот так будет просто пустая строка, если текста не окажется:
0
|
|||||||||||
| 12.08.2017, 14:20 | |
|
Помогаю со студенческими работами здесь
16
Парсинг Вк API. Фото Парсинг Товаров с интернет магазина Парсинг описания товаров с Aliexpress Как удалить все фото товаров с магазина?
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|