|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
Парсинг сайта с javascript25.04.2020, 00:22. Показов 20320. Ответов 20
Метки нет (Все метки)
Я в этом деле новичок, возникла такая потребность.
С сайта https://1xstavka.ru/results/, нужно вытащить таблицы (раздел "баскетбол") в .csv файл, отдельно по каждой дате или задавать промежутком. Я так понимаю, таблица подгружается после нажатия кнопок на сайте (post/get запросы) Помогите или подскажите, как в python сформировать такие же запросы, чтобы получить html с развернутыми таблицами для парсинга. Никак не могу разобраться. Спасибо.
0
|
||||||
| 25.04.2020, 00:22 | |
|
Ответы с готовыми решениями:
20
Парсинг страницы со скриптами javascript Парсинг JavaScript кода (только инициализатор объектов) Парсинг сайта с JavaScript |
|
Автоматизируй это!
|
|
| 25.04.2020, 10:08 | |
|
badattitude, во-первых займись поиском тут, помнб помогали тут человеку с подобным, вроде даже тот же сайт, по крайней мере помню что игры какие-то. Нужно использовать не суп, а селениум если там скриптом все подгружается. Если все-же запросом, то повторяем эти запросы и парсим данные.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:08 [ТС] | |
|
Silenium очень долго, там нужен большой интервал по датам.
Вот именно, в формировании запросов проблема. Как их на requests сформировать или где про это подробно прочитать. Все облазил, везде только поверхностно написано, а именно откуда и как брать параметры запроса. В инструментах разработчика, нашёл нужные get - запросы. Чтобы сайт выдал нужные таблицы, надо по 3 кнопкам пройтись, получается 3 get запроса?
0
|
|
|
Автоматизируй это!
|
|||
| 25.04.2020, 13:10 | |||
|
2 поиском в гугле можно посмотреть как с вкладкой Нетворкс работать в инструментах разработчика Хром
0
|
|||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 13:19 [ТС] | |
|
Чтобы добраться до таблицы, сначала нажимаю кнопку "Баскетбол" (отправляется get запрос), выбор нужной даты (get запрос) и кнопка "развернуть" (get запрос). Только после этого в дереве html можно добраться до таблицы с результатами.
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 25.04.2020, 22:38 [ТС] | |
|
Подскажите, как сформировать запросы или каким образом можно получить html код(кроме selenium'а), чтобы распарсить страницу. Никак не могу разобраться.
0
|
|
|
|
||
| 26.04.2020, 17:31 | ||
|
Сайт прекрасно отдает json по всем видам спорта.
Добавлено через 43 секунды
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 27.04.2020, 01:18 [ТС] | |
|
У меня в этом и складывается вся проблема, сайт в контенте html/text, а прочитать функцией r.json() ответ, никак не могу.
Для меня это все в новинку, вот и задаю по видимому глупые вопросы. Объясните пожалуйста, в чтобы получить нужную страницу для Парсинга, мне какой запрос надо передать и как его сформировать(с заголовками и параметрами?).
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||
| 27.04.2020, 23:08 [ТС] | |||||||
C:\Users\дом>"C:/Program Files/Python38/python.exe" c:/Users/дом/1xstavka.py Traceback (most recent call last): File "c:/Users/дом/1xstavka.py", line 13, in <module> print(response.json()) File "C:\Program Files\Python38\lib\site-packages\requests\models.py", line 898, in json return complexjson.loads(self.text, **kwargs) File "C:\Program Files\Python38\lib\json\__init__.py", line 357, in loads return _default_decoder.decode(s) File "C:\Program Files\Python38\lib\json\decoder.py", line 337, in decode obj, end = self.raw_decode(s, idx=_w(s, 0).end()) File "C:\Program Files\Python38\lib\json\decoder.py", line 355, in raw_decode raise JSONDecodeError("Expecting value", s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) подскажите, в чем проблема или что делаю не так
0
|
|||||||
|
5906 / 3358 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 27.04.2020, 23:19 | |
|
может сервер отвечает не json-ом?
0
|
|
|
|
||
| 27.04.2020, 23:25 | ||
|
Логично предположить, что такой сайт просто не может работать иначе, оперируя в realtime таким объемом данных. Но по какому именно запросу - пускай ТС выясняет сам. На форуме это уже приводилось.
0
|
||
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||
| 28.04.2020, 00:42 [ТС] | ||
|
0
|
||
|
5906 / 3358 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
|
|
| 28.04.2020, 00:57 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|||||||||||||
| 28.04.2020, 16:05 [ТС] | |||||||||||||
|
Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же Добавлено через 30 минут Garry Galler,
И заголовки все тоже пробовал передавать, исход тот же
0
|
|||||||||||||
|
|
|
| 28.04.2020, 16:08 | |
|
Поиск по форуму в разделе Python: 1xstavka.ru
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
|
| 28.04.2020, 16:24 [ТС] | |
|
Надеюсь последний вопрос.
Каким образом формировать такие запросы и передавать им параметры? Большое спасибо за уже оказанную помощь.
0
|
|
|
|
|
| 28.04.2020, 17:25 | |
|
Вы что так и не нашли готовый пример?
Проблема с массивами JSON в python)
0
|
|
|
0 / 0 / 0
Регистрация: 10.04.2018
Сообщений: 13
|
||||||
| 28.04.2020, 17:46 [ТС] | ||||||
|
Нашел, спасибо большое.
Но, все равно не могу разобраться с параметрами, как их задать, чтобы выдавал json с нужной датой
0
|
||||||
|
|
||
| 28.04.2020, 17:53 | ||
|
Разобраться в этих параметрах нельзя никаким иным способом, кроме самостоятельного тестирования каждого параметра. Потому что никакой открытой документации по ним не существует.
0
|
||
| 28.04.2020, 17:53 | |
|
Помогаю со студенческими работами здесь
20
Парсинг сайта с JavaScript
Парсинг данных с сайта с javascript Парсинг выполняемого JavaScript, JSON с сайта в программу С++
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|