Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
489 / 382 / 74
Регистрация: 29.05.2018
Сообщений: 1,171
1

Парсинг страниц ru.wikipedia.org

21.07.2023, 19:37. Показов 472. Ответов 2
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Добрый день.

Пытаюсь взаимодействовать с API русской википедии так:
Python
1
2
3
4
5
6
7
8
9
10
import http.client
 
 
connection = http.client.HTTPSConnection('ru.wikipedia.org')
connection.request('GET', '/w/api.php?action=parse&page=5_%D0%B8%D1%8E%D0%BB%D1%8F&prop=text&format=json')
resp = connection.getresponse()
print(resp.status, resp.reason)
file_object = open("responce.json", "w")
file_object.write(resp.read().decode())
file_object.close()
В ответе responce.json все русскоязычные строки зашифрованы такой вот абракадаброй:
JSON
1
\u041a\u0430\u0431\u043e-\u0412\u0435\u0440\u0434\u0435
Как её привести в человеческий текст?
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
21.07.2023, 19:37
Ответы с готовыми решениями:

Парсинг всех страниц
На дамом сайте около 30 страниц 'https://stopgame.ru/review/izumitelno' как спарсить все...

Парсинг страниц с python3
Все в целях обучения. Есть страница, не могу понять как получить содержимое класса. browser...

Парсинг таблицы с нескольких страниц
Доброго времени суток. Есть задача: с внутреннего сайта организации выгрузить таблицу. Сайт...

Парсинг документов со всех страниц сайта
В общем, суть такова. Мне нужно скачать из сайта https://fasie.ru/ документы. Они могут быть в...

Парсинг страницы сайта ru.wikipedia.org/wiki/Россия
Парсинг страницы сайта ru.wikipedia.org/wiki/Россия Осуществите парсинг страницы сайта в блоке...

2
146 / 109 / 37
Регистрация: 28.11.2013
Сообщений: 371
22.07.2023, 11:23 2
Лучший ответ Сообщение было отмечено Ender Che как решение

Решение

Попробуйте так
Python
1
2
3
4
5
data = resp.read().decode('utf-8')
json_obj = json.loads(data)
print(json_obj)
with open("test.json", 'w', encoding='utf-8') as file:
    json.dump(json_obj, file, indent=4, ensure_ascii=False)
1
489 / 382 / 74
Регистрация: 29.05.2018
Сообщений: 1,171
22.07.2023, 12:00  [ТС] 3
Skryp, то, что нужно! Спасибо за помощь!
0
22.07.2023, 12:00
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
22.07.2023, 12:00
Помогаю со студенческими работами здесь

Парсинг wikipedia
Добрый день! Не могу приумать, как пропарсить страницы wikipedia с помощью питона. Библиотеку...

Парсинг страниц(ы)
Добрый день, товарищи! Решил попробовать автоматизировать выкачивание данных с сайта АТС...

парсинг страниц
как вырвать с этого сайта...

Парсинг соседних страниц сайта и перебор их
import requests from bs4 import BeautifulSoup import csv def get_html(url): r =...

Парсинг BeautiulSoup. Проблема с с парсингом ссылок страниц
Суть в следующем. Пытался спарсить ссылки страниц результатов матча. Теги (a) читаются, а когда...

Docx + python парсинг xml, не обновляются данные страниц, слов и символов
Добрый вечер, не могу решить следующую ситуацию. Создаю файл *.docx добавляю в него параграф в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru