107 / 13 / 7
Регистрация: 06.07.2013
Сообщений: 268
|
||||||
1 | ||||||
HtmlAgilityPack как парсить сайт с протоколом https если без "правильных" cookie сервер отдает не всю страницу25.12.2014, 14:53. Показов 2556. Ответов 1
Метки нет (Все метки)
Хотел вытаскивать определенную информацию с одного из сайтов mail при помощи HtmlAgilityPack но возникло несколько проблем. При запросе к главной странице сайта возвращается далеко не все, по сути только информация которая дается не авторизованному пользователю, а скрипт авторизации с полями логина и пароля вообще не приходит. Если заранее авторизоваться и заходить на ту страницу которая мне необходима то там приходит вообще не он а ответ с символами в неправильной кодировке и двумя словами JavaScript и cookie. Решил эти 2 проблемы подключив библиотеку WatiN и беру html уже из объекта brauser этой библиотеки тогда все работает. Но хотелось бы получать страницы без открытия IE. На stackoverflow.com советовали включить cookie в HtmlAgilityPack таким способом:
Заранее спасибо.
0
|
25.12.2014, 14:53 | |
Ответы с готовыми решениями:
1
Nginx отдает не всю страницу Удалить страницу из индекса с протоколом https HtmlAgilityPack не отдает текст, если он уже встречался в строке Не могу зайти с macOS на сайт с протоколом соединения https:// |
Master of Orion
|
||||||
26.12.2014, 02:54 | 2 | |||||
ATop, афайк нужно сначала залогиниться, получив куки от сервера, то есть
0
|
26.12.2014, 02:54 | |
26.12.2014, 02:54 | |
Помогаю со студенческими работами здесь
2
Как парсить сайт без бана? Страница https:// .не печатает всю страницу, а только её часть? Как с htmlagilitypack парсить комментарии к коду? 404 при том что сервер корректно отдает страницу (nginx+apache) HtmlAgilityPack в WP7: как правильно парсить страницы Как проксировать чужой сайт (https) через свой сервер (домен)? Как с парсить ? https://www.partslink24.com Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |