Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
1 / 1 / 1
Регистрация: 11.06.2015
Сообщений: 37
1

Парсинг сайта

29.10.2017, 18:26. Показов 930. Ответов 0
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Добрый день! Необходимо из html документа вытащить данные.
Вот кусочек документа
HTML5
1
2
3
4
5
             <div class="row_a clearfix">
                    <div class="source"><a href="/publications/komsomolskajapravda/">Комсомольская правда</a><i>16 декабря 2016 года</i></div>
                    <div class="author">
                        <p><span class="wisdom_grade" style="" title="">&nbsp;</span><a href="/movies/rogueoneastarwarsstory/">Изгой-один: Звёздные войны. Истории</a></p><p class="quote">Простой, но эффектный космобоевик, грамотно примазывающийся к великой франшизе. Как говорится, до первой Звезды можно.</p><p class="review_links"><a href="/reviews/125180/">Начать обсуждение</a><span class="comments_count"></span> <a href="http://www.kp.ru/daily/26621.7/3638227/" target="_blank" rel="nofollow">Прочесть рецензию</a><span class="newwindow">&nbsp;</span></p>
                    </div><div class="rating site_rating_good"><h4>80</h4><span class="help" title="Поскольку издание не выставило явную оценку, она была определена редакцией «Критиканства» исходя из тона рецензии">Хорошо</span></div></div>
Мне нужно получить: "Изгой-один: Звёздные войны. Истории" и "80". Пыталась уже разными способами это сделать, но ничего в итоге не вышло.
Вот последний код
C#
1
2
3
4
5
6
7
            string htmlCode = GetHtml(id.ToString());
            HtmlDocument doc = new HtmlDocument();
            doc.LoadHtml(htmlCode);
            var reviews_header = doc.GetElementbyId("reviews_header");
            Console.WriteLine(reviews_header);
            string name = Trim(reviews_header.SelectSingleNode("a").InnerText);
            string rate = Trim(reviews_header.SelectSingleNode("h4").InnerText);
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
29.10.2017, 18:26
Ответы с готовыми решениями:

Парсинг сайта
Хочу пропарсить сайт, на котором через некоторое время появляются элементы в виде div-ов. Эти дивы...

Парсинг Сайта
Товарищи эксперты, помогите решить проблему с парсингом. Есть сайт tv.mail.ru, при разборе кода...

Парсинг сайта
Добрый день! Не могли бы помочь сделать Парсинг с сайта...

Парсинг сайта
Добрый день, господа. Ситуация такая, что не удается получить html-код со страницы. Использую...

0
29.10.2017, 18:26
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
29.10.2017, 18:26
Помогаю со студенческими работами здесь

Парсинг с сайта
Здравствуйте. Не могу никак понять, как парсить &quot;неопределённую&quot; информацию с сайта. Вот допустим...

Парсинг сайта
Прикладываю файл проекта(украден где-то на форуме)(). ВОт ссылка на страницу - годовой отчет банка....

Парсинг сайта
Подскажите пожалуйста чем лучше всего парсить сайты? что-бы было просто и легко. Html Agility Pack...

Парсинг сайта
Здравствуйте. Подскажите пожалуйста. Есть необходимость получать данные со страниц сайта, нажимать...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Откуда у float лишние цифры в конце дробной части. Представление чисел с плавающей точкой
bytestream 25.01.2025
При разработке программного обеспечения часто возникает необходимость работать с вещественными числами, которые содержат дробную часть. В современных компьютерных системах такие числа представляются. . .
Как использовать глобальную переменную в функции в Python
bytestream 25.01.2025
В программировании на Python глобальные переменные представляют собой особый тип переменных, которые доступны для использования во всех частях программы, включая различные функции, классы и модули. . . .
Как в цикле обойти все элементы map в Java
bytestream 25.01.2025
В разработке на Java одной из наиболее востребованных структур данных является интерфейс Map, который предоставляет эффективный способ хранения и управления парами "ключ-значение". Разработчики. . .
Для чего нужен UserManager.isU­serAGoat(­) в Android и как это использовать
bytestream 25.01.2025
В мире Android-разработки существует множество интересных и порой загадочных функций, о которых знают далеко не все разработчики. Одной из таких функций является метод UserManager. isUserAGoat(),. . .
Как обойти масси в JavaScript. Всё о циклах
bytestream 25.01.2025
JavaScript представляет собой мощный язык программирования, широко используемый в веб-разработке, где массивы и циклы являются фундаментальными концепциями для эффективной работы с данными. Массив в. . .
Как сделать, чтобы существующая ветка отслеживала удалённую в Git. Связывание локальных и удалённых веток
bytestream 25.01.2025
В разработке программного обеспечения системы контроля версий стали неотъемлемой частью процесса создания качественного программного продукта. Эти инструменты позволяют разработчикам эффективно. . .
Как проверить, что файл НЕ существует с помощью Bash
bytestream 25.01.2025
В системном администрировании проверка существования файлов является фундаментальной операцией, особенно при написании скриптов на Bash. Правильная обработка ситуаций, когда файл отсутствует,. . .
Как проверить, что строка пустая, неопределена или null в JavaScript
bytestream 25.01.2025
При разработке веб-приложений на JavaScript разработчики регулярно сталкиваются с необходимостью проверки строковых значений на различные состояния. Валидация данных является критически важным. . .
Как проверить существование ключа в объекте или массиве в JavaScript
bytestream 25.01.2025
При разработке веб-приложений на JavaScript программисты постоянно сталкиваются с необходимостью работать с объектами и массивами. Эти структуры данных являются фундаментальными элементами языка и. . .
Как создать ArrayList из массива (array) в Java
bytestream 25.01.2025
При разработке программного обеспечения на языке Java программисты часто сталкиваются с необходимостью эффективного управления наборами данных. Массивы и ArrayList являются двумя фундаментальными. . .
Как сгенерировать случайные целые числа (int) в указанном диапазоне в Java
bytestream 25.01.2025
В программировании генерация случайных чисел является важнейшим инструментом для решения множества практических задач. От создания игровых механик до реализации алгоритмов машинного обучения, от. . .
Как сделать, чтобы grep выводил строки до и после найденной
hw_wired 25.01.2025
Утилита grep стала незаменимым инструментом для поиска и фильтрации информации в Unix-подобных операционных системах. Эта командная утилита позволяет осуществлять поиск строк, соответствующих. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru