С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.94/18: Рейтинг темы: голосов - 18, средняя оценка - 4.94
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
1
.NET 4.x

Как вытащить текст со Html странички? Html Agility Pack

10.10.2018, 12:38. Показов 3716. Ответов 7

Author24 — интернет-сервис помощи студентам
Всё очень просто как вытащить текст с Html странички с помощью Html Agility Pack? К примеру у нас есть страничка того же сайта
html-agility-pack.net, и нам к примеру нужна втащить текст количества скачиваний вопрос как?
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
Блог
10.10.2018, 12:38
Ответы с готовыми решениями:

Парс html строки с использованием Html Agility Pack
Есть строка: <ul><li><a href="./pm.php?action=inbox" title="Всего сообщений:...

Html Agility Pack. Как получить код только одного класса?
как я уже понял, что лучше всего будет использовать html agility pack, но пока не понимаю как...

Html Agility Pack в Windows Phone и ошибка "Следует добавить ссылку на сборку "System.Xml.XPath"
public BashPage() { InitializeComponent(); HtmlDocument doc =...

Вытаскивание слова из html странички
Здраствуйте, В исходном коде странички есть строка <tr><th>Страна:</th><td>Китай</td></tr> как...

7
Администратор
Эксперт .NET
17710 / 13837 / 5313
Регистрация: 17.03.2014
Сообщений: 28,343
Записей в блоге: 1
10.10.2018, 14:02 2
MacTony, в случае с Html Agility Pack главное это найти XPath для нужного узла. В данном можно искать по атрибуту class
C#
1
2
3
var web = new HtmlWeb();
HtmlDocument doc = web.Load("http://html-agility-pack.net/");
string downloads = doc.DocumentNode.SelectSingleNode("//div[contains(@class, 'style-4')]").InnerText.Trim();
1
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 16:54  [ТС] 3
OwenGlendower. Здравствуйте! Спасибо за такой исчерпывающий ответ! Но у меня вопрос, как вы нашли XPath, через какие инструменты?
0
Администратор
Эксперт .NET
17710 / 13837 / 5313
Регистрация: 17.03.2014
Сообщений: 28,343
Записей в блоге: 1
11.10.2018, 17:12 4
MacTony, взял CSS селектор из инструментов разработчика в браузере и переписал в xpath. Есть расширения позволяющие сразу получать xpath из html.
0
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 17:56  [ТС] 5
А какой браузер вы использовали?
0
Администратор
Эксперт .NET
17710 / 13837 / 5313
Регистрация: 17.03.2014
Сообщений: 28,343
Записей в блоге: 1
11.10.2018, 18:12 6
MacTony, Firefox, но это не имеет значения. Инструменты веб-разработчика есть во всех современных браузерах.
0
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 18:48  [ТС] 7
Просто у меня в Google XPacth видимо не корректно работает, я копирую к примеру вот этот XPacth под Downloaded more than значение XPacth: //*[@id="downloadCount"]/div[2] я его подставляю в поле
C#
1
2
3
string downloads = doc.DocumentNode
                .SelectSingleNode("//*[@id='downloadCount']/div[2]")
                .InnerText.Trim();
но в строке downloads 0 почему?
0
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 18:51  [ТС] 8
Вот весь код:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using HtmlAgilityPack;
using System.Net;
using System.Net.Http;
using System.IO;
 
namespace Parser
{
    class Program
    {
        static void Main(string[] args)
        {
 
            var web = new HtmlWeb();
            HtmlDocument doc = web.Load("http://html-agility-pack.net/");
            string downloads = doc.DocumentNode
                .SelectSingleNode("//*[@id='downloadCount']/div[2]")
                .InnerText.Trim();////div[contains(@class, 'style-4')]
 
            Console.WriteLine(downloads);
            Console.ReadLine();
 
        }
    }
}
Вывод:
Как вытащить текст со Html странички? Html Agility Pack
0
11.10.2018, 18:51
BasicMan
Эксперт
19315 / 2622 / 84
Регистрация: 17.02.2009
Сообщений: 10,364
Блог
11.10.2018, 18:51
Помогаю со студенческими работами здесь

Как мне вытащить значение из (HTML table) по нажатию на button
Есть в aspx вот это: <asp:Table ID="FindCompanyTable" runat="server" style="width:100%;...

Как получить html-код странички в переменную string
Доброго времени суток, как получить html код странички в стринг? На впф: WebClient...

Html Agility Pack. Не работает SelectNodes
Вро де не большой код отказывается работать, все делал по примерам, и все равно не работает пишет...

Программа с Html Agility Pack у пользователя
Доброго времени суток, использую HAP в своей программе, и когда скидую exe другу, у него...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru