Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/6: Рейтинг темы: голосов - 6, средняя оценка - 5.00
20 / 20 / 7
Регистрация: 18.02.2015
Сообщений: 304
1

Отсеять все теги HTML при парсинге

25.10.2015, 21:25. Показов 1175. Ответов 2
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
А можно как-то когда парсишь, отсеить все теги HTML. А то я беру тело с новостью и там куча всяких html тегов, которые просто засоряют. Писать сортировку, тогда новости будут обновляться довольно долго, учитывая то что IdHTTP для начала "скачает" страничку. А затем алгоритм сортировки все это отсортирует, проверит каждый тег и тд.
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
25.10.2015, 21:25
Ответы с готовыми решениями:

Linq to XML - убрать лишние теги при парсинге
Здравствуйте, не могли бы вы мне помочь пожалуйста. Я пытаюсь распарсить страницу, но вот одна...

Кодировка при парсинге html файла
Доброго времени суток. Подскажите как исправить ошибку, суть такая делаю парсинг страницы, по...

При помощи регулярного выражения отсеять все ненужное
Здравствуйте уважаемые программисты у меня стоит задача нужно считать слова из файла Exeptions.txt...

Слетела кодировка при парсинге html-страницы
Здравствуйте! Начал писать программу которая парсит сайт. В заголовке html-страницы указана...

2
управление сложностью
1693 / 1306 / 259
Регистрация: 22.03.2015
Сообщений: 7,545
Записей в блоге: 5
26.10.2015, 09:57 2
Возможно использовать регулярку, в которой прописать все необходимые теги.
0
Эксперт С++
8482 / 6149 / 615
Регистрация: 10.12.2010
Сообщений: 28,683
Записей в блоге: 30
26.10.2015, 18:05 3
Лучший ответ Сообщение было отмечено Appi как решение

Решение

Цитата Сообщение от Почтальон Посмотреть сообщение
Возможно использовать регулярку, в которой прописать все необходимые теги.
C++
1
2
3
4
5
6
7
#include <System.RegularExpressions.hpp>
//---------------------------------------------------------------------------
String __fastcall StripTags( const String& AContent, const String& AReplacement=L" ")
{
    TRegEx Re("</?[^>]+>");
    return Re.Replace(AContent,AReplacement);
}
2
26.10.2015, 18:05
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
26.10.2015, 18:05
Помогаю со студенческими работами здесь

При парсинге html в string появились коды
Я спарсив сайт, я достал из тега текст. При его выводе некоторые символы отображаются в виде...

Отключить все теги html
Добрый день, есть вопрос мой скрипт возвращает строку которую надо передать в виде ответа на...

в html 5 все теги будет закрыто ?
&lt;meta /&gt; ?

Убрать все html-теги из кода
есть код и мне нужно убрать все html теги например: он выводит это &lt;td&gt;30&lt;/td&gt; &lt;td&gt;&lt;a...

Удалить все комментарии и теги из HTML файла
Есть задание: Написать сценарий для sed и awk для удаления тегов и комментариев HTML. Теги и...

Удаляет все html теги из файла. strip_tags?
Доброго времени суток! Есть php скрипт, позволяющий редактировать txt файл через cms. Проблема в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru