С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.78/9: Рейтинг темы: голосов - 9, средняя оценка - 4.78
4 / 4 / 2
Регистрация: 02.10.2012
Сообщений: 188
1

Преобразовать HTML текст в обычный

27.06.2018, 13:48. Показов 1796. Ответов 4
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Здравствуйте. Подскажите, чем воспользоваться. Моя прога заходит на страницу, находит необходимый блок с текстом. Мне нужно этот блок скопировать в String, с сохранением пробелов и переносов. Просто текст не получится скопировать, копируется код HTML. Как избавиться от тегов? Вот пример блока с текстом:

HTML5
1
ASKING THE WAY <br> <br>town - город (небольшой) <br>city - город (большой) <br>avenue - авеню, проспект <br><a class="wall_post_more" onclick="hide(this, domPS(this)); show(domNS(this));">Показать полностью…</a><span style="display: none"><br>lane [lein] - переулок <br>block - квартал <br>couple of blocks = two blocks - два (пара) кварталов <br>tram - трамвай <br>train - поезд <br>underground - метро <br>metro I'metrou] - метро <br>subway - метро (ам.) <br>underground station - станция метро <br>bus stop - остановка автобуса <br>fare - плата за проезд, стоимость проезда (билета) <br>What's the fare ? - Сколько стоит билет (проезд)? <br>How much is the fare? - Сколько стоит билет (проезд)? <br>cinema - кинотеатр <br>theatre - театр <br>museum - музей <br>post-office - почта <br>to take a bus - сесть в автобус <br>to change a bus for the underground - пересесть с автобуса па метро <br>Where am I change? - Где мне пересесть? <br>Go as far as ... - Езжайте (идите) до ... <br>Take a number 5 bus.- Сдадитесь на автобус N 5. <br>to get on - входить (о транспорте) <br>to get off - выходить (о транспорте) <br>Cross the street. - Перейдите улицу. <br>Go across the street - Перейдите улицу. <br>Take the street to the right (to the left). - Сверните на yлицу направо (налево). <br>Turn the street to the right (to the left). - Сверните на улицу направо (налево). <br>to turn - поворачивать, сворачивать, разворачиваться <br>Turn the street round the corner. <br>Take the first turn to the right (to the left). - Первый поворот направо (налево). <br>Turn right (left) at... - Сверните направо у ... <br>Turn off at Regent Street. - Поверните (Сверните, т.е. съезжайте с той дороги) у Риджент Стрит. <br>Go straight ahead. - Иди прямо (вперед). <br>Follow me, please. - Идите за мной. <br>(Come) this way, please. - Сюда. <br>(Come) that way. - Туда <br>It's straight ahead. - Прямо. <br>It's over there. - Это вон там. <br>It's this way. - Сюда. <br>It's that way. - Туда. <br>It's near hear. - Это недалеко. <br>It's opposite the bank. - Это напротив банка. <br>It's next to the bank. - Это рядом с банком. <br>It's on the left. - Это налево. <br>It's on the right. - Это направо. <br>It's very far from here. - Это очень далеко отсюда. <br>It's at the second corner. - Это на втором yглу. <br>It's at the next corner. - Это на следующем углу. <br>It's right down the street. - Это в конце улицы. <br>It's just across the street. - Это как раз через дорогу. <br>It's 5 minutes walk from here. - Это в 5 минутах ходьбы от нас. <br>It's too far to walk. - Идти слишком далеко. <br>It's quite a way from here. - Это довольно далеко отсюда. <br>It's quite near. - Это довольно близко. <br>It's not far from here. - Это недалеко отсюда. <br>It's no distance at all. - Это совсем рядом. <br>Distance - расстояние
п.с. неужели только каждый тег регуляркой заменять на пробел или пустую строку? Да еще и кавычки надо заключать в косую черту.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
27.06.2018, 13:48
Ответы с готовыми решениями:

Получить HTML как обычный текст
Как в серверном коде получить из HTML обычный текст, например имеется в базе: &lt;div...

Как преобразовать текст введенный в textarea в HTML
Как преобразовать текст введенный в textarea в HTML? Чтобы потом вывести его на странице, чтоб...

Как преобразовать текст из формата RTF в обычный текст?
Как преобразовать текст из формата RTF в обычный текст?

Преобразовать RTF в обычный текст
Здравствуйте. На форме есть текстовое поле, куда необходимо вывести текст. В базе текст хранится...

4
Администратор
Эксперт .NET
17730 / 13853 / 5318
Регистрация: 17.03.2014
Сообщений: 28,366
Записей в блоге: 1
27.06.2018, 23:29 2
Цитата Сообщение от каддафи Посмотреть сообщение
Моя прога заходит на страницу, находит необходимый блок с текстом.
Как именно это делается?
0
4 / 4 / 2
Регистрация: 02.10.2012
Сообщений: 188
28.06.2018, 05:51  [ТС] 3
OwenGlendower, отправляется запрос, приходит ответ. В ответе содержится содержимое стены группы вконтакта (html). Нахожу нужную мне запись (через ругулярку), по указанному ниже примеру это (div id="wpt-40167434_167789"). Далее после (class="wall_post_text">), через регулярку забираю себе текст. Там дальше попадаются еще какие то теги. Но так как в каждой копируемой со стены записи, эти теги идентичны. Можно через ругулярку их удалять. Теги <br>, заменять через регулярку на перенос строки. Поторопился создать тему. Пока все тут расписывал, дошло как можно это сделать. Похоже так и придется все делать. Проще варианта наверно не существует

HTML5
1
 <div class="wall_text"><div id="wpt-40167434_167789" class="wall_post_cont _wall_post_cont"><div class="wall_post_text">Coffee - Кофе <br>White or black? – С молоком или без? (Вопрос о том, как вам подавать чай или кофе) <br>Espresso - кофе «эспрессо», то есть горячая вода под сильным давлением пропускается через свежемолотые кофейные зерна. <br>Caffe latte – кофе «эспрессо» с горячим молоком. <br>Cappuccino – кофе «эспрессо» с одной третью горячего молока и одной третью молочной пенки. <br><a class="wall_post_more" onclick="hide(this, domPS(this)); show(domNS(this));">Показать полностью…</a><span style="display: none"><br>Macchiato – кофе «эспрессо» с чуточкой горячего и холодного молока. <br>Mocha – кофе «мокко», то есть caffee latte с шоколадом. <br>Americano - кофе «эспрессо» с горячей водой. <br>Single – одна порция кофе «эспрессо». <br>Double – двойная порция кофе «эспрессо». <br>Triple – тройная порция кофе «эспрессо» <br>Quadruple – четыре порции кофе «эспрессо» <br>Skinny – обезжиренное или снятое молоко. <br>Unleaded – без кофеина. <br> <br>Alcoholic Beverages - Алкогольные напитки <br>Scrumpy – крепкий сидр (sider – яблочное вино), который разливают в пабах прямо из бочек. <br>Snake bite - (букв.: «змеиный укус») смесь в равных долях сидра и легкого пива с небольшим количеством малинового напитка. <br>Whisky – разумеется, &quot;виски&quot;. Термин этот является сокращенной формой слова &quot;whiskybae&quot; или &quot;usquebae&quot;, произошедшего от гаэльского (язык шотландских кельтов) словосочетания &quot;uisqge beatha&quot;, что означает «вода жизни». <br>Blended whisky – смесь ячменного и пшеничного виски. <br>Malt whisky – виски из ячменного солода. <br>Martini - – «мартини», коктейль из джина и сухого вермута (вина, ароматизированного сухими травами), смешанным в пропорции пять к одному. <br>Neat - значит &quot;чистый&quot;, &quot;опрятный&quot;. Когда говорят об алкогольных напитках, это означает «чистый, не разбавленный») <br>Vodka and lime - смесь водки с соком лайма. <br>Grain whisky – виски из пшеницы, употребляется обычно в коктейлях. <br>gin – джин, крепкий алкогольный напиток, изготовленный путем перегонки пшеничного спирта с добавлением ягод можжевельник. Название этого напитка произошло от французского &quot;genivre&quot;, или голландского &quot;jenever&quot;, что в обоих случаях означает &quot;juniper&quot; - можжевельник. <br>tonic – тоник, тонизирующее средство <br>brandy - &quot;бренди&quot;, сокращенно от слова &quot;brandywine&quot;, которое произошло от нидерандского &quot;brandewijn&quot; — огненное вино (branden — сжигать; wijn — вино). Это общее название продуктов дистилляции виноградного вина, фруктовой или ягодной браги. Обычно бренди изготавливается именно из виноградного вина путем перегонки. Известный пример: Коньяк - виноградней бренди, который производят в провинции Коньяк (Cognac) во Франции. Американский бренди изготавливают в основном в Калифорнии. Популярные марки: Christian Brothers, Coronet, E&amp;J, Korbel, Paul Masson. <br>Beer - пиво <br> <br>Сорта пива: <br>Ale – &quot;эль&quot;; мягче, слаще и темнее обычного пива, подается при комнатной температуре. <br>Bitter – светлое пиво, крепкое, с горьковатым вкусом; в этом сорте пива высокое содержание алкоголя; подается охлажденным. <br>Draught (англ.) = draft (амер.) – бочковое пиво. <br>Lager – светлое пиво с большим, чем в “bitter”, содержанием углекислоты; лучше подавать охлажденным. <br>Laget top – порция пива с добавлением лимонада. <br>Stout – темное и плотное (из чего и следует его названия) пиво из солода. <br>Shandy – смесь обычного пива с лимонадом. <br> <br>Также полезно знать: <br>Would you like a drink? - Не хотите ли выпить? <br>A drink – (тоже) напиток, чаще всего подразумевается алкогольный, но, в зависимости от контекста, может означать и кофе, и чай, и сок. <br>Alcoholic beverages / hard drinks – алкогольные напитки <br>Soft drinks – безалкогольные напитки <br>Hot beverages - напитки, которые подаются горячими, то есть чай, кофе, горячий шоколад (Hot chocolate), глинтвейн (Glhwein). <br>Water – вода <br>a glass of water - стакан воды <br>mineral water - минеральная вода <br>Juice – сок (fruit juice - фруктовый сок) <br>Lemonade – лимонад, газированный ароматизированный фруктовый напиток. <br>Pop / Soda – газированный напиток, «шипучка».</span></div><div
Добавлено через 5 минут
а Html Agility Pack подойдет для моего случая? Еще не смотрел что это такое
0
Эксперт .NET
12567 / 8737 / 1311
Регистрация: 21.01.2016
Сообщений: 32,770
28.06.2018, 05:52 4
Цитата Сообщение от каддафи Посмотреть сообщение
а Html Agility Pack подойдет для моего случая?
Да.
0
4 / 4 / 2
Регистрация: 02.10.2012
Сообщений: 188
28.06.2018, 08:18  [ТС] 5
ясно спасибо!

Добавлено через 1 час 40 минут
Кто нить может подсказать где скачать Html Agility Pack? Официальная страница предлагает только Nuget какой то скачать.

Добавлено через 6 минут
п.с. все разобрался. Не надо ничего скачивать, устанавливается через меню VS "Управление пакетами NuGet"
0
28.06.2018, 08:18
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
28.06.2018, 08:18
Помогаю со студенческими работами здесь

Как преобразовать обычный текст в PHP?
Суть вопроса в следующем. Сайт на вордпрессе. Мне нужно добавить php-код в поле описания рубрики....

Html теги в сущности выводятся как обычный текст
Здраствуйте! недавно столкнулся с такой проблемой: @foreach (var abt in new...

Перевести обычный файл в HTML, добавив соответствующие HTML-теги
Задание состоит в том, что имеется файл текстовый, его нужно перевести в HTML, т.е. добавить тэги...

Как преобразовать ассоциативный массив в обычный?
Доброго времени суток. Суть такая. Есть ассоциативный массив вида: $arr = Можно ли его как то...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Книги и учебные ресурсы по C#
InfoMaster 08.01.2025
Базовые учебники и руководства Одной из лучших книг для начинающих является "C# 10 и . NET 6 для начинающих" Эндрю Троелсена и Филиппа Джепикса . Книга последовательно раскрывает основные концепции. . .
Что такое NullReferenceEx­­­ception и как исправить?
InfoMaster 08.01.2025
NullReferenceException - одно из самых распространенных исключений, с которым сталкиваются разработчики на C#. Это исключение возникает при попытке обратиться к членам объекта (методам, свойствам или. . .
Что такое Null Pointer Exception (NPE) и как это исправить?
InfoMaster 08.01.2025
Null Pointer Exception (NPE) - это одно из самых распространенных исключений в Java, которое возникает при попытке использовать ссылку на объект, значение которой равно null. Это исключение относится. . .
Русский язык в консоли C++
InfoMaster 08.01.2025
При разработке программ на C++ одной из частых проблем, с которой сталкиваются русскоязычные программисты, является корректное отображение кириллицы в консольных приложениях. Эта проблема особенно. . .
Telegram бот на C#
InfoMaster 08.01.2025
Разработка ботов для Telegram стала неотъемлемой частью современной экосистемы мессенджеров. C# предоставляет мощный и удобный инструментарий для создания разнообразных ботов, от простых. . .
Использование GraphQL в Go (Golang)
InfoMaster 08.01.2025
Go (Golang) является одним из наиболее популярных языков программирования, используемых для создания высокопроизводительных серверных приложений. Его архитектурные особенности и встроенные. . .
Что лучше использовать при создании класса в Java: сеттеры или конструктор?
Alexander-7 08.01.2025
Вопрос подробнее: На вопрос: «Когда одновременно создаются конструктор и сеттеры в классе – это нормально?» куратор уточнил: «Ваш класс может вообще не иметь сеттеров, а только конструктор и геттеры. . .
Как работать с GraphQL на TypeScript
InfoMaster 08.01.2025
Введение в GraphQL и TypeScript В современной разработке веб-приложений GraphQL стал мощным инструментом для создания гибких и эффективных API. В сочетании с TypeScript, эта технология. . .
Счётчик на базе сумматоров + регистров и генератора сигналов согласования.
Hrethgir 07.01.2025
Создан с целью проверки скорости асинхронной логики: ранее описанного сумматора и предополагаемых fast регистров. Регистры созданы на базе ранее описанного, предполагаемого fast триггера. То-есть. . .
Как перейти с Options API на Composition API в Vue.js
BasicMan 06.01.2025
Почему переход на Composition API актуален В мире современной веб-разработки фреймворк Vue. js продолжает эволюционировать, предлагая разработчикам все более совершенные инструменты для создания. . .
Архитектура современных процессоров
inter-admin 06.01.2025
Процессор (центральный процессор, ЦП) является основным вычислительным устройством компьютера, которое выполняет обработку данных и управляет работой всех остальных компонентов системы. Архитектура. . .
История создания реляционной модели баз данных, правила Кодда
Programming 06.01.2025
Предпосылки создания реляционной модели В конце 1960-х годов компьютерная индустрия столкнулась с серьезными проблемами в области управления данными. Существовавшие на тот момент модели данных -. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru