25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
||||||
1 | ||||||
Получить текст из документа HTML06.03.2012, 17:19. Показов 7286. Ответов 19
Метки нет (Все метки)
Всем добрый день!!! Подскажите как получить текст из документа html. В документе он начинается с тега <p>.
Допустим если на входе строка такого вида <p class=Title align=center style='text-align:center'>РОССИЙСКАЯ ФЕДЕРАЦИЯ</p> Делаю так:
ФЕДЕРАЦИЯ Но MessageBox выдает<p class=Title align=center style='text-align:center'></p> В чем ошибка? Заранее спасибо!!!
0
|
06.03.2012, 17:19 | |
Ответы с готовыми решениями:
19
Получить массив параграфов документа html Получить текст из документа по URL Получить все сериалы из N страниц html документа На оборотной стороне документа word в правой части документа, текст съезжает за границу документа |
136 / 104 / 9
Регистрация: 30.01.2011
Сообщений: 699
|
|
07.03.2012, 07:18 | 3 |
Ты берешь outerHtml, а надо обычный текст.Смотри методы, которые используешь
0
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
|
07.03.2012, 09:14 [ТС] | 4 |
0
|
6287 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
||||||
08.03.2012, 11:44 | 6 | |||||
0
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
|
08.03.2012, 14:05 [ТС] | 7 |
А если несколько документов и у них разное содержимое?
Пример в прикрепленном файле
0
|
6287 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
|
08.03.2012, 14:19 | 8 |
SoloWay, что Вы имели ввиду?
0
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
|
08.03.2012, 14:26 [ТС] | 9 |
Допустим документов несколько. Допустим в них по 10 строчек текста. Я знаю что структура их одинаковая. Мне необходимо вытягивать из этих документов текст. Как это сделать?
0
|
45 / 44 / 7
Регистрация: 15.10.2008
Сообщений: 320
|
|
08.03.2012, 14:35 | 10 |
основной текст скорее всего находится в тегах span,div,p. находишь эти теги в своем хтмл (можно регексом) потом по показанной выше схеме обрабатываешь их
0
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
|
08.03.2012, 14:43 [ТС] | 11 |
Текст находится тут @"<p class=Title align=center style='text-align:center'>" +
Текст тут </p>");
0
|
6287 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
||||||
08.03.2012, 14:55 | 12 | |||||
1
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
||||||
08.03.2012, 20:32 [ТС] | 13 | |||||
Добавлено через 1 час 7 минут не читает кириллицу, как сделать чтоб читал?
0
|
6287 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
|
08.03.2012, 21:57 | 14 |
  - это пробел в HTML. По Умолчанию браузер режет множество пробелов до одного. В таблицах в пустых ячейках рекомендуется ставить   что бы не возникало проблем с IE
0
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
|
10.03.2012, 14:42 [ТС] | 15 |
Теперь заморока в том что не выводит в richtextbox кириллицу из html. Если текст документа на английском то выводит. Как быть?
Добавлено через 51 минуту Проблему решил. Теперь необходимо создать массив тегов <p>. Как это сделать?
0
|
6287 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
|
||||||
10.03.2012, 14:52 | 16 | |||||
2
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
||||||
10.03.2012, 15:51 [ТС] | 17 | |||||
Петрр огромное спасибо. Извините за дерзость а как теперь подставлять эти массивы в словосочетания.
Допустим у меня в документе содержатся названия цвета. зеленая синее желтое В MessageBox хочу выводить так
0
|
107 / 107 / 9
Регистрация: 19.12.2010
Сообщений: 417
|
|||||||||||||||||||||
10.03.2012, 18:32 | 18 | ||||||||||||||||||||
Может просто отбросить теги (чтобы получить текст) регулярными выражениями типа:
0
|
25 / 25 / 6
Регистрация: 26.09.2010
Сообщений: 295
|
|
11.03.2012, 11:08 [ТС] | 19 |
Но ведь InnerText берет весь текст, а мне нужно отдельные строки.
Добавлено через 1 час 13 минут То есть доставать из массива индексы и вставлять в нужные места
0
|
107 / 107 / 9
Регистрация: 19.12.2010
Сообщений: 417
|
||||||
11.03.2012, 13:09 | 20 | |||||
Не проверял, но...
Допустим, у вас уже есть нужный node, тогда что-то типа:
1
|
11.03.2012, 13:09 | |
11.03.2012, 13:09 | |
Помогаю со студенческими работами здесь
20
Как в Microsoft Visual Studio 2013 получить текст из документа по ссылке? как получить текст Word-документа в HTML-виде Извлечь текст из div'а HTML-документа Delphi - получить дату из HTML документа. Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |