0 / 0 / 0
Регистрация: 11.10.2022
Сообщений: 8
1

Вытянуть текст и ссылку из html тэгов

07.07.2023, 14:57. Показов 511. Ответов 2

Author24 — интернет-сервис помощи студентам
Нужно вытянуть даные после 'href=' и 'title='
HTML5
1
2
3
4
5
6
7
<div class="othersBold">
     <a href="/rubric-regions/3732733-na-napramku.html" title="07.Jul.2023 На напрямку">
            <span class="otherTime">13:38</span>
            <span class="othersPrefix"> Відео</span>
            На напрямку
     </a>
</div>
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
07.07.2023, 14:57
Ответы с готовыми решениями:

Вытянуть текст с html-страницы
Вопрос такой: я считал с html-страницы при помощи BeautifulSoup определенные теги с текстом и...

Считывание тэгов XML - надо вытянуть value IBP
&lt;Grouping&gt; &lt;GroupBy GroupID='VendorID' Value='IBP' /&gt; &lt;GroupBy GroupID='ClassID' Value='CPN'...

Реализовать функцию проверки правильности html-тэгов в html-документе
нужно реализовать функцию на с++.Долго сидел,понять не могу.

Парсинг HTML: Открыть каждую страницу и сохранить с нее заголовок, ссылку на фото, текст и дату
Здравствуйте. Допустим есть форма в ней текст бокс и кнопка. В текст бокс даю ссылку на категорию...

2
32 / 24 / 11
Регистрация: 03.06.2023
Сообщений: 56
08.07.2023, 15:43 2
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
from bs4 import BeautifulSoup
 
html = \
    """
    <div class="othersBold">
    
    <a href="/rubric-regions/3732733-na-bahmutskomu-napramku.html" title="07.Jul.2023 На Бахмутському напрямку">
    <span class="otherTime">13:38</span>
    <span class="othersPrefix"> Відео</span>
    На Бахмутському напрямку
    </a>
    </div>
    """
 
soup = BeautifulSoup(html, features='html.parser')
a = soup.find_all()
tgs = {'href': [], 'title': []}
 
for tag in a:
    if tag.has_attr('href'):
        tgs['href'].append(tag['href'])
    if tag.has_attr('title'):
        tgs['title'].append(tag['title'])
 
print(tgs)
0
146 / 109 / 37
Регистрация: 28.11.2013
Сообщений: 371
08.07.2023, 21:02 3
Ну или так.
Python
1
2
3
4
5
soup = BeautifulSoup(html, 'html.parser')
link = soup.find('a').get('href')
title = soup.find('a').get('title')
print(link)
print(title)
0
08.07.2023, 21:02
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
08.07.2023, 21:02
Помогаю со студенческими работами здесь

Вытянуть из именованной ссылки ссылку
Добрый день господа программисты и системные администраторы. У меня такой, немного тупой, вопрос....

Замена тэгов HTML
Дабы не создавать похожую тему обращусь здесь. Как с помощью: sXML = Regex.Replace(sXML,...

Как вытянуть ссылку на капчу recaptcha?
как достать ссылку из атрибута src, если при обновлении сайта она меняется и количество символов...

Замена тэгов HTML в строке
Доброго времени суток. Есть проблема. сформирован отчёт в Word. Строки содержат тэги HTML &lt;br/&gt;...

Очистка текста от HTML тэгов
Очистите файл от HTML-тегов: http://dfedorov.spb.ru/python/files/p.html Выведите на экран «чистый»...

Чтение Html Без потери тэгов
Стоит следующая задачка: имеется шаблон отчета в формате html, где установлены теги специального...

Удаление тэгов из текста HTML страницы
Имеется кусок HTML-текста с тэгами. Задача: очистить текст от тэгов. Как это сделать? Может уже...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru