0 / 0 / 0
Регистрация: 02.04.2019
Сообщений: 25
|
||||||
1 | ||||||
Excel По ключевым словам осуществляется поиск информации в сети интернет и первые 10 ссылок заносятся в базу данных20.04.2023, 22:04. Показов 741. Ответов 5
Всем привет, пишу курсовую, идея которой изложена в заголовке. В общем у меня уже нет идей как это можно реализовать, пытался парсить гугл, очень сложно и в ссылках всякий мусор(код ниже), с яндексом парсинг должен быть проще, но там проблема в том, что никак в ссылке не получается передать запрос, писать надо код на VBA, но я пытался и на питоне, но тоже шлак вышел. тема курсовой если вдруг нужна вот: Создание информационной технологии для формирования базы данных информационных ресурсов (по ключевым словам осуществляется поиск информации в сети интернет и первые 10 ссылок заносятся в базу данных)
у меня простая юзерформа, где есть текстбокс и командбтн, когда нажимаешь на кнопку открывается эксплорер(специально сделал видимым пока что)
0
|
20.04.2023, 22:04 | |
Ответы с готовыми решениями:
5
поиск по ключевым словам в базе данных Фильтрация данных: поиск записей Vk по ключевым словам Поиск по ключевым словам и запись данных в файл (python) Реализовать поиск данных по ключевым словам на компьютере и в интернете |
14 / 10 / 4
Регистрация: 19.07.2016
Сообщений: 101
|
|
21.04.2023, 13:31 | 2 |
Не вижу трудности, заменить гугл на яндекс. Всё работает
ie.Navigate "https://yandex.by/search/?text=" & myText
1
|
0 / 0 / 0
Регистрация: 02.04.2019
Сообщений: 25
|
|
21.04.2023, 14:16 [ТС] | 4 |
Да я по вба не спец, так что вот так накатил
Добавлено через 8 минут И правда, идет поиск. Я просто смотрел через эксплорер, а там в url кодировке шел поиск. В общем, если сделать так, то поиск идет, ссылки добавляет, но проблема в том что тегов <a> очень много и них хранятся не только ссылки на страницы, но и какие-то яндексовские ссылки. Чтобы отобрать нужные теги <a> надо сначала пропарсить все теги <li> потом найти тег <div class="Organic organic Typo Typo_text_m Typo_line_s i-bem" data-bem="{"organic":{}}"> внутри этого еще один <div class="VanillaReact OrganicTitle OrganicTitle_multiline Typo Typo_text_l Typo_line_m organic__title-wrapper"> и наконец оттуда взять тег <a> и достать аттрибут href. Сложность в том, что вообще нет мыслей как забрать именно их.
0
|
14 / 10 / 4
Регистрация: 19.07.2016
Сообщений: 101
|
|||||||||||
21.04.2023, 16:28 | 5 | ||||||||||
Сообщение было отмечено Snaypi как решение
Решение
Неправда всё это
Вот так получаем линки на элемент ссылки
Добавлено через 18 минут Поправочка По сути linkClass содержит те самые ссылки. Единственный нюанс, у меня в IE 10 ссылок на страницу. Получается, что если нужно 20 - нужно перейти на вторую и повторить процесс, тогда организуем цикл
Добавлено через 4 минуты Ах да, ещё говорят Selenium библиотека есть под VBA. Для навигации и парсинга подходит, причём можно даже и не в IE, а банально в хроме\мозилле. Сам не пользовался пока что, руки не дошли, только скачал, т.к. задача, возможно, такая появится.
1
|
0 / 0 / 0
Регистрация: 02.04.2019
Сообщений: 25
|
||||||
21.04.2023, 17:31 [ТС] | 6 | |||||
В общем я сейчас поизучал и изменил немного код. В теории все должно быть идеально вба ищет класс Link Link_theme_normal OrganicTitle-Link organic__url link i-bem, который находится в теге <a>, где есть атрибут href, и я получаю ту самую ссылку, но в строке 59 ошибка "Object variable or With block variable not set", и я не понимаю как ее пофиксить. Как я понял объект пуст, но почему?
Не видел ваш ответ, сейчас попробую так накатить
0
|
21.04.2023, 17:31 | |
21.04.2023, 17:31 | |
Помогаю со студенческими работами здесь
6
Поиск данных по ключевым словам, их обработка и вывод результатов в другой файл Какие бывают методы поиска и анализа информации по ключевым словам Поиск по ключевым словам Поиск по ключевым словам Поиск по ключевым словам Поиск по ключевым словам Поиск по ключевым словам Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |