1 | |||||||||||
Как понять, что на этой странице HTML выводится такой текст05.03.2020, 13:33. Показов 3645. Ответов 35
Метки нет (Все метки)
Запросил страницу HTML
там есть текст "1 - 1 of 1 items" Означает, что найдена одна позиция. А значит возможно автоматическое продолжение работы как найти этот текст? Рабочая ссылка https://www.holstein.ca/en/AIS... =135695137 Текст находится в счетчике под таблицей с данными в серой зоне пользуюсь
Находится этот текст по идее здесь. Но дебуггер его не показывает?
0
|
05.03.2020, 13:33 | |
Ответы с готовыми решениями:
35
Как в HTML сделать увеличения картинок на этой же странице , одним кликом Чем заменить функцию ссылка на текст-текст на этой же странице на Wordpress 4.6.1 не могу понять что вводится и выводится Всплывающий текст на странице html |
05.03.2020, 19:32 | 2 |
AndreA SN, Вы бы выложили полный текст процедуры, а не куски. Хотелось поискать говядины - текст "1 - 1 of 1 items" на странице нашел, выгрузил в документ Word. На чем Вы остановились в своих исследованиях?
0
|
05.03.2020, 20:58 [ТС] | 3 | |||||
Сам читаю и ругаю себя. В каком угаре я ТС рисовал?... Восьмая Марта была просто шедевральная. Завтра еще и продолжение.
Выбрал полностью работоспособный кусок без лишних мыслей. Суть: делаю запрос - ищу "1 - 1 of 1 items" - И НЕ НАХОЖУ...
0
|
06.03.2020, 15:24 | 4 | |||||
AndreA SN, выкладываю код, который находит "1 of 1 items" на Вашей странице из стартового поста.
Обнаружил одну особенность, из-за которой долго пытался понять, почему результат нельзя воспроизвести. При первом запуске в тексте присутствуют искомые символы, однако после повторного и следующего запусков на месте этих символов появляется "No items to display" (типа нечего вам показать, ничего не найдено). Чтобы снова искомые символы появились в тексте страницы, отданном процедурой в переменную txt$, необходимо очистить кэш IE. Тогда опять всё находится, но только при первом запуске. Пока это всё, чего я смог добиться. Кликните здесь для просмотра всего текста
1
|
06.03.2020, 17:59 [ТС] | 5 |
aequit, благодарю.
В продолжение этого поста: когда стало понятно, что там всего одна позиция - как можно узнать animalID? Это внутренний идентификатор животного. Если его узнать - можно дальше продолжить работу в автоматическом режиме. Причем интересно, что если идентификатор известен, то дальше доступ к информации на всех последующих страницах организовать легко. Я прошерстил содержимое txt$ на предмет наличия идентификатора. Но ничего не нашлось. Для этого примера animalID = 10147533 Является компонентом запросов
0
|
2739 / 1714 / 778
Регистрация: 23.03.2015
Сообщений: 5,430
|
|
06.03.2020, 18:15 | 6 |
0
|
06.03.2020, 21:02 [ТС] | 7 | |||||
в этом тесте все пять animalID, которые возвращаются запросом
0
|
06.03.2020, 22:54 | 8 | |||||
Сообщение было отмечено AndreA SN как решение
Решение
Попробуйте так поискать:
Кликните здесь для просмотра всего текста
1
|
07.03.2020, 23:41 [ТС] | 9 |
aequit, не пойму: тут к страничке два последовательных запроса организовываем? Или первый wend не к сайту относится?
Добавлено через 22 секунды в целом получилось Добавлено через 22 минуты aequit, с Вашей помощью у меня получилось двумя последовательными запросами понять: 1. что в запросе присутствует лишь одно животное 2. получить его ID. Теперь бьюсь над тем, как их объединить в один. Пока по одному случаю я организовываю четыре запроса: 1. запрос на наличие одного животного 2. запрос ID животного 3. запрос его родословной 4. запрос продуктивности матери Я, конечно, стараюсь организовать прерывание по времени, но лучше исключить лишний запрос, если это возможно. Возможно ли объединить запрос 1 и запрос 2? Добавлено через 7 минут Я так понимаю, что в одном случае функция запроса будет возвращать ID, а в другом какую-то метку множественности результата. Пусть будет слово "много". Если этого слова нет - то организовываем автоматический запрос по ID, иначе - ручной запрос по выбранному животному. Это мысль бурлит - как мне организовать работу с разными результатами.
0
|
08.03.2020, 08:14 | 10 | |||||
Сообщение было отмечено AndreA SN как решение
Решение
Замените код в первой процедуре на этот и допиливайте под Ваши нужды:
Кликните здесь для просмотра всего текста
Функции оставьте те же. ждёт, когда сайт загрузится, второй проверяет готовность документа (DOM). Может и можно второй убрать, однако код процедуры работает гораздо быстрее, чем IE и без задержек возможен вариант, что будем запрашивать то, что ещё не загрузилось.
1
|
08.03.2020, 22:50 [ТС] | 11 |
aequit, спасибо огромное. Работает как ожидалось. Это - лучший ответ.
Я имею ввиду абсолютное соответствие решения ТС. ))) на первом же прогоне (как я думал тестовом) вылезли "уши" в информации на сайте. Без Вашей помощи я бы угробил на их поиск массу времени и уйму сил))) Добавлено через 2 часа 31 минуту Нас феноменально обманывают наши коллеги из-за рубежа, просто недоговаривая инфу. А мы за это доллари миллионами платим... Страна непуганых блин...
0
|
09.03.2020, 19:09 [ТС] | 12 |
aequit, в продолжение ТС
Попробовал тот же подход на другом сайте. рабочая ссылка http://www.holstein-uk.org/ani... 7&srcode=1 Процедура определила, что на стартовой странице 1 запись. Но не получилось вернуть html для Добавлено через 5 минут рабочая ссылка - http://www.holstein-uk.org/ani... y/36403438 Как ее найти на стартовой странице? Задача принципиально такая же. Но нюансы обработки запроса не те. Добавлено через 37 минут и вообще затык с данными сайта https://service.vit.de/bulli-w... 3130854061 На этом сайте - вообще ничего не возвращает. Самая лучшая защита от меня
0
|
Модератор
|
|
09.03.2020, 19:20 | 13 |
по крайней мере там кодировка meta charset="utf-8", бывает и похуже
хотя могут быть и другие причины
1
|
09.03.2020, 21:13 | 14 | |||||
Запустить процедуру:
Кликните здесь для просмотра всего текста
Для каждого сайта переделывать нужно. Невозможно написать универсальной решение одно для всех сайтов. Да и работавший вчера вариант может оказаться неработоспособным после изменения структуры сайта. Если Вы ещё не окончательно не убедились, что зарубежные "партнеры"Вас обманывают и желаете получать подтверждения этому снова и снова, наивно веря в "чистое и светлое", как Вам уже посоветовали в другой ветке, учитесь "потрошить" DOM.
1
|
10.03.2020, 13:33 [ТС] | 15 |
Я этими вопросами занимаюсь уже давно. Знаю: где, кто и в каких объемах просто неприкрыто дурит. И даже знаю, где они сами заблуждаются и сами не знают. Но оказалось, что нашим твердолобым управленцам моих слов ну совсем не достаточно. Им подавай сравнительную статистику. Сначала я пытался "быстро накопить" доказательную базу. Но потом работа переросла в систематическую. И тот набор инструментов, который у меня уже был - оказался неповоротливым, устаревшим и несистемным.
Я Вам очень благодарен за советы. Они позволили сдвинуть с мертвой точки работу с парой источников данных не только за счет использования Ваших наработок, но и из-за внятности пояснений к коду, что для меня очень полезно. И понимаю, что каждый сайт - потемки. Я, к моему сожалению, не имею образования в программировании (никакого). Занимаюсь проблемой ошибок в данных. Ненормальных, работающих в этой области - мало: слишком скучная тема. Но делать ее нужно хотя бы потому, что в результате моей работы накапливаются сведения о мутациях. А это уже не ошибка в кличке. От такой дряни избавиться у нас будет оооочень сложно и долго. Лучше профилактировать, чем исправлять. Вообщем, это важно в моей профсфере. Добавлено через 3 часа 26 минут Что-то не находит у меня "1 of 1 results"
0
|
Модератор
|
|
10.03.2020, 14:16 | 16 |
0
|
10.03.2020, 21:22 [ТС] | 19 |
Нет. именно Uk. Я еще покопаюсь... может чего не так сделал...
Сейчас с vit.de домучаюсь в ручном режиме. и займусь Uk aequit, мне уже стыдно Вас просить. Но если есть возможность, гляньте пожалуйста ссылку https://service.vit.de/bulli-w... 3130854061 Дело в том, что страница открывается. Но попытка получить HTML натыкается на 404 ошибку. Этот сайт для меня очень важен.
0
|
10.03.2020, 22:04 | 20 |
Вы доделайте сначала одно...
Вставляете код из сообщения № 14 в пустой модуль и запускаете процедуру MuMu2. Что получаете? Должны быть 2 подряд сообщения, о том, что "На сайте обнаружен текст "1 of 1 results" и второе с искомой ссылкой. Если нет, файл с попытками сюда, потому что у меня на разных компьютерах всё работает. На данном сайте не было ни единого сбоя, (в отличие от попыток получения информации с самого первого сайта из стартового поста). Не верю. "Какие Ваши доказательства?" Файл выкладывайте с Вашими попытками и описывайте, что ищете. Потому что код живая страница отдаст всегда, другое дело, что нужной информации там может не быть, её нужно будет дополнительно подгружать. Например, только что проверил: данный сайт выдал 10 страниц html по запросу IE.Document.body.innerhtml и 14 страниц текста по запросу IE.Document.body.innerText
0
|
10.03.2020, 22:04 | |
10.03.2020, 22:04 | |
Помогаю со студенческими работами здесь
20
Вычислить N степень каждого элемента этой матрицы( не могу понять что от меня хотят ) Проблемы с шаблонами html. Не выводится то что нужно Текст HTML распознавался как просто текст, а не HTML код Студент. Хочу понять что такое ассемблер, как на нем писать, как его понять и с чего начать Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |