Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.76/29: Рейтинг темы: голосов - 29, средняя оценка - 4.76
5 / 5 / 1
Регистрация: 31.10.2015
Сообщений: 274

Парсер с Авито

06.03.2018, 13:11. Показов 5680. Ответов 1

Студворк — интернет-сервис помощи студентам
Пробую писать парсер с авито(вакансии) своего города. Набросал такой код используя библиотеку
PHP Simple HTML DOM Parser.

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
<?php
include 'parsing.php';
 
function parser(){
    $site='https://www.avito.ru';
    $page=("https://www.avito.ru/permskiy_kray_gornozavodsk/vakansii");
$html=new simple_html_dom();
$html->load_file($page);
 
        foreach($html->find('img[class=photo-count-show]') as $img) 
        $image[]= $img->src;
       
        foreach($html->find('h3[class=title item-description-title]') as $title)
        $zagol[]= $title->plaintext;
      
        foreach($html->find('div.about') as $zarplata)
        $cash[]= $zarplata->plaintext;
             
        foreach($html->find('a[class=item-description-title-link]') as $link)
        $links[]= $link->href;
 
 
        ?>
        
        <?php for ($x=0;$x<count($image);) {?>
<div style="float:left;clear:both;width:600px;font:10pt tahoma;margin-top:2%;" id="MainBlockVacansy">
<div style="float:left;background-size:contain;width:150px;height:150px;background-image:url('<?=$image[$x]?>');"></div>
<div style="float: left;margin:8px;"><h3><?=$zagol[$x]?></h3></div>
<div style="float: left;margin-left:40%;">Зарплата <?=$cash[$x]?></div>
</div>
<?php $x++;}
     
 }?>
А как ссылки спарсеные пройти, чтоб адреса достать? Пока не знаю....
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
06.03.2018, 13:11
Ответы с готовыми решениями:

Отобразить объявления авито/хеадхантер на сайте
Всем доброго времени суток. 1. Как сделать данную функцию на сайте? Нужно отображать все объявления с авито или хеадхантера по какому...

Где искать неопубликованные объявления Авито
Здравствуйте! Где или как искать неопубликованные (объявление которое пользователь добавил на сайт, но оно еще не прошло модерацию)...

Создание формы отправки объявления на сайт. (пример автору, авито.ру)
Привет всем нуждаюсь в некой помощи &quot;прошаренных&quot; людей. Сделал некий макет сайта для объявлений. Я так как я первый раз этим решил...

1
ytf
276 / 259 / 185
Регистрация: 15.08.2017
Сообщений: 1,483
09.03.2018, 15:32
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<?php
$site='https://www.avito.ru';
$page=file_get_contents("https://www.avito.ru/permskiy_kray_gornozavodsk/vakansii");
preg_match_all("/\<div\ class\=\"item\ item\_table.*href\=\"(.*)\".*\<img\ src\=\"(.*)\".*alt\=\"(.*)\".*\<div\ class\=\"about\ \"\>(.*)\<\/div\>/ismU", $page, $tiu);
 
for ($x=0;$x<count($tiu[0]);$x++) {
?>
<div style="float:left;clear:both;width:600px;font:10pt tahoma;margin-top:2%;" id="MainBlockVacansy">
<div style="float:left;background-size:contain;width:150px;height:150px;background-image:url('<?=$tiu[2][$x]?>');"></div>
<div style="float: left;margin:8px;"><h3><?=$tiu[3][$x]?></h3></div>
<div style="float: left;margin-left:40%;">Зарплата <?=$tiu[4][$x]?></div>
<a href="<?=$site.$tiu[1][$x]?>"><?=$tiu[1][$x]?></a>
</div>
<?php
}
?>
Добавлено через 8 минут
мне выдало ошибку о несуществовании класса simple_html_dom, поэтому я просто использовал file_get_contents
полученную страницу я распарсил функцией preg_match_all, там в общем всё просто - открываешь исходный код в браузере, прикидываешь, какой блок повторяется также часто, как объявления и заносишь его в код
PHP
1
preg_match_all("/шаблон/ismU", $страница_текста, $новая_переменная_в_которую_будут_заноситься_значения);
шаблон представляет собой текстовые строки, в которых все символы "экранированы", кроме букв латинского алфавита и цифр, если участок между цифрами надо ловить, в этом месте ставится
Code
1
(.*)
а если не надо ловить
Code
1
.*
экранирование - процесс добавления наклонной черты перед каждым символом (точкой, пробелом, и т.д.)
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
09.03.2018, 15:32
Помогаю со студенческими работами здесь

Нужен парсер Авито
Всем привет. Необходимо максимально быстро получать номера с авито по конкретной категории. Подскажите как это можно сделать? ...

За сколько запросов авито банит парсер
Всем привет. За сколько запросов авито может забанить парсер? Планируется примерно 500 запросов в день. Не за один раз конечно.

Баннер в авито
Все привет. Как приблизительно можно реализовать такой баннер в авито del

Parsing Авито
Нужно запарсить Авито и вывести следующие вещи: ссылку на сам товар,город,цена,заголовок. var parser = new HtmlParser(); ...

Выбор из авито
День добрый. Ищу ПК, пока думаю смотреть на авито. Для 1)Игр (pubg например) 2)Работа (Android Studio, поэтому только intel) ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru