С Новым годом! Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.56/27: Рейтинг темы: голосов - 27, средняя оценка - 4.56
2 / 2 / 1
Регистрация: 01.10.2009
Сообщений: 53
1

Парсер контента

10.02.2010, 11:08. Показов 5268. Ответов 1
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Здраствуйте, помогите пожалуйста реализовать. Хочу сделать чтобы текст сохранялся с каждой страницы в отдельный тхт файл и название ему довалось с название title страницы откуда спарсился текст. Все что я смог сделать это такой парсер:
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
<?php
$files = array ("content.txt"); 
$urls = array ("file://localhost/Z:/home/localhost/www/123.html") ;
 
foreach($urls as $key=>$url){ 
grab_page($url,$files[$key]); 
}
 
function grab_page($url,$file) {
$grab=file_get_contents($url);
if ($grab) { 
  $pos = strpos($grab, "<p>");
  $grab = substr($grab, $pos); 
  $grab = substr($grab, 0, strpos($grab, "<h2>Поиск по сайту</h2>"));   
  echo $grab; 
  $file = fopen("content.txt","a+");
  flock($file,LOCK_EX);
  $count = fread($file,100);
  $count =  strip_tags($grab, '<b><i><u><img><p><br>');
  ftruncate($file,0);
  fwrite($file,$count);
  flock($file,LOCK_UN);
  fclose($file); 
  rename("content.txt", "con.txt");  
  } 
else { echo "Connection Error"; }
} ?>
Скрипт работает парсит текст с определенной страницы, а вот все остальное не получаетса реализовать. Кто разбираетса в php помогите плиз.

Добавлено через 16 часов 18 минут
Народ помогите с кодом, очень надо. Или киньте ссылку на урок где про такое почитать можно.

Добавлено через 14 секунд
Народ помогите с кодом, очень надо. Или киньте ссылку на урок где про такое почитать можно.
1
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.02.2010, 11:08
Ответы с готовыми решениями:

Парсер после подгрузки js контента
Доброго времени суток. Хотел спросить, кто может подскажет. Вообщем нужно спарсить страничку, а на...

Написать парсер контента - получить гороскоп на сегодня по конкретному знаку зодиака
Добрый день. Решил написать небольшой парсер контента, нужно выдернуть гороскоп на сегодня по...

Парсер контента
Здравствуйте! Есть следующий парсер &lt;?php ...

Парсер контента на curl
Здравствуйте, написал простенький скрипт получения страницы, но он не работает подскажите почему...

1
2 / 2 / 0
Регистрация: 11.02.2010
Сообщений: 16
11.02.2010, 03:25 2
Распарсить HTML-код думаю легче регулярными выражениями, а еще идеальнее SimpleXML, копай в этом направлении.
0
11.02.2010, 03:25
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
11.02.2010, 03:25
Помогаю со студенческими работами здесь

Парсер контента на Imacros + JS
Здравствуйте, помогите пожалуйста дописать скрипт. Как сделать так, чтобы скрипт парсил все...

После обновления контента <div> через AJAX перестают работать события данного контента
Здравствуйте. Есть проблемка такого характера. На сайте выбирается студент и в поля ввода читаются...

Подгрузка контента из подгруженного контента в тот же блок :)
Здравствуйте! Подгружаю в блок контент из которого по нажатию на кнопку должна происходить...

Контента 0
Здравствуйте. Не пойму, на сайте utta.ru контента раз-два и обчелся, а по запросу &quot;ремонт квартир...

выбор контента
Здравствуйте, Уважаемые! есть такая страничка index.php: &lt;!DOCTYPE html&gt; &lt;html&gt; &lt;head&gt;...

Анализ контента
Уважаемые сеошники. Растолкуйте, пожалуйста, что означает вес слова на странице и &quot;релевантность...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Счётчик на базе сумматоров + регистров и генератора сигналов согласования.
Hrethgir 07.01.2025
Создан с целью проверки скорости асинхронной логики: ранее описанного сумматора и предополагаемых fast регистров. Регистры созданы на базе ранее описанного, предполагаемого fast триггера. То-есть. . .
Как перейти с Options API на Composition API в Vue.js
BasicMan 06.01.2025
Почему переход на Composition API актуален В мире современной веб-разработки фреймворк Vue. js продолжает эволюционировать, предлагая разработчикам все более совершенные инструменты для создания. . .
Архитектура современных процессоров
inter-admin 06.01.2025
Процессор (центральный процессор, ЦП) является основным вычислительным устройством компьютера, которое выполняет обработку данных и управляет работой всех остальных компонентов системы. Архитектура. . .
История создания реляционной модели баз данных, правила Кодда
Programming 06.01.2025
Предпосылки создания реляционной модели В конце 1960-х годов компьютерная индустрия столкнулась с серьезными проблемами в области управления данными. Существовавшие на тот момент модели данных -. . .
Полезные поделки на Arduino, которые можно сделать самому
raxper 06.01.2025
Arduino как платформа для творчества Arduino представляет собой удивительную платформу для технического творчества, которая открывает безграничные возможности для создания уникальных проектов. Эта. . .
Подборка решений задач на Python
IT_Exp 06.01.2025
Целью данной подборки является предоставление возможности ознакомиться с различными задачами и их решениями на Python, что может быть полезно как для начинающих, так и для опытных программистов. . . .
С чего начать программировать микроконтроллер­­ы
raxper 06.01.2025
Введение в мир микроконтроллеров Микроконтроллеры стали неотъемлемой частью современного мира, окружая нас повсюду: от простых бытовых приборов до сложных промышленных систем. Эти маленькие. . .
Из чего собрать игровой компьютер
inter-admin 06.01.2025
Сборка игрового компьютера требует особого внимания к выбору комплектующих и их совместимости. Правильно собранный игровой ПК не только обеспечивает комфортный геймплей в современных играх, но и. . .
Обновление сайта www.historian.b­y
Reglage 05.01.2025
Обещал подвести итоги 2024 года для сайта. Однако начну с того, что изменилось за неделю. Добавил краткий урок по последовательности действий при анализе вредоносных файлов и значительно улучшил урок. . .
Как использовать GraphQL в C# с HotChocolate
Programming 05.01.2025
GraphQL — это современный подход к разработке API, который позволяет клиентам запрашивать только те данные, которые им необходимы. Это делает взаимодействие с API более гибким и эффективным по. . .
Модель полного двоичного сумматора с помощью логических операций (python)
AlexSky-coder 04.01.2025
def binSum(x:list, y:list): s=^y] p=x and y for i in range(1,len(x)): s. append((x^y)^p) p=(x and y)or(p and (x or y)) return s x=list() y=list()
Это мы не проходили, это нам не задавали...(аси­­­­­­­­­­­­­­­­­­­­­­­­­­х­р­о­н­­н­­­ы­­й счётчик с управляющим сигналом зад
Hrethgir 04.01.2025
Асинхронный счётчик на сумматорах (шестиразрядный по числу диодов на плате, но наверное разрядов будет больше - восемь или шестнадцать, а диоды на старшие), так как триггеры прошли тестирование и. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru