lordBlack
Мой дом здесь!
- Регистрация
- 29 Ноя 2007
- Сообщения
- 623
- Реакции
- 267
- Автор темы
- #1
замучалсо...
Как сделать парсер description keywords любого сайта?
вообщем для title решение нашел:
библиотеки взяты тут:
но парсится только именно тег ТИТЛ
а я хочу description keywords и т.д.
сложностей три:
1. декрипшн и кейвордс не отдельный тег, а метатег
<meta name="description" content="Описаловы" />
2. часто или даже очень часто двойные кавычки бывают одинарными типа
<meta name='description' content='описаловы' />
3. кодировко utf8, cp1251, koi8... но тут я вроде решение нашел унифицирования вывода...
помогите парсер дописать парни.... или есть более простое решение мейби?
Как сделать парсер description keywords любого сайта?
вообщем для title решение нашел:
PHP:
<?php
//Подключаем фаил с реализацией парсера. Этот файл находиться в архиве на офсайте
require 'simplehtmldom/simple_html_dom.php';
//Открываем html документ
$html = file_get_html('http://сайт.ру.ru');
//используя при этом функцию find. Данная функция возвращает массив найденыых элементов
//Так если нужно получить все заголовки h2 с классом art-PostHeader, то сделать это можно так
foreach ($html->find('title') as $g)
echo $g->plaintext . '
';
?>
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.
но парсится только именно тег ТИТЛ
а я хочу description keywords и т.д.
сложностей три:
1. декрипшн и кейвордс не отдельный тег, а метатег
<meta name="description" content="Описаловы" />
2. часто или даже очень часто двойные кавычки бывают одинарными типа
<meta name='description' content='описаловы' />
3. кодировко utf8, cp1251, koi8... но тут я вроде решение нашел унифицирования вывода...
помогите парсер дописать парни.... или есть более простое решение мейби?