lordBlack
Мой дом здесь!
- Регистрация
 - 29 Ноя 2007
 
- Сообщения
 - 623
 
- Реакции
 - 267
 
- Автор темы
 - #1
 
замучалсо...
Как сделать парсер description keywords любого сайта?
вообщем для title решение нашел:
	
	
	
		
библиотеки взяты тут:
но парсится только именно тег ТИТЛ
а я хочу description keywords и т.д.
сложностей три:
1. декрипшн и кейвордс не отдельный тег, а метатег
<meta name="description" content="Описаловы" />
2. часто или даже очень часто двойные кавычки бывают одинарными типа
<meta name='description' content='описаловы' />
3. кодировко utf8, cp1251, koi8... но тут я вроде решение нашел унифицирования вывода...
помогите парсер дописать парни.... или есть более простое решение мейби?
	
		
			
		
		
	
				
			Как сделать парсер description keywords любого сайта?
вообщем для title решение нашел:
		PHP:
	
	<?php
//Подключаем фаил с реализацией парсера. Этот файл находиться в архиве на офсайте
require 'simplehtmldom/simple_html_dom.php';
//Открываем html документ 
$html = file_get_html('http://сайт.ру.ru');
//используя при этом функцию find. Данная функция возвращает массив найденыых элементов
//Так если нужно получить все заголовки h2 с классом art-PostHeader, то сделать это можно так 
foreach ($html->find('title') as $g) 
  echo $g->plaintext . '
';  
?>
	
	Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.
но парсится только именно тег ТИТЛ
а я хочу description keywords и т.д.
сложностей три:
1. декрипшн и кейвордс не отдельный тег, а метатег
<meta name="description" content="Описаловы" />
2. часто или даже очень часто двойные кавычки бывают одинарными типа
<meta name='description' content='описаловы' />
3. кодировко utf8, cp1251, koi8... но тут я вроде решение нашел унифицирования вывода...
помогите парсер дописать парни.... или есть более простое решение мейби?
				