• DONATE to NULLED!
    Вы можете помочь Форуму и команде, поддержать финансово.
    starwanderer - модератор этого раздела будет Вам благодарен!

Помощь Работа с wpt

Статус
В этой теме нельзя размещать новые ответы.

4ip

Регистрация
29 Ноя 2008
Сообщения
173
Реакции
2
В общем решил заняться созданием сателитов по серьезному, приобрел wpt. Но дело в том что wpt верстает сайт из html файла.

Так вот я скачал один сайт офлайн эксплоером и получилось пачка html файлов из отдельных страниц, а нужна одна html как подскажите решить задачу.

Заранее сенк
 
В общем попробовал Тоталом, переименовал файлы, обьединил. Получился один мутноватый хтмл файл.
Попробовай его запихнуть в wpt так тот не смог его открыть сказал что файл с ошибками.
Для эксперемента открыл этот файл фришным такст китом,так тот смог открыть, только на выходе получилось много левых страниц.

Еще надо попробовать прожку TXTcollector, только скорее всегонужен какой-то грамотный пасер, который бы выдирал только статьи с картинками, или хотябы просто большие куски текста, а обьеденить все это в один файл тоталом не проблема.

В общем кто знает прожку которая это может подскажите, заранее сенк
 
В общем попробовал Тоталом, переименовал файлы, обьединил. Получился один мутноватый хтмл файл.
Попробовай его запихнуть в wpt так тот не смог его открыть сказал что файл с ошибками.
Для эксперемента открыл этот файл фришным такст китом,так тот смог открыть, только на выходе получилось много левых страниц.
Еще надо попробовать прожку TXTcollector, только скорее всегонужен какой-то грамотный пасер, который бы выдирал только статьи с картинками, или хотябы просто большие куски текста, а обьеденить все это в один файл тоталом не проблема.
В общем кто знает прожку которая это может подскажите, заранее сенк
Не забывай еще что в wpt - разделы должны быть заключены в теги h1, а заголовки статей в h2. Возможно этого не хватает.
 
Не забывай еще что в wpt - разделы должны быть заключены в теги h1, а заголовки статей в h2. Возможно этого не хватает.

Я в курсе, как готовить контент под wpt, на сайтах как правило заголовки и так в h1, если что и расставить их не сложно, дело в том чтобы правильно напарсить текст из сайтов
 
В общем проблема еще не решена.
Приблизительно разобрался что мне нужно.
Нужен парсер который бы вытягивал текст из сайтов, просто большие куски текста, без тегов, например от 1к символов, и сохранял это в одно тхт-шку.

По форуму лазил пока ниче не нашел, хвалят офлайн эксплоер, но он сохраняет целые страницы а мне нужен только текст со страниц, и желательно без тегов. Есть куча платных, который чуть ли ни весь сайт верстают и заливают на хост. Но мне нужен просто парсер текста, поидее он не должен быть сложный, подскажите, буду премного благодарен.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху