Парсер Datacol

APSALIM

Постоялец
Регистрация
28 Фев 2013
Сообщения
131
Реакции
95
Datacol - парсер для любых сайтов
Скрытое содержимое доступно для зарегистрированных пользователей!


Связанные темы:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скрытое содержимое доступно для зарегистрированных пользователей!
 
Кто-то пробовал генерировать компании для datacol с помощью внешних скриптов?
По виду компания представляет из себя xml файл с настройками.
Думаю использовать для генерации кампаний скрипты на php изменяя в шаблоне параметры начальных url, списка прокси и пути для сохранения файлов.
Хочу бы полностью автоматизировать процесс от создания компании, добавления её в планировщик и получения результатов.
Если получится генерировать в кампаний начальный для каждой страницы, то для моих целей хватит даже бесплатной версии программы где есть возможность сохранять 25 результатов.
 
Последнее редактирование:
Кто знает как настроить не скачивания изображений товара, а получения ссылок на фото товара с выгрузкой в файл?
Облазил уже все настройки не могу въехать как это сделать
 
Кто знает как настроить не скачивания изображений товара, а получения ссылок на фото товара с выгрузкой в файл?
Облазил уже все настройки не могу въехать как это сделать
В настройках кампании, вкладка сбор данных, поля данных, нужное нам поле (например фото), вырезаем с помощью XPATH вырезания или Строк вырезания (регулярные выражения например src="(.*?)" ) относительные пути изображений товара, потом во вкладке замены с помощью замен меняем относительные пути на абсолютные (например /img/ меняет на хттпДля просмотра ссылки Войди или Зарегистрируйся_сайта.ru/img/), ну а дальше или прямо так ссылку сохранять или выкачивать файл на вкладке Загрузка файлов и настроить папку для сохранения..
 
Последнее редактирование:
Подскажите Content Downloader закешировал старый код страницы, каким способом или где удалить??
 
Подскажите Content Downloader закешировал старый код страницы, каким способом или где удалить??
кеш программы в настройках,по картинке, кеш браузера при работе WBApp чистите cceaner
кэш.jpg
 
datacol-17.5.zip выложенный тут в работе кто проверял?
 
С авито берёт только одну главную картинку, ломаю голову как бы все взять..
 
Кто в 7ке яндекс маркет парсил? Можете скинуть настройки?

Тема размещена в другой ветке
Для просмотра ссылки Войди или Зарегистрируйся
Вопрос такой: можно генерить выходной файл по образцу?
 
Последнее редактирование модератором:
Кто знает, Datacol в виртуальной машине запускается?
 
Назад
Сверху