Парсер Datacol

APSALIM

Постоялец
Регистрация
28 Фев 2013
Сообщения
131
Реакции
95
Datacol - парсер для любых сайтов
Скрытое содержимое доступно для зарегистрированных пользователей!


Связанные темы:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скрытое содержимое доступно для зарегистрированных пользователей!
 
Подскажите кто как разбивает характеристики в datacol5. В 7 есть "плагин расфасовки по колонкам (плагин обработки данных перед экспортом)", может есть похожее решение для datacol5. Если нету то кто как разбивает?
С помошью строки вырезания, выдели нужныйый участок, (.*?) -поставь на значение которое нудно спарсить. А Название оставь.
Пример

Производитель: (.*?)
 
Доброго времени суток!
Подскажите два моментика, требуется получить урлы для картинок и в стоимость чтобы дописывалось .00
Благодарю за помощь
.00 в заменах нужно сделать.

А картинки на каждый сайт индивидуальный код надо вписать
 
.00 в заменах нужно сделать.

А картинки на каждый сайт индивидуальный код надо вписать
Для просмотра ссылки Войди или Зарегистрируйся
Пользую помощник //img[@id='img-current_picture'] и забирает мелкие картинки, а этим //img[@class='highslide-image'] вообще не хочет((
 
C заменами разобрался! Благодарю!
Поставил как новое значение вместо валют
 
Для просмотра ссылки Войди или Зарегистрируйся
Пользую помощник //img[@id='img-current_picture'] и забирает мелкие картинки, а этим //img[@class='highslide-image'] вообще не хочет((

Используй "строки вырезания" я всегда им пользуюсь.
Найди к коде страницы ссылки на картинку и ставь(.*?) потом с помощью замен создай полную ссылку на картинку
 
С помошью строки вырезания, выдели нужныйый участок, (.*?) -поставь на значение которое нудно спарсить. А Название оставь.
Пример

Производитель: (.*?)
Это мне понятно как делается, но если в характеристиках более 10 параметров и у каждого товара они разные, не вбивать же мне 100 характеристик не искать их по более 10000 товарам.
 
Создаю шблон в regex вот такого вида
<a[^<>]*?target="_blank"[^<>]*?onclick="return[^<>]*?hs\.expand\(this\)"[^<>]*?href=["'][^<>]*?["'][^<>]*?img_width="343"[^<>]*?img_height="630">
но он парсит только картинку именно с этой страницы с которой взят, убираю параметры размеров, не парсит...
покурил мануал вот пока только до этого допер
 
Кто может подсказать, как спарсить цены с данной страницы сайта Для просмотра ссылки Войди или Зарегистрируйся
В коде, цена вставлена в java скрипт, получится как то вытащить с помощью datacol 5.54?
С помощью Content Downloader 1x получилось вытащить, но только одну цену.

То что удалось спарсить:
1)Название
2)Бренд
3)Страна производитель
4)Год создания
5)Пол
6)Группы
7)Базовые ноты
8)Средние ноты
9)Верхние ноты
* Приведено на одном из скриншотов.
 

Вложения

  • 2016-06-22_14-45-45.png
    2016-06-22_14-45-45.png
    248,4 KB · Просмотры: 24
  • 2016-06-22_14-50-13.png
    2016-06-22_14-50-13.png
    85,9 KB · Просмотры: 15
Последнее редактирование:
Нужна помощь в настройке парсера!
Надо спарсить сайт с несколькими уровнями категорий!
Не могу разобраться!

Пишите в личку.
 
Создаю шблон в regex вот такого вида
<a[^<>]*?target="_blank"[^<>]*?onclick="return[^<>]*?hs\.expand\(this\)"[^<>]*?href=["'][^<>]*?["'][^<>]*?img_width="343"[^<>]*?img_height="630">
но он парсит только картинку именно с этой страницы с которой взят, убираю параметры размеров, не парсит...
покурил мануал вот пока только до этого допер

<a target=".*?" onclick=".*?" href='/published/publicdata/AYURVE38SHOP/attachments/SC/products_(.*?)' в группах поставь 1

в заменах пропиши pictures/ на Для просмотра ссылки Войди или Зарегистрируйся

галочку не забудь поставить и все)
 
Назад
Сверху