Парсер Datacol

APSALIM

Постоялец
Регистрация
28 Фев 2013
Сообщения
131
Реакции
95
Datacol - парсер для любых сайтов
Скрытое содержимое доступно для зарегистрированных пользователей!


Связанные темы:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скрытое содержимое доступно для зарегистрированных пользователей!
 
Прошу помощи!
Требуется спарсить категории, такого вида: Для просмотра ссылки Войди или Зарегистрируйся»Для просмотра ссылки Войди или Зарегистрируйся»Для просмотра ссылки Войди или Зарегистрируйся»Для просмотра ссылки Войди или Зарегистрируйся
Если ставлю вырезать теги, то получаю при тесте
Главная
» Средства оздоровления
» Средства Аюрведы
» Капли

По факту получаю только: Главная

xpath //div[@class='cpt_product_category_info']

А в конечном итоге на выходе требуется получить: Средства оздоровления///Средства Аюрведы///Капли
Попробуйте xpath //table[@class='cat_path_in_productpage']//a и поле сделайте статическое, поставьте разделитель ///
 

Вложения

  • Аюрведа Шоп-copy-copy.zip
    5,6 KB · Просмотры: 2
Прошу помощи!
Требуется спарсить категории, такого вида: Для просмотра ссылки Войди или Зарегистрируйся»Для просмотра ссылки Войди или Зарегистрируйся»Для просмотра ссылки Войди или Зарегистрируйся»Для просмотра ссылки Войди или Зарегистрируйся
Если ставлю вырезать теги, то получаю при тесте
Главная
» Средства оздоровления
» Средства Аюрведы
» Капли

По факту получаю только: Главная

xpath //div[@class='cpt_product_category_info']

А в конечном итоге на выходе требуется получить: Средства оздоровления///Средства Аюрведы///Капли
xpath //a[@class="cat"] Тип поля статическое --> строка объединения ///
Далее можешь сделать замену "Главная" на пустое
 
xpath //a[@class="cat"] Тип поля статическое --> строка объединения ///
Далее можешь сделать замену "Главная" на пустое
Прямо праздник какой то!!!!
Супер! Все получилось!! Благодарю!
 
Скрытое содержимое доступно для зарегистрированных пользователей!
 
Помогите плз с XPath
есть такое выражение

Код:
//span[contains(@class, 'b-pseudo-link address_map_popup_link_')][contains(text(),'Компания из ')]

Надо чтобы оно цепляло не только ссылки со словами типа "Компания из Одинцово" но и
"Филиал в Москве, компания из Казани"
 
Так задайте несколько xpath, если не найдено то Датакол переходит к другому xpath
//span[contains(@class, 'b-pseudo-link address_map_popup_link_')][contains(text(),'Компания из')]
//span[contains(@class, 'b-pseudo-link address_map_popup_link_')][contains(text(),'Филиал в')]
 
Скрытое содержимое доступно для зарегистрированных пользователей!


Подскажите плз, почему на этой странице, по данному селектору не получаются телефоны.

Код:
/div/div/div/div/div/span/span/span/span/span/span/span

Селектор указывает на нужные элементы но данные не собирает.
Пытался сравнить настройки поля для стандартной компании по сбору контактов, но разницы никакой не нашел...

Вот для этой страницы, та же вроде история.
Скрытое содержимое доступно для зарегистрированных пользователей!


Код:
//div/div/div/div/div/div/div/div/div/div/span/span/span/span/span/span/span
И телефон считывается как и должен.
В чем же разница...
 
два слеша в начале //
 
Назад
Сверху