WRed
Вредный
- Регистрация
- 9 Янв 2013
- Сообщения
- 183
- Реакции
- 225
- Автор темы
- #1
Добрый день, интересуют товары таких магазинов как amazon, ali, 6pm..., а точнее возможность парсинга с них.
У многих нашел sitemap-ы, но конкретно с тремя выше перечисленными нужна помощь:
У амазона эти файлы были раньше в роботс
Но даже и сейчас скачав один из гзипов - его невозможно открыть, а основной sitemap-manual-index.xml - выдает 500-ую ошибку.
По 6pm и aliexpress - зацепок не нашел... Если кто-то проходил уже данным путем - буду благодарен любым зацепкам и наработкам.
Спасибо
------
Пара интересных статей по Amazon-у:
Для просмотра ссылки Войдиили Зарегистрируйся
Для просмотра ссылки Войдиили Зарегистрируйся
Для просмотра ссылки Войдиили Зарегистрируйся
П.С.
Второй вопрос это исходные изображения без watermark-а: многие сайты сохраняют исходные изображения, а некоторые даже не закрывают к ним доступ ).
У многих нашел sitemap-ы, но конкретно с тремя выше перечисленными нужна помощь:
У амазона эти файлы были раньше в роботс
Код:
Sitemap: http://www.amazon.com/sitemap-manual-index.xml
Sitemap: http://www.amazon.com/sitemap_vendor_videos_us.xml
Sitemap: http://www.amazon.com/sitemap_vod_index.xml
Sitemap: http://www.amazon.com/sitemaps.f3053414d236e84.SitemapIndex_0.xml.gz
Sitemap: http://www.amazon.com/sitemaps.1946f6b8171de60.SitemapIndex_0.xml.gz
Sitemap: http://www.amazon.com/sitemaps.bbb7d657c7e29fa.SitemapIndex_0.xml.gz
Sitemap: http://www.amazon.com/sitemaps.11aafed315ee654.SitemapIndex_0.xml.gz
Sitemap: http://www.amazon.com/sitemaps.c21f969b5f03d33.SitemapIndex_0.xml.gz
По 6pm и aliexpress - зацепок не нашел... Если кто-то проходил уже данным путем - буду благодарен любым зацепкам и наработкам.
Спасибо
------
Пара интересных статей по Amazon-у:
Для просмотра ссылки Войди
Для просмотра ссылки Войди
Для просмотра ссылки Войди
П.С.
Второй вопрос это исходные изображения без watermark-а: многие сайты сохраняют исходные изображения, а некоторые даже не закрывают к ним доступ ).