Alexitdv
Гуру форума
- Регистрация
- 4 Янв 2008
- Сообщения
- 161
- Реакции
- 73
- Автор темы
- #1
В общем нужна помощь с идея реализации данного сабжа. Закинул сюда, так как не нашел подходящей ветки. Так, что основная реализация PHP, но можно и другие идеи 
Что уже пробовал:
1. Зеркалить сайт wget'ом и выдирать ссылки из всех файлов, удалить дубли. (коряво да wget долго тянит)
2. Как вариант можно залить сайт на локалхост и дальше пункт 1. Но все сайты так делать - умру.
3. Парсить выдачу яндекса, но тут ограничение в 1К страниц.
Нужны свежие идеи.

Что уже пробовал:
1. Зеркалить сайт wget'ом и выдирать ссылки из всех файлов, удалить дубли. (коряво да wget долго тянит)
2. Как вариант можно залить сайт на локалхост и дальше пункт 1. Но все сайты так делать - умру.
3. Парсить выдачу яндекса, но тут ограничение в 1К страниц.
Нужны свежие идеи.