Mendel
Гуру форума
- Регистрация
- 27 Янв 2008
- Сообщения
- 215
- Реакции
- 65
ну в обоих вариантах МОЖНО делать многопоточность, но...Ок, такой пример, у тебя есть 500 кил урлов, которые нужно проверить на 200-ю, вообщем нужны одни заголовки
второй пример - ту же базу нужно проверить на количество страниц в индексе
Нужна ли здесь многопоточность? мне кажется да, возможно я и не прав.
Как бы ты поступил в таких задачах?
на нормальном канале проверить 500к на 200 это будет сутки-двое без многопоточности... imho такие задачи вполне позволяют подождать сутки-двое. Всетаки не каждые 5 минут проверять то хотя безусловно есть варианты, но... пляски с грамотной пропиской многопоточности, перекомпиляцией php и прочего...
с вопросом проверки индексации.. да при стандартном подходе никуда не деться от многопоточности... но есть несколько хитростей
вопрос в том где брать много ip
палю тему - внимательно читаем мой предидущий пост.
к сожалению прямым текстом не скажу - если все будут знать то тему прикроют. А хайд это несправедливо... кто умный тот пусть и пользуется....
теперь когда у нас есть ip мы их есно распределенно используем... скажем на каждом хосте по ...много ip по которым curl-ом делаем запросы к поисковику.
тогда мы имеем наш основной скрипт, который передает через get скажем 10-20 ссылок которые нам надо проверить, но мы просто открываем файлхендл на удаленный файл со ссылкой содержаший параметры...
т.е. какв прошлом моем посте было сказано - мы открываем десяток урлов. которые там себе парсят с десятка ip ... ведь скрипт начнет выполняться когда мы только сделаем запрос... а на нашей стороне мы в то время пока он парсит не ждем, а открываем промежуточные парсеры на других хостах... ну а потом промежутки нам возвращают только результат, что намного меньше чем чекать все это локально.
еще раз - объединение двух идей из предидущего поста дает нам и ip-шники, и "псевдомногопоточность".
хотя конечно можно покупать ip или прокси пачками и парсить постаринке... тогда от многопоточности никуда.
тебе не кажется что жава это немного не php...Это означает, что такой пхп не будет работать в много поточных серверах как модуль.
Зачем такое писать вообще на ПХП?
Сейчас можно писать на чём, то удобном и запускать на домашнем компе. Или если нет дешевого домашнего инета то на ВПС.
Я бы парсер писал бы на джава. Там есть тридс и супер штука для скачивания.
Для просмотра ссылки Войдиили Зарегистрируйся
И такая прога будет работать везде.
блин, вот изза таких как ты, я и не пользуюсь хайдами. а только намеками...
Сказано же - не хочет чел учить другие языки. Нет надо пропихнуть свой недоязык...