[Скрипт] Собственный поисковик

Статус
В этой теме нельзя размещать новые ответы.
кто-нибудь пробовал OpenWebSpider
_http://www.openwebspider.org/
 
поисковики ....

что значит mail.ru юзает то гугля то яндекса = у них раньше был поиск основаный на индексе яндекс, а теперь у них собственный поисковый проект = GoGo.ru
 
только надо учитывать то что не все сайты хостятся ИМЕННО в том регионе в котором находятся...
скажем, фирма в москве, а сервак в германии... получатеся дискриминация :)

кстати sphider - супер штука! но в ней есть одно НО, русские utf-8 сайты не воспринимает... но... iconv никто не отменял, а идентификатор кодировки там благо встроен ;)

Вы можете объяснить это в деталях? имею ту же самую проблему
 
а зачем нужен собственный поисковик? поисковиков как грязи в инете
Имхо имеет смысл, если индексировать только конкретный набор сайтов (например, 20-100 своих и 10-20 других тематических регулярно пополняемых сплогов и т.п.) по узкой тематике. По идее, должно выйти что-то типа "белого дора"... А вот сколько это съест ресурсов... хз...
DOLARiON написал(а):
кстати sphider - супер штука!
На первый взгляд тоже понравился... Я так понимаю, что он позволяет реализовать то, о чем я говорю. Попробую... Интересно, как к этому поисковики отнесутся... :nezn:
 
Вопрос к знающим. Если с помощью sphider сделать поиск, например рефератов по соответствующим сайтам, то потянет ли его какой-нибудь хостинг, сколько места надо будет, денег))? Или лучше другой какой скрипт посоветуете?
 
gorynych
У меня собственный поисковик на основе этого движка.Честно места нужно просто уйма.5 проиндексированых сайтов занимают около 56 мб в Базе Данных.Выводы делай соответствующие...
beldvd
Движок кстати один из лучших из всех мной пробованых.Функции Гугла, которые в него встроены мне очень понравились:)
 
gorynych
У меня собственный поисковик на основе этого движка.Честно места нужно просто уйма.5 проиндексированых сайтов занимают около 56 мб в Базе Данных.Выводы делай соответствующие...
А какой у тебя сервак, как долго индексируюется один сайт?
 
gorynych
Сервак на Для просмотра ссылки Войди или Зарегистрируйся
Индексация сайта зависит от указанной глубины и наполнения .Если будешь индексировать сайт майкрософт, то соответственно половина дня уйдет на то дело.А так около 15-20 минут на средний сайт.
 
gorynych
У меня собственный поисковик на основе этого движка.Честно места нужно просто уйма.5 проиндексированых сайтов занимают около 56 мб в Базе Данных.Выводы делай соответствующие...
Ну это не слишком страшно, имхо... Средней руки виртуальный хост дает много больше. Тут, по моему, больше актуальна нагрузка на сервер и стабильность мускуля на хосте.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху