какой размер текста индексируют поисковики(статья)

Статус
В этой теме нельзя размещать новые ответы.

olllg

Постоялец
Регистрация
17 Фев 2007
Сообщения
304
Реакции
155
нарыто в инете
Там, где останавливаются боты(из закладок)
Сообщество SEO’шников славится множеством различных мнений относительно обьема текста, индексируемого поисками на единичной web-странице.

Вопрос в том, насколько большой должна быть оптимизированая страница и где баланс между “слишком маленькой” страницей, которую поисковики сочтут неинформативной, и “слишком большой” страницей, на которой потенциально важный контент может остаться без внимания поисковиков? Насколько я знаю, еще никто не пытался ответить на этот вопрос с помощью собственного эксперимента.

Участники SEO форумов обычно ограничиваются цитированием рекоммендаций, опубликованых самими поисковиками. До сих пор святая уверенность SEO сообщества в то, что лидирующие поисковики ограничивают объем индексируемого текста пресловутой сотней килобайт, заставляет их клиентов чесать голову в попытках понять что делать с текстом, который выходит за эти рамки.

Эксперимент

Когда я решил поставить эксперимент, чтобы ответить на этот вопрос опытным путем, моими целями были:

Определить объем текста на странице, фактически индексируемого и кешируемого поисковиками.
Вычислить объем индексируемого текста, в зависимости от общего размера страницы.
Вот как проходил эксперимент. Я взял 25 страниц различного размера (от 45кб до 4151кб), ввел уникальные, несуществующие ключевые слова на каждую страницу с интервалами в 10кб (приблизительно через каждые 10000 символов (прим.пер.)). Ключевые слова генерировались автоматически, специально для эксперимента, и служили метками глубины индексации. Затем страницы были опубликованы, и я пошел сделать себе кофе, ибо ожидание прихода поисковиков обещало быть долгим....
читать далее и смотреть диаграммы здесь
 
Вот что жалко, что всего три поисковика :-]
Яшу бы не помешало проверить по этой теме. :-]

Выводы конечно, нужно детальнее проанализировать. Но по гуглу, примерно такая цифра и называлась.
Реально, не особо много страниц весом в метр, как у МСН.
 
странно, у меня гугля на инфосторе схавала текст на 900 кБ..
+ бот и тамуд в формате пдф может сьесть
 
Может и больше схавать, но Гугля, если мне не изменяет память, учитывает только первые 200 кБ странички..
 
После 200 лб Гугл не индексирует, хотя саму страницу в выдачу помещает.
 
willie
кстати, очень интересная тема,
на своем опыте видел сайты, которые гугл хавал по 1 мб на страницу.

только вот индексирует, но ссылки часто оттуда не учитывает.
были примеры сайтов с пр8 и пр7 где специально сделали помойку...
 
По моим данным размер странички не должен превышать 500кб, если перед самим текстом попадется какой-нибудь флэш на несколько мегабайт, то тогда скорее всего и сам текст не проиндексируется.
 
По моим данным размер странички не должен превышать 500кб, если перед самим текстом попадется какой-нибудь флэш на несколько мегабайт, то тогда скорее всего и сам текст не проиндексируется.
ошибаетесь.. есть у меня сайтик в шапке которого флеша на 700 кБ.
вот только что загуглил случайнеую фразу с текста.. все находит
 
  • Заблокирован
  • #9
ИМХО.не совсем корректный эксперимент ,тут много зависит от контекста и сцылок ,у меня была страничка почти 1 метр - типа магазина с товаром и прекрасно и быстро проиндексилась .Просто Гугля понимает ИМХО что это такое ... типа дор ,линкопомойка или белое и пушистое :D
 
По моим данным размер странички не должен превышать 500кб, если перед самим текстом попадется какой-нибудь флэш на несколько мегабайт, то тогда скорее всего и сам текст не проиндексируется.



это мягко говоря бред, потому что ХМТЛ файл и флешка/картинки которая там в шапке это два разных объекта. Надо мерить не вес всей страницы, а вес только ХТМЛ кода страницы.
Гугл такого кода может съесть много, несколько мегабайт, но контент находящийся выше будет иметь бОльший вес (теоритически).
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху