Что происходит с контеном сайта после АГС?

думаю спамм - не сохраняется, те страницы, что автоматом фильтр отсеял не нужно сохранять, т.к. при повторном его добавлении - он снова вылетит из-за фильтров.
Ну вот опять... Где граница между спамом и например просто не качественным текстом, для примера возьмем банальный скан с кучей технических символов.
 
Выходит, что Яндекс должен хранить у себя на серверах абсолютно все текста, даже то запредельное количество которое за последние *цать лет наклепали многоуважаемые дорвейщики? Сомнительно как-то...
Дорвейный бредотекст фильтруется на автомате, нет смысла хранить данные о нем. По поводу контента с сайтов под АГС - есть предположение, что некоторое время текст хранится в базе поисковика, затем удаляется и можно вновь пользоваться им. Вот только через какое время он удаляется - большой вопрос.
 
Ну вот опять... Где граница между спамом и например просто не качественным текстом, для примера возьмем банальный скан с кучей технических символов.
Сначала яндекс оценивает сайт, потом текст.
Смотрит тематику и на основании коллокаций уже может делать разные выводы. Либо это действительно технический текст, либо это бредотекст. Они год назад купили мощную систему работающую с лингвистической составляющей языка. Думаю распознать текст не будет проблемой..
однако дорвеи еще иногда попадаются на глаза)
 
Еще в 2008 году перенеся старый сайт на новый домен тут же попал под АГС, даже не смотря на то, что пошел не один месяц. Не думаю, что яндекс настолько туп, что бы дать возможность использовать повторно контент с АГС сайтов
 
Парирую. Я таскал контент с сайтов под АГС, но уже с тех, чей след простыл. И вполне себе нормально всё было, фильтр никоим образом не перекладывался на ресурс, для которого парсилось :)
 
А как узнать, что такой-то сайт по АГС?
 
Не хранит Яндекс у себя весь этот контент с зафильтрованных сайтов. Глупость это.
Сам фильтр этот был придуман именно для того, чтобы облегчить жизнь ПС и не хранить у себя кучу ненужного (по их мнению) хлама. Да и банально нет смысла ПС в хранении этом, только зря серверы (которые недешево стоят кстати) занимать.

По поводу использования этого контента - подождать пока вылетит из кэша и вперёд. Но не стоит забывать, что АГС схватил сайт не просто так. Достаточно большая вероятность, что контент с точки зрения ПС плохой и, соответственно, скопировав его своему же сайту хуже сделаете.
 
Назад
Сверху