Можно ли парсить/грабить чужие новости? Как отреагируют Поисковые Системы?

XanderBer

Постоялец
Регистрация
27 Янв 2017
Сообщения
54
Реакции
14
Здравствуйте, уважаемые гуру! Хочу сделать сайт-новостник, но самому вручную писать новости слишком затратно как по времени, так и по деньгам (если заказывать). Но постоянно вижу различные сайты, которые полностью копируют новости (через парсер/грабер, как я понял) и указывают лишь ссылку на источник.

Соответственно возникает вопрос, как относятся к этому поисковики? Т.к. людей очень много заходит на подобные сайты, как я вижу из статистики того же самого яндекса.

Если я создам такой сайт и буду парсить/грабить новости с других новостников, не получится ли, что в итоге забанят сайт и он просто не будет выходить в поисковиках? Или так можно сделать, но с каким-то процентом собственно-ручно написанных новостей со 100% уникальностью? Просто уже давно хочу сделать подобный сайт, но чет боюсь, что в итоге все старания и затраты на хостинг будут просто навсего потеряны из-за блокировки в дальнейшем поисковиками (ведь если такое случится - никто не будет знать о существовании моего сайта через поисковики).
 
Здравствуйте, уважаемые гуру! Хочу сделать сайт-новостник, но самому вручную писать новости слишком затратно как по времени, так и по деньгам (если заказывать). Но постоянно вижу различные сайты, которые полностью копируют новости (через парсер/грабер, как я понял) и указывают лишь ссылку на источник.

Соответственно возникает вопрос, как относятся к этому поисковики? Т.к. людей очень много заходит на подобные сайты, как я вижу из статистики того же самого яндекса.

Если я создам такой сайт и буду парсить/грабить новости с других новостников, не получится ли, что в итоге забанят сайт и он просто не будет выходить в поисковиках? Или так можно сделать, но с каким-то процентом собственно-ручно написанных новостей со 100% уникальностью? Просто уже давно хочу сделать подобный сайт, но чет боюсь, что в итоге все старания и затраты на хостинг будут просто навсего потеряны из-за блокировки в дальнейшем поисковиками (ведь если такое случится - никто не будет знать о существовании моего сайта через поисковики).

ты можешь парсить с не сильно популярных ресурсов контент, если ты очень шустро его парсишь, то есть вероятность, что поисковик твой сайт проиндексирует раньше и тогда этот контент будет закреплен за твоим сайтом, но все же так работать будет не всегда, делай сайт для людей со своим уникальным контентом
 
Соответственно возникает вопрос, как относятся к этому поисковики?
Если делать с умом, проблем не будет. Каждый новостной портал (даже топовые) тырят у друг друга новости, порой под копирку.

Если я создам такой сайт и буду парсить/грабить новости с других новостников, не получится ли, что в итоге забанят сайт и он просто не будет выходить в поисковиках?
Ответ выше.

Или так можно сделать, но с каким-то процентом собственно-ручно написанных новостей со 100% уникальностью?
Такая уникальность не у каждого профи получается. А если вспомнить про тошноту и т.д., тогда вообще пиши-пропало. Если за 75% будете выбираться, вполне нормально будет. Не забивайте голову.

давно хочу сделать подобный сайт, но чет боюсь, что в итоге все старания и затраты на хостинг будут просто навсего потеряны из-за блокировки в дальнейшем поисковиками
От этого никто не застрахован. А если не сделаете, то смысл данного сообщения не вижу.

З.Ы. У меня "белый" сайт (для людей) 10 лет жил не тужил, и потом попадает под фильтр Яндекса. Месяц нервов и пота, итог - вывел. Так что, ёжик птица гордая - пока не пнешь, не полетишь!
 
С каждым годом шанс у таки сайтов попасть в бан становится всё больше и больше. Ссылки на источник ставят из соображений ответственности за нарушение копирайта. Но, по опыту, могу сказать, что не со всеми крупными новостниками, с которых делают граббинг, можно будет договориться "по-хорошему" в случае предъявления ими Вам свои претензий. Важно внимательно изучать правила, по которым тот или иной сайт разрешает копировать свою информацию (некоторые "крупняки" только с письменного согласия разрешают). Если в дальнейшем рассчитываете зарабатывать с директ или ад сенс, то лучше делайте сайт на уникальных статьях, уже сейчас куча отказов на размещение рекламы и от яндеха, и от гугла на таких агрегаторах.
 
Если я создам такой сайт и буду парсить/грабить новости с других новостников, не получится ли, что в итоге забанят сайт и он просто не будет выходить в поисковиках?
К сожалению, поисковики не отслеживают на каком сайте впервые появился контент. Как правило, они ранжируют выдачу по "трастовости" сайта. Поэтому, нередки случаи, когда сайты с большим ТИЦ воруют контент у молодых сайтов и на этом зарабатывают.
Брать контент у более трастового сайта, чем собственный смысла не имеет.
Но, есть целая индустрия воровства у молодых сайтов. Вплоть до того, что вообще не заморачиваются с собственным контентом, а используют проксирующий софт (PHP или nginx) и на этом живут. Конечно, это не этично. Но, некоторых это не смущает (скажу сразу, что не вхожу в число тех, кто использует такие методы).
 
ты можешь парсить с не сильно популярных ресурсов контент, если ты очень шустро его парсишь, то есть вероятность, что поисковик твой сайт проиндексирует раньше и тогда этот контент будет закреплен за твоим сайтом, но все же так работать будет не всегда, делай сайт для людей со своим уникальным контентом

Если делать с умом, проблем не будет. Каждый новостной портал (даже топовые) тырят у друг друга новости, порой под копирку.

Ответ выше.

Такая уникальность не у каждого профи получается. А если вспомнить про тошноту и т.д., тогда вообще пиши-пропало. Если за 75% будете выбираться, вполне нормально будет. Не забивайте голову.

От этого никто не застрахован. А если не сделаете, то смысл данного сообщения не вижу.

З.Ы. У меня "белый" сайт (для людей) 10 лет жил не тужил, и потом попадает под фильтр Яндекса. Месяц нервов и пота, итог - вывел. Так что, ёжик птица гордая - пока не пнешь, не полетишь!

Т.е. если я правильно понял, создавать к примеру сайт-новостник, и парсить с ленты, маил ньюсь и т.п. крупных сайтов - бессмысленно, т.к. есть вероятность попасть под блокировку в любом случае? Нужно искать молодые сайты, которые как-то пытаются выкладывать новости и у них уже "тырить" со ссылкой на них и надеждой, что уникальность возможно закрепится за моим именно сайтом?
По-поводу 100% - у меня получается писать уникальные тексты без воды на 100%, порой даже обгоняю геймбомб, и уникальность за мной, а когда у них смотришь - ссылается в итоге на меня (текстру), воды не много и читать приятно. Но сейчас в работе весь, так что сложновато все это делать. Вот и задумался создать второй сайт, который будет грабить новости, а на первом только уникальный контент.
 
Т.е. если я правильно понял, создавать к примеру сайт-новостник, и парсить с ленты, маил ньюсь и т.п. крупных сайтов - бессмысленно, т.к. есть вероятность попасть под блокировку в любом случае? Нужно искать молодые сайты, которые как-то пытаются выкладывать новости и у них уже "тырить" со ссылкой на них и надеждой, что уникальность возможно закрепится за моим именно сайтом?
Не совсем так я написал ))))
Если писать уникальные тексты без воды на 100%, то проблем и так не будет.
Если стоит вопрос "тырить" (как вы выразились) новости, то тут, на мой взгляд, нужны "доверенные" ПС-ой ньюс-сайты с только что написанными новостями (если с пометкой молния, то вообще будет огонь!). Если время вашей размещенной (стыренной) новости и источника будет в районе до 1 часа (зависит от времени посещения вашего сайта ПС), чем меньше, тем лучше, то есть шанс висеть в ТОП ПС. Отсюда посещаемость и т.д. Правада есть пару НО! Ваш сайт должен быть первоначально ПС определен как СДЛ. Иначе можно попасть под фильтр.
С иных сайтов "тырить" не вижу смысла, проще отрерайтить.
 
Не совсем так я написал ))))
Если писать уникальные тексты без воды на 100%, то проблем и так не будет.
Если стоит вопрос "тырить" (как вы выразились) новости, то тут, на мой взгляд, нужны "доверенные" ПС-ой ньюс-сайты с только что написанными новостями (если с пометкой молния, то вообще будет огонь!). Если время вашей размещенной (стыренной) новости и источника будет в районе до 1 часа (зависит от времени посещения вашего сайта ПС), чем меньше, тем лучше, то есть шанс висеть в ТОП ПС. Отсюда посещаемость и т.д. Правада есть пару НО! Ваш сайт должен быть первоначально ПС определен как СДЛ. Иначе можно попасть под фильтр.
С иных сайтов "тырить" не вижу смысла, проще отрерайтить.
Опять же пара вопросов возникло))
Что означает "СДЛ"? Как проверить, определен ли он поисковиком или нет?
По-поводу времени посещения ПС моего сайта - помню где-то меняется в настройках это значение, что-то типа value, но не помню как точно называется. Случаем подсказать не можете? И на какое значение лучше всего выставить?
Что за пометка молнии? Где ее посмотреть можно?
 
СДЛ - сайт для людей. Определяется только через свой мозг. Каких-либо точных показателей ПС я не видел. Если это ПС Яндекс, то Я.Каталог.
Время посещения поисковых пауков сайта никто не знает, но его можно примерно прогнозировать. Как, например, через установку значений обновления мэп.файла (благодаря внутренней оптимизации).
"пометка молния" можно увидеть на главной странице Яндекса у новости слевой стороны. Это важная, срочная новость.
 
Можно делать так, писать пару статей своих, рерайт чужих. Набрать авторитета и разбавлять потом копипастой. Но обязательно разбавлять, на одном парсинге улетите в бан.
 
Назад
Сверху