Борьба с парсингом сайтов

gts

Профессор
Регистрация
12 Сен 2010
Сообщения
270
Реакции
43
Как можно запретить вытягивание с сервера страниц и скриптов через file_get_contents?
 
Как можно запретить вытягивание с сервера страниц и скриптов через file_get_contents?

У вас соседи вытягивают или некто и вы предполагаете, что это происходит с использованием file_get_contents?

Добавлено через 1 минуту
 
Я обычно проверял так

Если пустой User agent то сайт ничего не выводит либо делает редирект

Если IP адрес принадлежит серверу или какому либо хостингу то баню, ну кроме конечно IP адресов легальных ботов яндекса гугла (проверять по whois!)

Обычно парсят не из домашней сети, а с какого либо хостинга, так что тут лучше всего анализировать whois IP адресов
 
Как можно запретить вытягивание с сервера страниц и скриптов через file_get_contents?
Как выше уже говорилось, можно проверить User agent, можно пробить в whois, можно придумать еще 100500 вариантов проверки. Но контент всегда воровали, воруют и воровать будут. Потому лучше усилия направить в другое - конструктивное русло, а не морочиться с запретами. И последнее - если Вас парсят, значит Вас читают и Вы кому-то интересны. А это однозначно - позитивно :)
 
gres_18, один раз подобные "позитивщики" сперли дизайн вместе со счетчиками - узнал когда увидел заходы на свой сайт... на неродном домене )))
 
Назад
Сверху