[Помогите!] Руглярные выражения в robots.txt

Статус
В этой теме нельзя размещать новые ответы.

OnArs

Гуру форума
Регистрация
30 Авг 2008
Сообщения
258
Реакции
74
Здравствуйте, ув. Nulled'овцы! ;)


Подскажите пожалуйста, как в robots.txt запретить URL'ы вида:
  • Neki-tekst-v-urle-m9.html

т.е. где есть
  • -m[число].html

Пробую делать вот так:
  • Disallow: /*-m(\d{2}).html
или так
  • Disallow: /*-m([0-9]*).html

Но увы, это не даёт желаемого результата.
Помогите пожалуйста! Заранее благодарен! :ay:
 
Так вроде же не поддерживаются регулярки, только '*' и '$'.
 
Хм., а как тогда быть? Как закрывать такие урлы?
 
OnArs, PHP_Master прав.
Можешь насчет синтаксиса и допустимых директив в robots.txt почитать

Разве что:
Google - первый поисковый сервер, который поддерживает в директивах регулярные выражения. Что позволяет запрещать индексацию файлов по их расширениям.
 
Хм., а как тогда быть? Как закрывать такие урлы?
Придумывать другие способы.
Да и поисковики часто смотрят страницы запрещённый в robots
 
Не совсем уверен но возможно можно с помощью rewrite переписать обращения к этим файлам так что бы они вроде как были в одной директории, и уже её закрыть от индексации. Или нет?
 
OnArs, PHP_Master прав.
Разве что:
Google - первый поисковый сервер, который поддерживает в директивах регулярные выражения. Что позволяет запрещать индексацию файлов по их расширениям.

Мне как раз от Google и нужно закрывать! ;)

Исходя из вышеописанного как решить мою проблему? :ah:
 
Клади эти урлы в одну папку и закрывай.
По другому никак.
 
Отдавай все документы с указанным именем с тегом <meta name="robots" content="noindex,nofollow">.
Если у тебя просто куча html файлов можно пройтись по ним утилитой вроде PowerGrep, и расставить теги автоматом, регуляркой.
 
Можно использовать mod_rewrite правило, которое будет действовать только для гугля:

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} googlebot [NC]
RewriteRule -m(\d+)\.html http://www.microsoft.com/$1

Бот гугля, запросивший документ, содержащий в имени "-m{число}.html" будет отправлен индексировать майкрософт =)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху