Хочется поговорить о правильном robots.txt

Статус
В этой теме нельзя размещать новые ответы.
У меня сортировка имеет вид: ?orderby=price&orderway=desc
Как правильно закрыть от индексации? Ето ведь дубль?
Исходя из логики страницы поиска тоже дублируют контент?
Код:
disallow: /*orderby=
disallow: /*orderway=
Проверить robots.txt можно тут
Для просмотра ссылки Войди или Зарегистрируйся
 
А чего ж их в поиске нет ни одной уже почти месяц как?
Yandex может и больше индексировать. Также он очень критичен к плагиату и, судя по хэлпу Для просмотра ссылки Войди или Зарегистрируйся заполнение метатегов для картинок обязательно. На рисунок без текста он, похоже, не реагирует.
 
Yandex может и больше индексировать. Также он очень критичен к плагиату и, судя по хэлпу Для просмотра ссылки Войди или Зарегистрируйся заполнение метатегов для картинок обязательно. На рисунок без текста он, похоже, не реагирует.
Мда, интересно, получается, что по рекомендациям Яндекса, title и alt должны совпадать. Я полагал иначе...

По картинкам решил подстраховаться и сделал вот такие правила:
Allow: /images/stories/
Allow: /images/slideshow/
Allow: /images/resized/
Disallow: /images/
Только в этих 3 папках могут лежать мои картинки, которые было бы неплохо индексировать.
Остальные папки в images относятся к демо-данным и шаблонной графике.
Поглядим...
 
Мда, интересно, получается, что по рекомендациям Яндекса, title и alt должны совпадать. Я полагал иначе...
Я видимо что-то упустил, откуда такие выводы? В той же Для просмотра ссылки Войди или Зарегистрируйся говорится:

Атрибут alt — это альтернативный источник информации для пользователей, у которых показ изображений в браузере отключен.
Атрибут title предоставляет дополнительную информацию о картинке.

Можете ссылку скинуть?
 
На той же странице Яндекса приведен пример (картинка "Предположительный портрет Леонардо да Винчи"). Так вот, на ее примере и alt, и title равен "Предположительный портрет Леонардо да Винчи". То есть идентичен.
 
На той же странице Яндекса приведен пример (картинка "Предположительный портрет Леонардо да Винчи"). Так вот, на ее примере и alt, и title равен "Предположительный портрет Леонардо да Винчи". То есть идентичен.
можно одинаковые alt и title, а можно разные, alt - обязательно нужен, а попадают картинки в индекс долго, месяца три может пройти
 
Хочу совета: воевал с ЧПУ неделю, в итоге получил-таки красивые УРЛы.
Все, они больше не поменяются, а значит, надо настраивать исключения в robots.txt.
Итак, я считаю совсем ненужными для индексации:
- страницы о заказах в VM - теперь они все у меня идут с Для просмотра ссылки Войди или Зарегистрируйся.......
Значит, правильным правилом будет такое?
disallow: /orders/[/spoil]
- страницы корзины VM - соответственно, Для просмотра ссылки Войди или Зарегистрируйся.........
Значит, так?
[spoil]disallow: /cart/[/spoil]
- страницы аккаунтов - Для просмотра ссылки Войди или Зарегистрируйся........
[spoil]disallow: /moya-korzina/
Плюс к тому, по-прежнему непонятно, что делать с поиском. УРЛы там почему-то не хотят становиться ЧПУ, да и черт с ними. Они имеют такой вид:
Для просмотра ссылки Войди или Зарегистрируйся
Какое правило делать? Для просмотра ссылки Войди или Зарегистрируйся вот именно "2578" и был мой поисковый запрос в данном примере. Значит, может, как-то слово keyword исключать в роботсе?
 
- страницы о заказах в VM - теперь они все у меня идут с Для просмотра ссылки Войди или Зарегистрируйся.......
Значит, правильным правилом будет такое?
disallow: /orders/[/spoil]
- страницы корзины VM - соответственно, Для просмотра ссылки Войди или Зарегистрируйся.........
Значит, так?
[spoil]disallow: /cart/[/spoil]
- страницы аккаунтов - Для просмотра ссылки Войди или Зарегистрируйся........
[spoil]disallow: /moya-korzina/
Плюс к тому, по-прежнему непонятно, что делать с поиском. УРЛы там почему-то не хотят становиться ЧПУ, да и черт с ними. Они имеют такой вид:
Для просмотра ссылки Войди или Зарегистрируйся
Какое правило делать? Для просмотра ссылки Войди или Зарегистрируйся вот именно "2578" и был мой поисковый запрос в данном примере. Значит, может, как-то слово keyword исключать в роботсе?

Да, всё верно в строках роботса в спойлере.
По поводу поиска:
disallow: /*keyword=

И еще раз повторюсь - ниже по ссылке можно проверить свой файл robots.txt вводя нужные и ненужные для индексации страницы и проверяя результат.
Для просмотра ссылки Войди или Зарегистрируйся
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху