Оптимизация файла .htaccess (слишком много Redirect 301)

Smart.Support

Постоялец
Регистрация
22 Авг 2012
Сообщения
99
Реакции
9
Всем привет.

Сегодня, приводил один из старых проектов в порядок и столкнулся с такой ситуацией: сайт очень старый и большой (фактически каталог товаров на 2500+ товаров). В связи с тем что старый, несколько раз был переезд между версиями систем управления и как результат - смена части URLов.

Для того что бы не потерять вес страниц, ну и что бы не было 404 ошибок, логично было сделать из старого URL в новый 301 Redirect. И так два переезда.

На сегодня у меня файл .htaccess весит порядка 60 кб, и содержит в себе где-то около 300-400 редиректов.

Вопрос: сталкивался ли кто-то с сервисами, программами или технологиями, как можно все таки проверить актуальность редиректов? Может в этой куче есть двойные редиректы? Может есть которые уже давно не нужны ...
Как и чем проверить, оптимизировать и удалить лишние?
 
Редиректы с 1-го переезда скорее всего можно убрать, если только на старые страницы нет входящих ссылок. Задача выходит в 2 этапа - собрать все беки сайта, проверить какие из них идут на старые URL, с них редиректы оставить, все остальное маст дай.
 
Делал переезд сайта с вируимарта джумловского на виртуимарт джумловский (но на новый), пришлось написать немаленький файлик переадрессации. Файл .htaccess весит 45 килобайт и содержит 409 строк :)
Сервисов я не встречал, всё делал вручную + парсером, работа обезьянья, но по-другому сделать не мог.

Вообще можно взять урлы, на которые идут редиректы и прочекать их любым на ответ сервера - если ответ сервера 200, значит страница жива и правило остается в живых. Тем более, что количество редиректов вменяемое...

PS:
 
Последнее редактирование:
Редиректы с 1-го переезда скорее всего можно убрать, если только на старые страницы нет входящих ссылок. Задача выходит в 2 этапа - собрать все беки сайта, проверить какие из них идут на старые URL, с них редиректы оставить, все остальное маст дай.
Спасибо за совет! Сейчас весь мусор почищу из сапы и скорее всего так и сделаю.

Вообще можно взять урлы, на которые идут редиректы и прочекать их любым на ответ сервера - если ответ сервера 200, значит страница жива и правило остается в живых. Тем более, что количество редиректов вменяемое...
Не совсем понял, если я буду проверять ссылку старую, с корой идет редирект, то она будет не 200 а 301 ответ давать. Ну и жива или нет, поможет решить только проблему 404 ошибки. А вот с передачей веса, тут походу только ручной режим.

Кстати, мне одна компания которая "раскручивала" один из сайтов, который достался теперь мне, говорили что они могут написать скрипт, который оптимизирует файл htaccess. Но в связи с тем, что они загнали сайт под "ручные меры" и 30% падение трафика за 3 месяца - были посланы, и скрипт я так и не получил ... :( То есть видимо, все таки есть скрипты, которые могут в автоматическом режиме провести аудит. Пока буду думать.
 
Не совсем понял, если я буду проверять ссылку старую, с корой идет редирект, то она будет не 200 а 301 ответ давать.
Я имел в виду чекать не "с которой" идёт редирект, а "на которую"...
 
Вопрос: сталкивался ли кто-то с сервисами, программами или технологиями, как можно все таки проверить актуальность редиректов? Может в этой куче есть двойные редиректы? Может есть которые уже давно не нужны ...
Как и чем проверить, оптимизировать и удалить лишние?

распарсить лист редиректов, сравнить. можно привязаться к canonical url если есть, либо к другому url целевой страницы в коде, попутно выпарсить заголовки, чтобы 404 и прочее отсеять.
чем - content downloader справится.
 
Назад
Сверху