Генератор составной карты сайта (т.е. sitemap index file) для CMS SIMPLA
Данная примочка позволяет расширить функциональность CMS SIMPLA, которая не умеет генирировать sitemap из нескольких файлов. Такая функция необходима для больших сайтов, когда кол-во ссылок в файле sitemap превышает 50 тыс. или размер самого файла превышает 10МБ.
Вот что написано в FAQ на sitemap.org
В: Насколько большим может быть мой Сайтмап?
Сайтмапы должны быть не больше 10МБ и могут максимально содержать 50 тыс. ссылок. Эти ограничения позволят гарантировать, что ваш веб сервер не надорвется, обрабатывая очень большие файлы. Этой значит, что если ваш сайт содержит более чем 50 тыс. ссылок или ваш Сайтмап больше чем 10МБ, вы должны создать составной Сайтмап и использовать Сайтмап индекс файл. Вы можете использовать Сайтмап индекс файл даже если у вас небольшой сайт, но планы на рост за пределы 50 тыс. ссылок или 10МБ. Сайтмап индекс файл может включать до 1000 обычных Сайтмапов и не должен превышать 10МБ. Также вы может использовать gzip, чтобы сжать свои Сайтмапы.
Q: How big can my Sitemap be?
Sitemaps should be no larger than 10MB (10,485,760 bytes) and can contain a maximum of 50,000 URLs. These limits help to ensure that your web server does not get bogged down serving very large files. This means that if your site contains more than 50,000 URLs or your Sitemap is bigger than 10MB, you must create multiple Sitemap files and use a Sitemap index file. You should use a Sitemap index file even if you have a small site but plan on growing beyond 50,000 URLs or a file size of 10MB. A Sitemap index file can include up to 1,000 Sitemaps and must not exceed 10MB (10,485,760 bytes). You can also use gzip to compress your Sitemaps.
Установка:
1. Скопировать sitemapIndex.php в корень своего веб сервера (обычно каталог www).
2. В файле .htaaccess корневого каталога изменить псевдоним sitemap.xml со стандартного sitemap.php на sitemapIndex.php
# Google sitemap^M
RewriteRule ^sitemap.xml?$<---->sitemapIndex.php [L,QSA]
3. Готово, теперь по ссылке вашсайт.ru/sitemap.xml будет генирировать Сайтмап индекс файл, а в корневом каталоге будут создаваться сами сайтмапы кусками по 50 тыс. ссылок в каждом. При каждом обращении сайтмапы и индекс файл будут генирироваться повторно.
В качестве дополнения.
В архиве лежит небольшая модификация стандартного генератора sitemap.php из Simpla 2.3.7. Модификация заставляет генератор указывать параметр lastmod не только для главной страницы сайта, но и для всех остальных страниц тоже. Записывается текущая дата. Не знаю насколько поисковики доверяют этому параметру. Но на всякий случай пусть думают, что обновления происходят ежедневно.
Для установки этой модификации нужно просто заменить стандартный файл sitemap.php.