Ну по-ходу ничего сложного, главное правильно поставить условие задачи.
Способом море. Можно, например, искать ключевые фразы в контенте и самые популярные выкидывать в кэйворды и метатэги.
Можно сделать еще веселее: взять базу самых популярных запросов яндекса ,например, искать в них свои ключевые фразы и сравнивать по порогу срабатывания.
Ну например:
Запросы яндекса:
страхование в России
перевезти груз
преподавание языков
наши выбранные из контекста ключевые слова:
страхование, груз, язык оно должно поменять на мэта тэги:
страхование = "страхование в Росси"
груз= "перевезти груз"
язык = "преподавание языков,английски язык ..."
алгоритмов нечеткого сравнения строк масса.
Очистить текст от тэгов и выбрать самые частые слова и фразы, дело тоже простейшее.
P.S. да, насчет 13К и небольшого это весело.
Хотя, догадываюсь, реального контента там страниц на 40-50, остальное что-то другое.