У меня есть сайт, которого нет в ЯК, но тематика его определяется (типа говорят есть скрытая часть ЯК каталога). Скорее всего для сайтов, которые нет ни там ни там - тематика тоже как-то определяется примерно автоматически, так как алгоритмы классификации и кластеризации уже давно они используют