Как подсчитать плотность ключевых слов в тексте?

Статус
В этой теме нельзя размещать новые ответы.

Nezzar

Гуру форума
Регистрация
29 Дек 2006
Сообщения
337
Реакции
89
Вот хочу написать свой скрипт, который будет подсчитывать плотность ключевых слов(будет брать прямо из текста, т.е. не будут задаваться) из предложенного текста. И не только слов по одному, но и словосочетания.

Как такое реализовать?
 
Вопрос конечно многим интересный...:)
Но вот чтобы даже не задавались сами кейворды... Тут сложновато будет. Как вот скрипт должен понять какое слово кейворд, а какое нет? Для англ. например the, is, do думаю будет гораздо выше по частотности чем любое cheap, online, porno.
А по теме:
например сначала удаляем из текста всё что не пробел и буква ( preg_replace("#[^a-zA-Z ]+#i", '' ,$text) ) потом в нижний регистр. Потом разбиваем на слова $words=explode(' ', $text). И погнали.
PHP:
for ($i=0; $i<count($words); $i++) {
   if (!isset($keywords[$words[$i]]) {
      $keywords[$words[$i]]=1;
   } else {
      $keywords[$words[$i]]++;
   }
}
Получившийся массив сортируем по убыванию и где то там сверху массива будут и кейворды.
Точно такие же операции можно проделать чтобы получить массивы для 2-х 3-х 4-х словных текстовых вхождений.
Примерно так...:ah:
 
такой клас в сети бродил когдато
 

Вложения

  • inc.density.zip
    1,5 KB · Просмотры: 34
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху