[Ищу] Разодрать текст на фразы

Статус
В этой теме нельзя размещать новые ответы.
Получите, с учетом морфологии, ключевые слова (за исключением стоп-слов), и получите слева/справа от ключей по 2-3 слова.
В живую бы на это посмотреть. Все пишут что можно получить, пара партизан с форума точно промышленно этим занимаются и ни один даже образец текста не скинет.
Для просмотра ссылки Войди или Зарегистрируйся
Вот книга, зашел на либрусэк сейчас и рандомно на главной вывалило ее. Я могу на предложения ее разодрать а надо на осмысленные фразы минимального размера. Кто может показать что получится и сказать как и чем он это сделал?
 
lift, Итак предложения мы получили. Теперь заносим в массив все те слова которые есть в предложении (с учетом того, что запятых в предложении нет! с запятыми вариант будет другой!). Затем берем первое слово и проверяем его окончание. Если существительное - ищем прилагательное по окончаниям всех слов в предложении. Пары сущ+прил пишем в отдельный файл. Также можно и с другими именами слов поработать! Не судите строго, я лишь описал теоретическую базу! На практике это дело конечно не так просто...
 
В живую бы на это посмотреть. Все пишут что можно получить, пара партизан с форума точно промышленно этим занимаются и ни один даже образец текста не скинет.
Для просмотра ссылки Войди или Зарегистрируйся
Вот книга, зашел на либрусэк сейчас и рандомно на главной вывалило ее. Я могу на предложения ее разодрать а надо на осмысленные фразы минимального размера. Кто может показать что получится и сказать как и чем он это сделал?
У меня так получилось, см вложение. Но объясните мне зачем это вообще нужно? Для базы синонимизатора?
 

Вложения

  • гамбит.txt
    156,1 KB · Просмотры: 16
  • Нравится
Реакции: lift
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху