[DMI] DMII 2.5

Статус
В этой теме нельзя размещать новые ответы.
Модули все установлены install.pl на нехватку модулей не ругался.
Да и с правами всё вроде ок.

А у тебя максимальный словарь какого размера был?
 
то Mamadu
смог собрать tree-tagger под freebsd ?
 
Может кто не знает.
Что бы не заморачиваться с его парсингом текста и не гадать, что он там напарсит, мало, не то и т.д.,
просто даю ему уже готовый текст, напарсенный любым удобным способом, к примеру нормальные статьи по теме, и всё. Тогда словарь сделаешь какой тебе надо.
Хоть 50 мб. только текста набери. :)
 
Так ты мне скажи на Убунту словари из нета собираются?
 
Так ты мне скажи на Убунту словари из нета собираются?

Что значит из нета?
Словари из нета уже не собираются, это было в версии до 2.5.
Если тебе интересно пашет ли всё на убунту от парсинга текста до готового словаря, то ДА.
При этом, мне лично даже интернет не нужен, всё локально на компе.

Давай разложим грубо сам DMI по полкам, что в нём есть:

1.Парсер текста, обычный парсер, который парсит текст из нескольких источников, чистит его и складывает текст в файл, ничего больше.
Но думаю, что парсеры текстов есть у всех и в разных видах. :)

2.После парсинга текст берёт скрипт ТАГЕР, (это вообще самостоятельный продукт) который берёт текст, разбивает на слова, словосочетания, это его миссия.

3.Потом DMI берёт этот уже разбитый текст и просто раскладывает по отдельным файлам (существительные, глаголы и т.д.) вот и получается словарь.

4.Да забыл, есть ещё и сам генератор дорвеев :)
Просто, что бы не ждать, что напарсит парсер текста DMI, можно просто положить свой файл со своим текстом любого размера.
Вот вроде так, если где не прав, поправте.
 
2 Neraton Gadidosh предложил два варианта как застаить работать теггер, что же выбрал ты?
 
2 Neraton Gadidosh предложил два варианта как застаить работать теггер, что же выбрал ты?
У него не 2 варианта а 2 обязательных пункта.
А вариант тут один, установить сам тагер.
Открой файл install.php DMI генератора, там всё есть.
В принципе при запуске install.php
должно всё скомпилится и работать, но у меня так не произошло. Я сделал то же самое, но после инстала DMI.

Вот в install.php :
`cd $FindBin::Bin/tagger; make; cp Bin_and_Data/start-state-tagger /bin/start-state-tagger; cp Bin_and_Data/final-state-tagger /bin/final-state-tagger`;

Так я и сделал, скачал тагер(старый, такой как в комплекте), в файле маке изменил
SHELL = /bin/csh на SHELL = /bin/sh
набрал маке, файлы собрались, в bin/ скопировал 2 файла.
Далее создал папку temp в Bin_and_Data.
Потом как сказал Gadidosh добавил в path переменную о пути к запускным файлам тагера и всё заработало.
 
Или можно было sudo apt-get install csh сделать.;)
У меня на Ubuntu тоже все пашет.
 
Заработал, е-мое.... Ты мне обьясни откуда ты узнал что папку temp в Bin_and_Data надо делать млин????

Всё просто, открыл файл tagger.pl там написано:

Тут и команда на запуск тагера и все пути :)
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху