• DONATE to NULLED!
    Вы можете помочь Форуму и команде, поддержать финансово.
    starwanderer - модератор этого раздела будет Вам благодарен!

Плагин Русский синанимайзер под WP

Статус
В этой теме нельзя размещать новые ответы.
У меня вообще ничего не получается, как вообще им пользоваться?

хм... ну зайди в гугл транслэйт, переведи страничку в одну сторону, потом в другую :)
чем не синонимайзер, кстати может даже и получше будет качество :)
 
хм... ну зайди в гугл транслэйт, переведи страничку в одну сторону, потом в другую
чем не синонимайзер, кстати может даже и получше будет качество

ага, и в итоге получится все таже срань.

Особо синонимайзеры не втыкал, но потребность в ней давно есть. Пробывал только встроенный в feedmaster, не понравилось. Как мне кажется, базу синонимов нужно затачивать под конкретный сайт, ну или нишу.

Например, сотовый телефон можно записать, мобильный телефон, мобильник. А устройство, как аппарат, девайс и.т.п. Чтоб слова использовались более-менее по смыслу. Но вот тоже время занимается, чтоб свою базу под определенную нишу сделать.
 
Я пару часов экспериментировал с собственным словариком + Яндексовский mystem (Для просмотра ссылки Войди или Зарегистрируйся)

Сделал три вывода:

1) Базу собрать можно довольно быстро. Самому. Вручную. Просто рерайтя статьи и тут же занося синонимы в словарик. До 2-3 тысяч слов такой словарик распухнет буквально за день.

2) Словарика в 200 слов уже хватает, чтобы другие статьи с того же сайта при синонимайзинге получались более-менее уникальными. Сайт был "развлекательной тематики" - лексикон там бедный, поэтому и результаты такие хорошие.

3) Остается проблема уникальных слов. Если статья содержит хотя бы несколько слов, которые обычно в тексте встречаются редко, мы на 90% можем детектировать дубли - просто по их последовательности в статье.

Пример:

"Невскому карнавал Старо-Невском проспекте Старо-Невском проспекте Восстания карнавальных аттракционов колонны затея костюмы сумме"

- такая сигнатура позволяет определить, что это не просто статья о карнавале в Питере, а именно что полученная синонимайзингом из другой такой же статьи. При этом не важно, ручным или автоматическим.
 
Я пару часов экспериментировал с собственным словариком + Яндексовский mystem (Для просмотра ссылки Войди или Зарегистрируйся)

Сделал три вывода:

1) Базу собрать можно довольно быстро. Самому. Вручную. Просто рерайтя статьи и тут же занося синонимы в словарик. До 2-3 тысяч слов такой словарик распухнет буквально за день.

А здесь или в отдельной ветке можно поподробней ?
Как Яндексовский mystem юзать -то ? для чего он вообще нужен, на сайте вроде бы ничего конкретного не накатано ...
 
mystem -nig

Выдаст тебе про каждое слово следующую информацию:
- Что это за часть речи (существительное, предлог, наречие..)
- Как звучит его начальная форма (для словаря, чтоб не забивать "земляника" "земляникой" "землянике"...)
- В каком падеже оно использовано (чтобы просклонять слово из словаря обратно в нужную форму)

Читай на Для просмотра ссылки Войди или Зарегистрируйся "Расшифровка граммем"
 
Так как всё-таки simple-syn юзать, кто-нить подскажет?
 
1) Идешь сюда, скачиваешь русскую версию:
Для просмотра ссылки Войди или Зарегистрируйся

2) Распаковываешь, получившийся файл simple-syn.php копируешь в папку wp-content\plugins

3) Заходишь в админку, находишь его там. Убираешь птичку "use external db", если стояла. Остальные по вкусу

4) Вбиваешь свои синонимы в админке в таком формате:

посмотрел:глянул:поглядел
грандиозный|большой,великий,необычайный

5) Все, по идее теперь каждый твой новый псто уже будет заменять слова "посмотрел", "грандиозный", а также "глянул" и "поглядел" на синонимы.
 
Интерестная тема. Я ломаю голову уже с пол года над синонимайзером. Есть даже хорошее решение в виде самописного плагина под ВП и набранного ручками словоря. Вроде не банят поисковики и фильтры не трогают. НО. Есть огромное НО. ... Что бы не палить всю тему, скажу так:

Нужно отходить от простого синонимайзера, даже с первоклассным словорем. Связки слов, на мой взгляд, рулят сейчас больше нежели вышеописанное.
 
Нужно отходить от простого синонимайзера, даже с первоклассным словорем. Связки слов, на мой взгляд, рулят сейчас больше нежели вышеописанное.

Правильно!
Именно такой словарь сейчас и составляю.
Текст уникализирует на 50%, с полным сохранением смысла, за очень редким исключением, которые можно списать на опечатки.

:read:

Лопатя чужие словари нахожу массу примеров тому, что исспользовать их - быть полным дураком.
Например:

ворона|вялый
воскрылять|возбуждать
воспоминания|книга
врезаться|влюбиться
все|безвыездно

Поэтому и контент нечитаемый получается...


И щедевр синонимайзерской мысли:

гвоздь|приманка
 
Еще раз говорю: забейте на синонимайзер. Не тратьте время впустую. В любой статье найдутся слова, для которых нету синонимов. Ну просто нету, и все. И при любых синонимайзингах этой статьи все эти слова останутся в строго том же количестве и той же последовательности. Это как вирусы детектировать, у которых есть слабые-слабые зачатки полиморфизма: часть инструкций меняется, а часть - остается от копии к копии. Вот по статической части и вычисляют.

С текстом ничуть не сложнее.
Вот простейший алгоритм:

1) берем все словари синонимов, что выкладывались здесь или вообще есть в паблике (задача для яндексоидов вполне посильная, там обычные люди работают). Собираем их в один. Составляем список всех слов, которые в этом словаре встречаются. Просто список, по одному слову в строке.

2) Берем проверяемую статью. В ней все слова, которые встречаются в нашем словарике из пункта 1), заменяем на %

3) Полученный "огрызок" статьи разбиваем по %. Имеем последовательность ключевых слов, по которым производим поиск - т.е. просто ищем все тексты, где определенные ключевые слова (а их у нас из статьи останется довольно много) встречаются в определенном порядке. И получаем весь список статей, полученных синонимайзингом из этой. Сапплементал резалтс, так сказать..


Словарик из пункта 1) можно безболезненно увеличивать путем автоматической обработки вообще всех подряд текстов, взятых из инета. Даже если в него попадет что-то лишнее, что на самом деле не является синонимом - ничего страшного. Какой бы ни был большой словарик, а на пункте 3) мы все равно получим последовательность ключевых слов нужной длины.

Алгоритм этот разумеется можно улучшать и оптимизировать. Здесь приведено лишь простое решение "в лоб" с использованием той технической базы, которой располагаю я как рядовой пользователь яндекса. Внутри компании возможно есть интерфейс поиска по шаблонам - что еще более упрощает задачу.

Добавлено через 2 минуты
Ну вернее нет, не забейте же конечно же. Синонимайзинг вещь полезная и даже необходимая, но далеко не достаточная для того, чтобы текст стал уникальным.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху