Какой размер шингла оптимален для проверки уникальности текста?

Подскажите пожалуйста, делаю рерайт, провожу проверку текста на уникальность и задался вопросом, какой размер шингла для проверки необходимо устанавливать чтобы поисковые машины считали текст уникальным?
Метод измерения уникальности текстов шинглами врядли используется алгоритмами ПСов, потому как он сильно ресурсоемок и легко поддается манипулированию результатами. Поэтому его использование в вашей работе может выдти боком. Кстати, если размноженные тексты готовятся под сапу, то это Сизифов труд, вылетят очень быстро.
 
Чем тогда предлогаете мерить уникальность текста? :confused:
 
С достоверностью 100% - ничем, по крайней мере я такого софта не знаю. Все что в паблике, использую для нахождения дублей интересующего меня текста, а не для определения уникальности в глазах ПС.
 
Ну так если нету дублей текст получается уникальным.
 
Частичные дубли есть почти всегда. И если я вижу своим "глазом" что ето дубль(рерайт, синонимайз) не факт что ПС это тоже видят и наоборот.
 
Частичные дубли есть почти всегда. И если я вижу своим "глазом" что ето дубль(рерайт, синонимайз) не факт что ПС это тоже видят и наоборот.
"Частичные дубли есть всегда", конечно всегда. (Привет всем! В заключение хочется отметить, и т.д. (часто употребляемые словосочетания))
Уникальность в глазах ПС, это и есть отсутствие дубликатов в базе ПС но не всегда это должно быть 100%.
Все что в паблике, использую для нахождения дублей интересующего меня текста, а не для определения уникальности в глазах ПС.
А разве то же адвего не использует выдачу пс для проверки уникальности?
 
Почему то в Etxt Антиплагиат и Advego Plagiatus результаты анализа разные, во втором процент уникальности на много ниже.
В Advego Plagiatus 2 параметра: Paзмep шинглa и Paзмep фpaзы.
 
А разве то же адвего не использует выдачу пс для проверки уникальности?
Использует, но однажды очень сильно погорел на нем. Поставил размер шингла 9, проверил скан книги, все было уникально. Разбил на статьи залил на сайт, а спустя некоторое время словил АГС - пошел в яндекс проверить вручную через поиск в ковычках и нашел кучу дублей в формате .doc и .pdf

Теперь проверяю все на шингле 5 причем в двух программах - advego + Etxt
 
Использует, но однажды очень сильно погорел на нем. Поставил размер шингла 9, проверил скан книги, все было уникально. Разбил на статьи залил на сайт, а спустя некоторое время словил АГС - пошел в яндекс проверить вручную через поиск в ковычках и нашел кучу дублей в формате .doc и .pdf
Теперь проверяю все на шингле 5 причем в двух программах - advego + Etxt

Правильно. Кто же проверяет с таким шинглом. Я больше 5-6 не ставлю, в зависимости от текста.
 
А вы уверены что для яндекса важна уникальность такого типа? Нужен софт учитывающий словоформы и синонимы для точной проверки на уникальность. А так можно и 10ку ставить.
 
Назад
Сверху