И снова Google

Статус
В этой теме нельзя размещать новые ответы.

t0wer

BlackHerald
Регистрация
24 Июн 2008
Сообщения
743
Реакции
440
Google научился индексировать отсканированные документы

Компания Google объявила о том, что ее поисковик научился индексировать текст на отсканированных изображениях. По словам представителей компании, для определения текста на картинке используется специальная технология оптического распознавания Optical Character Recognition, которая умеет конвертировать изображение слов в файлы с текстом.
На сегодняшний день, поисковик Google умеет распознавать только текст в документах формата PDF.

Кто-нибудь как-то юзал эту фишку Гугла?!
 
Да похоже уже индексирует отсканенные документы в pdf формате, пишут об этом в своём блоге:

демо:

первый документ в результате отсканенный.
 
да, удобная фишка! Да и раньше поиск по ПДФкам тоже радовал. Находишь ПДФку в выдаче Гугля, и чтобы не качать ее (и особенно если не установлен ридер) щелкаешь по "просмотреть в виде HTML". Форматирование там конечно кривоватое, но понятно можно нужная это инфа или нет. Что есть польза!
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху