Индексируются ли форматы .pdf и .djvu?

Статус
В этой теме нельзя размещать новые ответы.

seobeginner

ищу кнопку бабло
Регистрация
5 Июл 2008
Сообщения
222
Реакции
59
Собственно, сабж.

Нужно это потому, что хочу брать контент из книг, скаченных в сети в формате pdf или djvu , будет ли текст уникален или уже проиндексировался поисковиками?
 
Насчет отсканенных текстов (где сами тексты - это картинки) - практически сто процентов, что нет.

А вот электронные версии, где как минимум работает выделение и вставка текста, гуглом индексируются очень даже ничего.
 
djvu однозначно не индексируется. Это просто джипеги. С пдфками все не так однозначно.
 
pdf нормально индексируется(текст), подобная тема обсуждалась на серче, djvu не индексируется, но не все книги в сети уникальны...так что вам сначала придется их проверять на уникальность
 
пдф только качественный индексит, если пдф скан книги...то не индексит
 
Проще говоря тот PDF при просмотре которого можно выделить внутри текст, и также осуществялется поиск по содержанию внутри PDF, в таких файликах и поискивики покопаются. А там где нужно использовать OCR роботы лезть не будут ;)
 
яндексом ПДФ индексируется точно
djvu вряд ли так как это картинка фактически
 
Google и Yandex точно индексируют pdf. А вот Ссылки из этих документов никто не учитывает
 
Google и Yandex точно индексируют pdf. А вот Ссылки из этих документов никто не учитывает

pdf не все, а только с текстом. Сканы как и djvu не индексятся точно.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху