Что такое форматы pdf и djvu и чем их читать?
Книги в библиотеке, наряду с полностью прошедшими цикл OCR, оцифрованными или выложенными с расширением doc файлами, так же представлены в форматах PDF, DjVu и CHM.
Будучи в целом распространенными в русскоязычном сегменте Интернета, они могут поставить незнакомого или необеспеченного соответствующим программным обеспечением пользователя в тупик. Во избежание сего обратите внимание на нижеследующую информацию, указанную в рамках ликбеза.
PDF (Portable Document Format) - это
переносимый формат документов, созданный Adobe как средство
межплатформенного обмена данными. Хотя существует масса способов
передать документ, например, между Windows и Mac OS, Adobe PDF
предлагает наиболее элегантное решение. Формат не накладывает никаких
ограничений на внешний вид документа — текст, векторная и растровая
графика могут быть объединены произвольным образом.Реализуется принцип
«все мое ношу с собой» — для просмотра PDF-файла не нужно ничего, кроме
самого файла и бесплатной программы Acrobat Reader. PDF создавался как
формат электронного документа.
Необходимость быстрого перемещения по
страницам и объектам документа обусловила иерархическую структуру
данных PDF. В начале файла находится оглавление, показывающее где и
какие объекты расположены в файле, затем идут сами данные. Для того,
чтобы что-либо делать с PDF-файлом, его нужно иметь целиком, поскольку
фрагмент данных, который понадобится первым, может находиться в любой
части файла — в том числе и в самом конце. Для документов с явным
преобладанием текста и векторной графики формат PDF, как правило,
обеспечивает заметное сокращение объема файла (с соответствующим
сокращением времени пересылки по сети и т.д.).
Скачать свежую версию с сайта производителя >>
DjVu (дежа-вю)
- графический формат, разработанный фирмой AT&T, оптимизированный
для хранения отсканированных документов. Особое значение этот формат
приобретает для переноса в сеть математической и вообще технической
литератуы, где обилие схем и формул делает распознавание и перевод в
текстовый формат практически невыполнимым.
В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы. Отныне существует компромисный вариант - перевод
отсканированных картинок в формат DjVu (дежа-вю). При этом текст и
контрастные рисунки сохраняются с разрешением 300dpi, все остальное
считается фоном и сохраняется с пониженным разрешением. Это позволяет
хорошо сжать электронный документ без потери его читаемости. Размер
файла отсканированной книги оказывается в пределах нескольких мегабайт,
что вполне приемлемо.
Разработанный фирмой AT&T Технологию DjVu
обеспечивает для файлов с черно-белыми монохромными изображениями
сжатие порядка 500:1. Выигрыш в размере файла по сравнению с форматом
GIF составляет в среднем 20 раз. Суть технологии DjVu заключается в
автоматическом разбиении изображения на несколько участков (например,
текст, логотип фирмы и растровая фотография), для каждого из которых
выбирается оптимальный для данного графического образа алгоритм сжатия.
Cтраничка, посвящённая этому формату >> Программа для просмотра DjVu файлов:WinDjView 0.4.1 + модуль русского языка (прим. 500 КБ)
Бесплатно, установка не требуется!
Страничка автора (Андрей Жежерун):Установить плагин для чтения DjVu-текстов >>

CHM (Compiled HTML) Изначально
формат CHM был создан для формирования удобной и функциональной
справочной системы к программам Windows. Этот формат часто используется
не только для создания help-систем к ПО, но и для издания книг в
электронном виде. Самой сильной стороной этого формата является наличие
в CHM-файлах полнотекстового поиска. Вкратце файл CHM — это набор
скомпилированных HTML-файлов, т.е., другим языком, что-то вроде архива
из web-страниц. И действует CHM-файл по принципу архива, сжимает
данные, хранящиеся в нем, но не все, а только текстовые или содержащие
текст, отформатированный с помощью тегов HTML (HTML, TXT, CSS и файлы
других форматов).