Книги на сайте представлены в основном в одном из 4 самых распространённых
форматов – DOC
(Документ Microsoft Office Word.doc_2003), PDF, DJVU или CHM.
Большинство книг заархивирована с помощью программы Win
Rar для экономии места и
объединения файлов
PDF (Portable Document Format) - это переносимый формат
документов , созданный Adobe как средство межплатформенного обмена данными.
Хотя существует масса способов передать документ, например, между Windows и Mac
OS, Adobe PDF предлагает наиболее элегантное решение. Формат не накладывает
никаких ограничений на внешний вид документа - текст, векторная и растровая
графика могут быть объединены произвольным образом. Реализуется принцип
"все мое ношу с собой" - для просмотра PDF-файла не нужно ничего,
кроме самого файла и бесплатной программы Acrobat Reader.PDF создавался как
формат электронного документа. Необходимость быстрого перемещения по страницам
и объектам документа обусловила иерархическую структуру данных PDF. В начале
файла находится оглавление, показывающее где и какие объекты расположены в
файле, затем идут сами данные. Для того, чтобы что-либо делать с PDF-файлом,
его нужно иметь целиком, поскольку фрагмент данных, который понадобится первым,
может находиться в любой части файла - в том числе и в самом конце. Для
документов с явным преобладанием текста и векторной графики формат PDF, как
правило, обеспечивает заметное сокращение объема файла (с соответствующим
сокращением времени пересылки по сети и т.д.).
DjVu (дежа-вю) - графический формат, разработанный фирмой
AT&T, оптимизированный для хранения отсканированных документов. Особое
значение этот формат приобретает для переноса в сеть математической и вообще
технической литератуы, где обилие схем и формул делает распознавание и перевод
в текстовый формат практически невыполнимым. . В настоящее время DjVu
становится фактическим стандартом для электронных библиотек технической и
научной литературы. Отныне существует компромисный вариант - перевод
отсканированных картинок в формат DjVu (дежа-вю). При этом текст и контрастные
рисунки сохраняются с разрешением 300 dpi, все остальное считается фоном и
сохраняется с пониженным разрешением. Это позволяет хорошо сжать электронный
документ без потери его читаемости. Размер файла отсканированной книги
оказывается в пределах нескольких мегабайт, что вполне приемлемо. Разработанный
фирмой AT&T Технологию DjVu обеспечивает для файлов с черно-белыми
монохромными изображениями сжатие порядка 500:1. Выигрыш в размере файла по
сравнению с форматом GIF составляет в среднем 20 раз. Суть технологии DjVu
заключается в автоматическом разбиении изображения на несколько участков
(например, текст, логотип фирмы и растровая фотография), для каждого из которых
выбирается оптимальный для данного графического образа алгоритм сжатия.
Программы для просмотра DjVu файлов:
- WinDjView-1.0.3 +
модуль русского языка (500 Кб)
-Плагин к браузеру для чтения
DJVU-текстов
CHM (Compiled HTML) -
изначально формат CHM был создан для формирования удобной и функциональной
справочной системы к программам Windows. Этот формат часто используется не
только для создания хелп-систем к ПО, но и для издания книг в электронном виде.
Самой сильной стороной этого формата является наличие в CHM файлах
полнотекстового поиска. Вкратце файл CHM -это набор скомпилированных
HTML-файлов, т. е., другим языком, что-то вроде архива из Web-страниц. И
действует CHM-файл по принципу архива, сжимает данные, хранящиеся в нем, но не
все, а только текстовые или содержащие текст, отформатированный с помощью тегов
HTML (HTML, TXT, CSS и файлы других форматов).