Загрузка...
Ошибка

FAQ по основным форматам электронных книг и программ для их чтения.

Ответить на тему

Riga

+1  
PDF
Формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript. Обычно используется для книг с иллюстрациями (в т.ч. схемы и математические формулы). PDF – формат, позволяющий внедрять необходимые, векторные и растровые изображения, формы и мультимедиа-вставки.

Описание формата PDF

PDF (аббревиатура от англ. Portable Document Format, у них произносится пи-ди-эф) — разработанный фирмой Adobe Systems с использованием ряда возможностей языка PostScript, как независимый от платформы формат представления в электронном виде полиграфической продукции, различной электронной документации (в том числе электронные книги) и презентаций.
Для просмотра можно использовать официальную бесплатную программу Acrobat Reader, а также программы сторонних разработчиков.
PDF-файл обычно имеет расширение .PDF. На компьютерах Macintosh, это не является необходимым, но так как PDF-файлы часто используются для межплатформенной передачи данных, будет хорошим тоном сохранять файлы с расширением .PDF.
И на Macintosh и на PC, вы не увидите иконку, если не установлено приложение, которое может просматривать PDF-файлы. В настоящее время многие компьютеры продаются с предустановленным Adobe Acrobat Reader.-- Традиционным способом создания PDF-документов является виртуальный принтер т.е. документ как таковой готовится в своей специализированной программе — графическом или текстовом редакторе, САПР и т.д. А затем экспортируется в pdf для распространения в электронном виде, передачи в типографию и т.п. Все данные в нем могут сжиматься, причем по-разному: JPEG, RLE, CCITT, ZIP. PDF может также сохранять всю информацию для выводного устройства, которая была в исходном PostScript-файле.
В формате PDF реализована возможность внедрять необходимые шрифты (построчный текст), векторные и растровые изображения, формы и мультимедиа-вставки. Поддерживает RGB, CMYK, несколько типов сжатия растровой информации. Имеет собственные технические форматы для полиграфии: PDF/X-1, PDF/X-3. Включает механизм электронных подписей для защиты и проверки подлинности документов. Имеется возможность импорта из большинства современных форматов текстовых документов, векторных и растровых графических форматов.-- Что можно делать с PDF?
PDF может быть использован для:
1. Cоздания электронных документов.
2. Обмена данными. Многие приложения могут читать PDF-файлы.
3. Архивирования данных. Существуют приложения, позволяющие индексировать PDF-файлы, что позволяет создавать электронные библиотеки в PDF-формате.
4. Интерактивных документов. PDF может быть использован для создания электронных форм, данные из которых хранятся в базе данных.
Как создать PDF-файл?
Многие приложения, такие как Corel Draw 9 или Adobe InDesign, имеют опцию «export to PDF».
Из приложений, которые не имеют этой опции, вы можете просто напечатать документ в PostScript-файл и затем использовать отдельное приложение под названием Adobe Acrobat Distiller для конвертации его в PDF-файл.
Приложение Adobe Acrobat (раньше называлось Exchange) может быть использовано для добавления в PDF-файл мультимедийных функций, гиперлинков, закладок и прочего.

Какие преимущества у PDF?
PDF имеет неоспоримые преимущества:
1. Это кроссплатформенный стандарт. Это означает, что вы можете увидеть документ точно таким же, каким он был создан, вне зависимости от того, на какой платформе он создавался.
2. PDF-файлы могут быть машинно-независимыми. Это означает, что файл может быть напечатан как на дешёвом струйнике, так и на дорогом фотонаборе.
3. PDF-файлы компактны. PDF поддерживает большое количество алгоритмов компрессии данных.
4. PDF-файлы могут содержать мультимедийные элементы, такие как видео- и/или звуковые ролики, так же как и гипертекстовые элементы и превью страниц.
5. PDF поддерживает безопасность. Создатель PDF-файла может задать несколько опций безопасности. Возможно заблокировать файл так, что он может быть открыт только после ввода пароля. Также возможно запретить изменение файла и/или его печать.
А какие недостатки у PDF?
Конечно, PDF имеет и некоторые недостатки:
1. PDF — патентованный формат компании Adobe.
2. PDF пытается стать всеохватывающим стандартом, что не позволяет ему быть настолько эффективным, как специализированные решения. Вы можете использовать PDF в Интернете, но HTML-файлы более эффективны. Можно использовать PDF для обмена графикой, но большинство препресс-приложений используют форматы EPS и TIFF.
3. PDF нацелен прежде всего на визуализацию документов. Он не сохраняет их логическую структуру.
4. PDF-файлы сложно редактировать. Небольшие изменения могут быть внесены, но очень сложно, если не невозможно, добавлять блоки текста или изображения в существующий PDF-файл.
DjVu
Использует специальный алгоритм, позволяющий получать файлы меньшего размера при сжатии без потерь за счет технологии, разработанной специально для хранения оцифрованных документов рукописей, книг, журналов. Популярнейший формат книг в файлообменных сетях.

Описание формата DjVU

Графический формат DjVU разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть принципиальные схемы различной бытовой электроники, книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое. Его уникальной особенностью является чрезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере. Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.
Формат DjVu, позволяет сжимать информацию в 8 раз эффективнее, чем JPEG. При этом, качество картинки почти не изменяется. Цветная журнальная страница, отсканированная при 300 dpi, в формате DjVu может иметь размер 20–79 Кб. Сжатое цветное изображение, содержащее текст и рисунки, в 5–10 меньше сжатого по методу JPEG при аналогичном качестве. Черно-белые страницы сжимаются в 10–20 раз лучше, чем в JPEG. Черно-белое изображение в новом формате может иметь размер единицы килобайт.
Сфера применения технологии DjVu включает в себя обработку отсканированных книг, журналов, каталогов, руководств, исторических и редких документов и размещение их цифровых копий в Интернете. Для просмотра изображений в новом формате пользователь должен установить небольшой plug-in — дополнение к браузеру. Малый размер plug-in’а — 700–800 кб, легкая установка, поддержка всех основных браузеров и ОС позволяют говорить о его широком распространении в ближайшее время. Этому способствует свобода доступа к программным средствам для просмотра, создания и редактирования изображений в формате DjVu.
Новый формат базируется на технологиях, которые разработаны в AT&T Labs: алгоритм отделения текста от фона на отсканированном изображении, вейвлетный алгоритм сжатия фона IW44, мощный алгоритм сжатия черно-белых изображений JB2, эффективный универсальный алгоритм сжатия ZP, алгоритм распаковки «по запросу», алгоритм «маскировки» изображений. Первые четыре алгоритма обеспечивают чрезвычайно высокую степень сжатия.
По технологии DjVu файл с черно-белым монохромным изображением может быть сжат до 500:1, в сравнении с форматом GIF выигрыш в размере файла составляет в среднем 20 раз. По технологии DjVu изображение автоматически разбивается на ряд участков, например, текст или растровая фотография. Для каждого участка выбирается оптимальный для данного графического образа алгоритм сжатия.
В формате DjVu, в сравнении с другими известными форматами, очень хорошо хранить большие отсканированные изображения. Размер такого архива может быть всего 200–300 Кб.
Расширение файла — .djvu.

бразец djvu-файла, открытый с помощью plug-in'а Internet Explorer

DjVu-книга, открытая в смотрителе WinDjView-Чем открыть файл формата djvu?
Программа DjVuReader отлично справляется с открытием этого формата.
TXT
Файлы формата TXT имеют наименьший вес, поэтому зачастую использовались в самом начале эры электронных интернет-библиотек, у посетителей которых была предельно низкая скорость скачивания, равно как и объемы жестких дисков, а также различных носителей. Для того, чтобы скачать крупное издание, создавались ZIP-архивы, объединяющие все главы книги. Основной плюс TXT – его совместимость со всеми устройствами и практически любым программным продуктом, Хотя данный формат и не поддерживает графику и сложное форматирование.

Описание формата TXT

Текстовый файл — форма представления последовательности символов в компьютере, в строгом смысле этого термина соответствующая MIME-типу «text/plain». Каждый символ из используемого набора символов кодируется в виде одного байта, а иногда в виде последовательности подряд идущих двух, трёх и т. д. байтов.
Текстовые файлы разбиваются на несколько строк. На современных платформах разбиение на строки кодируется управляющим символом перевода строки, а иногда последовательностью двух управляющих символов (на некоторых старых платформах разбиение на строки делалось иначе). Вообще, текстовые файлы могут содержать печатные символы, такие как буквы, цифры и знаки препинания и некоторое количество управляющих символов, таких как знаки табуляции и перевода строки.
Текстовым файлам противопоставляются двоичные (бинарные) файлы, в которых информация организована по иным принципам.
Большая часть компьютерного оборудования и программ не различают текстовые и двоичные файлы. Существует, однако, большое количество программ, предназначенных специально для обработки текстовых файлов или таких программ, которые по-разному обрабатывают текстовые и двоичные файлы. Многие сетевые протоколы, рассчитаны на работу только с текстовыми данными и не могут обрабатывать произвольную последовательность байтов. Программы для ручного набора текстовых файлов называются текстовыми редакторами.
В Windows для текстовых файлов используется расширение «txt», тем не менее, многие файлы с другими расширениями могут оказаться текстовыми. Например, исходные коды, обычно, хранятся в файлах с расширениями, соответствующими языку программирования, на котором они написаны.
Расширения файлов вовсе не являются обязательными.

Образец txt-файла, открытый в текстовом редакторе-Легко открывается с помощью болокнота.
HTML
Стандартный язык разметки документов во Всемирной паутине. Разметка позволяет вставку спецсимволов, изменение размера, типа, начертания шрифта, создание гиперссылок и таблиц, выравнивание текста. Электронные книги в формате HTML чаще всего выставляются в полнотекстовом виде на сайте, в этом случае в скачивании на компьютер нет необходимости.
СHM
Книга – файл формата .chm (HTMLHelp). Содержит в себе набор HTML-страниц , может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Используется для создания справки в ОС Windows и, по аналогии, для создания книг, с помощью специального программного обеспечения.

Описание формата CHM

HTMLHelp (Microsoft Compressed HTML Help, .CHM) — формат файлов контекстной справки, разработанный компанией «Майкрософт» и выпущенный в 1997 году в качестве замены формата WinHelp. Содержит в себе набор HTML-страниц, может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Все входящие в .CHM файлы сжаты алгоритмом LZX.
Для просмотра .CHM-файлов используется стандартное средство просмотра, встроенное во все версии Windows, начиная с Windows 98. Кроме того, существует ряд сторонних программ-просмотровщиков. Для создания .CHM-файлов «Майкрософт» предоставляет бесплатное средство HTML Help Workshop.
Преимущества формата:
1. Размер файла меньше чем у обычного HTML
2. Используются все возможности форматирования, имеющиеся в HTML и CSS
3. Возможность полнотекстового поиска
4. Возможность просмотра множества .chm-файлов как один, с общим содержанием и предметным указателем (в частности, ранние версии MSDN Library предоставлялись в формате HTMLHelp)
Минусы формата
Хорошо известен сбой, который не даёт просмотреть эти файлы. Это легко вылечить набрав в командной строке "regsvr32 %windir%\system32\hhctrl.ocx". Так же эти файлы могут не открываться, если в пути до файла имеются символы "_" и "#".
Возможные проблемы
Системные требования для просмотра CHM-файлов:
Операционная система, начиная от Windows98 и выше.
В системе должен быть установлен браузер Internet Explorer версии начиная от 5.0 или выше.
!!! Обязательно в браузере должны быть включены: поддержка java-скрипт, показ рисунков и анимации. Разрешение экрана монитора должно быть не менее 1024 х 768 (желательно, но не обязательно).
Как смотреть chm-файл, если в системе не установлен Internet Explorer?
Если у вас на компьютере нет браузера Internet Explorer (вы пользуетесь другим браузером), то все равно попробуйте запустить chm-файл. Может и получиться с некоторыми ограничениями просмотреть, если в системе установлен chm-вьювер (программа hh.exe). HH.EXE является исполняемым файлом HTML Help.
Запустить просмотрщик HTML Help с именем справочного файла в качестве параметра: HH helpfile.chm
Я работаю под Linux (Unix) и принципиально не пользуюсь Windows. Как мне просматривать chm-файл?
а) Надо распаковать/декомпилировать chm-файл на Windows-системе. Полученные после компиляции htm-файлы сможете просматривать в Linux.
б) Использовать chm-вьювер под Linux/Unix.
JPEG
Данный формат использует сильное сжатие, уровень которого можно регулировать, с потерей информации.
Применяется для хранения высококачественных изображений, позволяет использовать до 16 миллионов цветов, именно поэтому электронные книги в этом формате также имеют место – для печати он непригоден, а для демонстрации на дисплее подходит идеально.
TIFF
Формат для хранения изображений с большой глубиной цвета. Чаще всего используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. Глубина изображение делает TIFF незаменимым форматом для тех, кто занимается оцифровкой бумажных изданий, так как процесс распознавания текста упрощается во много раз.

Описание формата TIFF

Должен открываться любым графическим редактором!
TIFF (англ. Tagged Image File Format) — формат хранения растровых графических изображений. Изначально был разработан компанией Aldus в сотрудничестве с Microsoft, для использования с PostScript. TIFF стал популярным форматом для хранения изображений с большой глубиной цвета, используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. TIFF был выбран в качестве основного графического формата операционной системы NeXTstep, и из неё поддержка этого формата перешла в Mac OS X.
FB2
Открытый формат, основан на XML. Основное преимущество FictionBook(.fb2) – возможность без труда создавать (в том числе и автоматически) книги в этом формате из файлов всех популярных текстовых форматов (*.txt, *.doc, *.rtf. *.html и пр.). Кроме того, FictionBook поддерживается большинством распространенных программ и устройств для чтения книг.

Чем открыть FB2?

FBReader, Book Designer v 4.0
CBR
Файл CBR представляет собой архив группы изображений .JPEG, .PNG или .GIF. Страницы в данном архиве отсортированы и могут быть показаны в определенном, установленном порядке, по одной или несколько одновременно. Формат CBR используется, как правило, для создания комиксов или слайд-шоу.

Описание формата CBR

Данный файл можно открыть различными программами для распаковки архивов. Однако, порядок показа изображений будет нарушен.
Тип файла - Архивы, сжатые файлы
Как, чем открыть файл .cbr?
1. CDisplay
2. Smith Micro Stuffit Deluxe (для распаковки изображений)
3. Другие RAR-архиваторы (для распаковки архива)
 
▲ Наверх