Формат DjVu(ДеЖаВю)

Status
Not open for further replies.

KiN

Founder
Coder
Professional Carder
Carder
Joined
Nov 20, 2013
Messages
1,599
Reaction score
1,691
Формат DjVu (ДеЖаВю)

Графический формат DJVU(произносится Дежавю) разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое.
Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере.
Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.

Продвижением DjVu занимается расположенная в Сиэтле LizardTech Inc. совместно с AT&T Labs. DjVu – открытый стандарт. Доступны как описание формата файла (спецификация), так и исходный код декодера (и части кодировщика).

Обычно DjVu сжимает в 5-10 раз лучше, чем существующие методы вроде JPEG и GIF для цветных документов, и в 3-8 раз лучше TIFF для черно-белых документов. Цветные страницы, сканированные в полном цвете с разрешением 300 DPI могут быть сжаты с 25МБ до 30-100КБ. Черно-белые документы 300 DPI обычно сжимаются до 5-30КБ. Это ставит размер качественно сканированных страниц в один ряд с обычными HTML страницами (занимающими обычно 50КБ)

Для цветных документов содержащих одновременно текст и картинки файлы DjVu обычно в 5-10 раз меньше JPEG файлов того же качества. Для черно-белых страниц DjVu файлы обычно в 10-20 раз меньше JPEG и в 5 раз меньше GIF. Также DjVu файлы в 3-8 раз меньше черно-белых PDF файлов, полученных из сканированных документов (сканировать цветные докумеенты в PDF непрактично).

Помимо сканирования документов DjVu можно применять к документам, созданным другими программами, например Adobe PostScript или PDF. В этом случае размер файла варьируется от 15 до 20КБ за страницу 300 DPI.
---

Линки для более подробного понимания работы данного стандарта

Смежные темы на форуме:
По программе для создания DJVU Файлов - DjVu Editor - http://dumpz.ru/showthread.php?t=20797&highlight=Djvu
По программам для просмотра DjVu-файлов - http://dumpz.ru/showthread.php?t=9488

Что такое DjVu
_http://djvu.khakasia.ru/about_djvu.html

DjVu - все уже было
_http://www.cqham.ru/likbez_djvu.htm

Что такое DJVU и как с ним бороться
_http://www.cqham.ru/djvu_print.htm

Советы по подготовке материалов в электронном и бумажном виде
_http://www.cqham.ru/m2_scan.htm

OCR в djvu файлах
_http://www.cqham.ru/djvu_ocr.htm

Еще один ресурс, где подробно написано о djvu
_http://www.dstu2204.narod.ru/doc/djvu/djvu.htm

Программы для просмотра:

DjVuReader
_http://dumpz.ru/showthread.php?t=9488

LizardTech Document Express
_http://www.lizardtech.com/solutions/doc/

WinDjView и MacDjView
_http://windjview.sourceforge.net/

DjVu Browser Plug-in (Windows, Mac OS X, UNIX)
ExpressView for PocketPC (PocketPC !!!)

http://www.lizardtech.com/download/dl_options.php?page=viewers
 
Last edited by a moderator:

metrim

Member
Joined
Jul 15, 2004
Messages
116
Reaction score
2
Формат то конечно отличный, обеспечивает огромное сжатие без потерь качества.
"Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере. "
Значительно больше: книга из 300 стр. с разрешением 300dpi занимает (если правильно обработать) около 1,5мб

Существуют химические, физические и биологические библиотеки сделанные в этом формате.
Однако я столкнулся с одной не приятностью при работе с форматом - отсутствуют возможности защиты файлов (какие есть для Адобовских програм). Допустим сканирую я книгу, чищу, обрабатываю, делаю OCR для обеспечения поиска, но не могу заблокировать копирование OCR текста из книги и экспорт страниц. (А это необходимо мне сделать т.к. такова договоренность с авторами). ПОэтому часто приходится пользоваться более громоздкими pdf файлами.
Может быть кто нибудь посоветует как решать проблему защиты авторских прав силами DjVu?
Кстати опытным путем установлено, что плагин для браузера это наиболее удобное решение для просмотра DjVu..
 
Last edited by a moderator:

E-van

Member
Joined
Oct 23, 2004
Messages
156
Reaction score
141
Age
44
metrim, pdf файл можно очень просто взломать и сделать доступным для редактирования, разве авторы книг об этом не знают?
 

metrim

Member
Joined
Jul 15, 2004
Messages
116
Reaction score
2
Да взломать то можно что угодно, было бы желание, да нужные програмки.
Однако в джВю нет даже намека на возможность защиты
 

Mirabo

Member
Joined
Aug 9, 2004
Messages
336
Reaction score
113
Age
56
Как раз сейчас скачиваю файл в этом формате. Кто знает, существуют ли специальные программы для чтения или просмотра этих файлов или все пока только на уровне плагинов к браузерам? Можно ли с конвертировать DjVu в PDF или DOC? Или обратная конвертация из TIFF и JPG в DjVu? Интересно так же, если это такой продвинутый формат по сравненияю с JPG и разрабатывается с 96 года, то почему же не используется в Интернете при верстке сайтов?
 

Egoizte

ex-Team DUMPz
Joined
Jun 23, 2004
Messages
783
Reaction score
217
Age
40
Location
Сегодня ЗДЕСЬ, а завтра ТАМ
Программа для чтения - в шапке. DjVuReader называется.
Конвертировать можно таким способом: через файнпринт сохраняешь каждую страницу в tiff, потом закидываешь в djvueditor из пакета LizardTech Document Express.
 

Mirabo

Member
Joined
Aug 9, 2004
Messages
336
Reaction score
113
Age
56
Просмотрел я статьи про этот формат, и, Imho, при всех положительных свойствах, следует отметить большую ложку дегтя: судя по всему, ребята-разработчики софта жутко жадные и хотят снять как можно больше денег, постоянно контролируя распростанение формата в массы. Жадность все и тормозит.
 

Msha

ex-Team DUMPz
Hacker
Professional Carder
Joined
Oct 12, 2014
Messages
7,156
Reaction score
2,481
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?
 

Baka

Member
Joined
Nov 17, 2004
Messages
8
Reaction score
0
Msha said:
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?


Плагин к експлореру нормально печатает. Нужно только жать на иконку принтера, которая на дежавюшном баре. Возможно придется еще немного пошаманить: некоторые книги у меня печатаются по-человечески только если поставить масштаб 300% а в окошке печати задать, чтобы использовался текущий масштаб. Когда я пытался в пдф-ки печатать, то размер довольно серьезно увеличивался, нужно быть к этому готовым.

По поводу конвертации: это же формат для хранения графики, во что еще его переделать можно? Можно сделать много отдельных файлов-картинок - см. статью про DJVU OCR в шапке, там есть ссылка на программу. Можно, разумеется потом эти картинки распознать и т.д. Но большинство дежавюшек, которые мне попадались, содержали довольно много формул, схем и т.д., а эти элементы очень плохо поддаются распознаванию.


2 Heralt - djvureader вообще какой-то урезанный вышел - у меня в нем поиск не работает, в то время как в плагине к ИЕ все в порядке.
 

Msha

ex-Team DUMPz
Hacker
Professional Carder
Joined
Oct 12, 2014
Messages
7,156
Reaction score
2,481
Я поставил плагтн к эксплореру, теперь смотрю книжки. Могу сказать, что по мне не очень удобно. Т.к. пролиставать страницу приходится стрелочками, а перелистывать Page Down. Пролистывать страницу PageDown лично мне неудобно - не люблю когда изображение резко сменяется. Я теряю место нак отором остановился и это мешает сосредоточится. Вот PDF в Акробате пролистыавть можно плавно. Нажал стрелку вниз и всё. К тому же мышка позволяет задать постоянную скорость движения страницы.
Плагин для просмотра DjVu мне такихъ вещей не позволяет. Возможно спец. программа лучше, но ставить её как-то ломает.

Ну и если честно, нормальный текст смотрится лучше чем сканированное изображение, особенно если сканировали криво лежащие листы. Неприятно, когда текст наклонён то в одну, то в другую сторону.
________________________________________________________________________

Ещё возникло такое сооображение: если текст содержит большое кол-во картинок, то удобнее формат DjVu т.к. обеспечивает наилучшее сжатие с сохранением качества.
В тоже время если в файле только текст и картинок почти нет, то лучше формат PDF. Т.к. распознаный текст засунутый в PDF занимает меньше места.

Конкретный пример: 600 страниц только рисунков в DjVu занимает примерно 9 Мб, а в PDF значительно больше (где-то 20 -30 Мб, как минимум). В тоже время 600 страниц распознаного текста (только текст) займут в PDF всего 5 Мб (или меньше, 130 страниц заняло 900 Кб), в то время как в DjVu останется всё те же 9 Мб.

Если я чего-то не понял - поправьте меня.
 

pariman

ex-Team DUMPz
Joined
Mar 10, 2004
Messages
1,718
Reaction score
983
Location
Ukraine
Спец программы не лучше. DJVU Reader ставить не надо, он просто распаковывается, после чего запускается экзешник.
У меня есть книжка CRC.Concise.Encyclopedia.of.Mathematics.2nd.edition.djv, в которой ~3300 страниц. Размер ~66 метров. Представь сколько понадобилось бы времени на распознание. В pdf, кстати, эта книжка, не знаю правда как, но влезла на диск - 694 метра.
 

leosan

Member
Joined
Apr 17, 2004
Messages
80
Reaction score
28
Age
25
Zygot,
А как можно конвертнуть из djvu в pdf?/b]

Печатать через FinePrint pdfFactory
 
T

TsAN

Zygot said:
А как можно конвертнуть из djvu в pdf?
Можно так же использовать редактор (наиболее доступен Djvu Solo), позволяющий экспортировать страницы в формате bmp. И уже из этого формата преобразовать в нужный.

Удачи!
 

Starr ®

Member
Joined
Jul 20, 2004
Messages
9
Reaction score
0
Кое-что о дежавю

Вообще, формат сам по себе нормальный и бояться его не нужно. Есть замечательная программа для просмотра файлов этого формата. называется она DjvuReader. Работает лучше любого плагина. Все замечательно смотрится, листается, распечатывается и т.д.

Проблем с переводом из этого формата в любой другой графический формат тоже никаких: Делаете печать из Fine Print и сохраняете как вам вздумается.

Переводить в pdf глупо и бессмысленно: Файл получается в несколько раз больше оригинала.

Гораздо больше проблем с созданием файлов djvu. То есть с созданием множества файлов. Потому как, если вам нужно несколько документов из любого формата превратить в djvu, то вы просто посылаете их на печать на виртуальный принтер производства Lizardtech (владельца этого формата) и все: на выходе готовый файл в djvu.

Проблемы возникают, если вам нужно переконвертировать в djvu скажем 500 документов (или более того). В таком случае вам нужно каждый файл открывать и посылать на печать в djvu "ручками". Как либо автоматизировать этот процесс пока ни укого не получилось :(

Существует правда такая програмка, как "Document Express Enterprise Edition", которая все сама делает, укажи только папку с файлами. Но вот стоит она несколько десятков КилоБаксов и просто так ее еще никто в сеть не выложил :(((

Если у кого вдруг появится: Срочно сообщите!!!
 

ТРУП

Member
Joined
Feb 20, 2004
Messages
26
Reaction score
4
Age
60
Location
Израиль
Website
aircastles.org
Заинтересовавшись одной из книжек, скачал ее и тут же скачал DjVuReader
Поставил, начал смотреть и тут же столкнулся с проблемой - не перелистывается. Зависает программа.
Запустил заново - то же самое
Опять пробую, сразу затребовав нужную страницу - читает, но следущую опять подвисает
Думал "криворучки" , пошел на другой комп - все тоже самое.
Скачал по приколу другую книжку в том же формате

Результат одинаковый... Последней каплей было то, что после очередного запуска и пробы запустить страницу, дежавю подвисла так что из не удаляется даже из таскменеджера

в чем проблемма?
 
Last edited by a moderator:

barsjata

Member
Joined
Oct 22, 2004
Messages
65
Reaction score
1
Age
49
Не работайет ДЙВУ !!!
3 Проги испробаwал , 10 Книг скачал, -> не работает !!!
У кого такие Проблеми ???
 

Epsilon

New member
Joined
Feb 1, 2004
Messages
1
Reaction score
0
Вопрос такой - а можно ли извлечь файлы из ДеЖеВЮ для последующей их редакции (т.е. DjVu -> tiff, jpg, bmp) и где взять пакет программ для сжатия файлов в DjVu. У меня 100 МБ остканенных книг в tiff и надо бы их сжать и выложить, чтобы другие не сканили.
 
Last edited by a moderator:

pariman

ex-Team DUMPz
Joined
Mar 10, 2004
Messages
1,718
Reaction score
983
Location
Ukraine
epsilon, все можно, просто в DjvuEditor-е сохранить как...
barsjata, DjvuReader даже ставить не надо, распаковал и работай. Что за проблемы могут быть даже не представляю
 
Status
Not open for further replies.
Top