Предпочтительный формат для чтения тех.книг?

Предпочтительный формат?

  • PDF

    Votes: 208 52.8%
  • DJVU

    Votes: 67 17.0%
  • CHM

    Votes: 55 14.0%
  • Другой

    Votes: 64 16.2%

  • Total voters
    394
Status
Not open for further replies.
C

cidex

PDF формат хорош если книга отекстована, а если книга состоит из сканированных картинок, то рулит DJVU, а на PDF-ку метров или времени (по Dial-Up) на выкачивание много уходит. Так как я сам пару книжек текстовал и знаю как это долго и нудно, мой выбо DJVU. К тому же по моему DialUp-у да еще появляющемуся от случая к случаю большие объемы качать проблемотично.

По поводу содержания могу сказать, что если читаешь не художественную литературу, то оно просто необходимо. В большенстве сканированных книг оно есть, только желательно проверять, чтобы номера страниц в содержании книги совпадали с номерами страниц в файле.
 
Last edited by a moderator:

vcustoms

Member
Joined
Nov 13, 2004
Messages
15
Reaction score
1
если качественный скан - разницы для меня нет, а так привычней пдф или читалками (при отсутствии картинок и форму)
 

QoSyS

Platinum
GOLD
Coder
Carder
Joined
Dec 24, 2015
Messages
494
Reaction score
297
Age
38
CHM навсегда!!
pdf - Acrobat тормознут
djvu - Картинки, плохо с текстом (+ плохой браузер)
 

Yoxel

Member
Joined
Aug 11, 2005
Messages
44
Reaction score
25
Website
primus.mylivepage.com
Если вам нужно РАБОТАТЬ с книгой а не просто ЧИТАТЬ, то тогда удобны форматы работающие с распознанным текстом PDF, CHM даже DOC, RTF и TXT будут удобнее чем тот же PDF но без OCR или DJVU.
 

alexGER

Member
Joined
Dec 13, 2003
Messages
12
Reaction score
0
Age
56
Location
Украина
Безусловно PDF. А кому не нравится Acrobat, можно использовать альтернативные PDFreaderы. И правильно cidex - очень часто номера страниц книги не совпадают с файлом.
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
Люди, не надо путать себя и других.
pdf только если это оригинал, т.е. векторный, большинство тянутых западных книжек соответственно.
CHM это как правило стянутая html версия книги, пользуйтесь какие тут могут быть вопросы.
txt - читайте классику люди.
DJVU - но если у Вас есть бумажный исходник чего нибудь научно технического, то однозначно он! Грамотно сделанный DJVU отличного качества картинка, в точности повторяет оригинал, имеет гипертекстовое оглавление, распознанный (но естественно не вычитанный :)) текстовой слой который можно с легкостью копировать.
 

Senja2

Member
Joined
Jun 12, 2005
Messages
297
Reaction score
9
Age
39
Location
Russia
PDF лучше и возможностей больше. но весит много.
djvu до него далеко, но он как раз сжимает лучше.
ПДФ лучше потому что можно распечятать при желании в нормалнуу книгу
djvu Тоже распечатывать можно "в нормалнуу книгу"
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
Чего это сильно больше по возможностям у pdf относительно djvu?
Если про полнотекстовой поиск, то в нормально сделанном djvu он есть.
Пользуйтесь Document Express Editor 5, и будет почти все хорошо :).
(для примера, можете посмотреть, сделанную мной книжку Перкинс Исповедь экономического убийцы, лежит в соседней ветке). - это реклама :).
 

Senja2

Member
Joined
Jun 12, 2005
Messages
297
Reaction score
9
Age
39
Location
Russia
а ты открой AcrobatPro и погляди какие там примочки можно сделать при оформлении книги. это и всплывающие подсказки и пояснения, и флэш-ролики, диаграммы анимириванные и куча всего другого. не факт, что этим польжзуется большинство, но формат сам это все поддерживает. поэтому и возможностей больше.
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
Senja2
ну ладно, убедил :), флэш ролики это круто (правда не видал).
Только просьба перечитать мой предыдущий пост.
Я там кажется ничего одиозного не писал. Как было сказано "каждому своё" - в смысле для каждого случая надо грамотно выбирать формат.
Я там сказал, что если надо перевести бумажный научно-технический оригинал в электронный вид, то с djvu никто и рядом не стоял.
Что-то я не видел pdf из сканов с рюшечками (сходи на медиго и посмотри на тамошних 100 метровых бегемотов :)).
 

Senja2

Member
Joined
Jun 12, 2005
Messages
297
Reaction score
9
Age
39
Location
Russia
а ты перечитай мой предыдущий пост. там я написал, что у djvu сжатие лучше.
а чем ты говоришь книжки делаешь? а то я тут решил забить на pdf и попробовать сканировать сразу в djvu.
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
Senja2
Вот и славно, вот и договорились, типа консенсус достигнут :frendz:
Ну сразу в djvu я не делаю. Что бы получить качественную е-буку, вначале надо обработать полученный после сканирования сырец, а затем уж я кодирую в djvu.
Сканю через интерфейс ACDsee, в нем не надо вручную сохранять на диск (впрочем я думаю таких программ полно, главное неглядя после одной превьюшки сканить в однокнопочном режиме, у меня выходит до 150 раворотов (300 страниц) в час).
Сканирую 300 дпи в сером, есть альтернативщик 600 ч,б, но это дело вкуса и превычек в использовании софта.
Потом этот сырец обрабатывается сканкромсатором (тут главное выставить правильные настройки, иначе можно запороть), на выходе из него ч/б в 600 дпи, все страницы обрезаны, выровнены, и вообще усе симпатично.
Распознование в файнридере в пакетном режиме.
Кодирование в djvu в DEE 5.1 со словарем 200 (размер файла уменьшается на 20-30% по сравнению с умолчальным значением.
С помощью утилиты от Генчо добавляю распознанное.
Потом обложка, оглавление по желанию (тут я делаю в ручную в document express editor 5, хотя есть автоматизация, но я не асилил :))
В общем довольно таки все не напряжно, ручная работа в соновном это сканирование, но со скоростью в 300 стр в час не смертельно :).
 
Last edited by a moderator:

Senja2

Member
Joined
Jun 12, 2005
Messages
297
Reaction score
9
Age
39
Location
Russia
Vadimir
так это ты какую литературу так оформляешь? раз у тебя так все быстро и качественно, то, как я понимаю, художественную или подобную ей, где нет никаких формул, диаграмм и т.д. просто я тут прочел твой пост, представл себе это действо в несколько этапов и понял, что это на любителя. у меня усидчивости не хватит это все далать, поэтому я, если надо, сканы оставляю так, без всяких заморочек. да и книги у меня насыщены формулами, исходными текстами, где нежелательны ошибки распознования. поэтому оставляю оригиналы.
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
Я то же в основном сканю и обрабатываю научно-техническую литературу, для себя и для народа :).
Не надо пугатся, я ничего страшного не написал, наоборот моя метода приводит к сокращению ручного труда, с гарантированным хорошим результатом. Кстати с ее помощью я практически не чищу сканы, поскольку этого и не трбуется, ну если только печать библиотечную стереть (все получается чистенько без точек, мусора и черных полей).
Работа с кромсатором описана в этой незатейливой статейке:
Сканкромсатор в картинках
Только там надо исправить -
1. закладка Book при 600 dpi H.Gap valuу обычно хорошо получается при 200
2. закладка Options Deskew method - interpolate
3. закладка Convert - MiddleDark
- так будет гораздо лучше.
Заодно там можно скачать для ознакомления сделанную мной книжку, но так как это первая моя более или менее качественная книжка, то там не без греха, например нет распознанного текстового слоя.
Кстати об распозновании, это значит всего лишь пакетная обработка без участия человека, в основном это надо для полнотекстового поиска внутри книги, делается это быстро и несложно, поэтому в настоящее время это стало практически обязательно :).
Я вообщето пламенный борец за качественно сделанные книжки :), не могу пройти мимо :).
Очень часто встречаешь книжку, вроде человек старался, даже видно, что человек обрабатывал, но результат, увы блин :(.
 

fracasse

Member
Joined
Feb 3, 2006
Messages
43
Reaction score
2
Location
Россия
наличие оглавления и возможность поиска обезательно!
в pdf книга в среднем весит метров 25
в djvi книга в среднем весит метров 7
в chm книга в среднем весит 1 метр
предпочитаю книги в формате chm из-за малого размера
 

F@r@0n

Member
Joined
Feb 7, 2006
Messages
15
Reaction score
13
Location
Egypt
CHM forever!
+ это не скан, т.е печатный текст и настоящие картинки, а, следовательно, глазки поменьше портятся;
+ малый размер;
+ удобная навигация;

PDF, в принципе, тоже ничего, когда скан хороший или текстом набрано.
 

CaesarY

Member
Joined
Jun 5, 2005
Messages
27
Reaction score
7
Age
40
Location
Москва
Голосование не совсем честное поскольку форматы представляют собой разные "весовые категории". chm - это фактически текстовой формат а pdf и Djvu это по сути картинки с наложенным или неналоженным текстом.
 
Z

zzzu

пдф - действительно с печатью (если нужно) меньше проблем, а теперь еще и 3D в пдф вставить можно. Это если хороший скан с картинками ит.д. Дежавю тоже неплохо - но только если нет пдфного аналога. А ежели нет картинок - то notepad++ =)
 
Status
Not open for further replies.
Top