Кто делал электронные книги?

Делали ли вы электронные книги?


  • Total voters
    186
Status
Not open for further replies.

Serg104

Member
Joined
Aug 16, 2005
Messages
10
Reaction score
0
Age
41
Location
Спб
Имхо, хороший справочник стоит очень хороших денег, но это справочник и его не надо _читать_ - раз глянул и закрыл. Для этого подходит любой, хоть эл., хоть бум. вариант, хорошего или не очень качества. Ессно если качество такое, что и текста не разобрать - то это не книга, а зря потраченное время, но если книга полезная, даже терпимого качества, то используйте что есть. И нечего камнями кидать - плохо, все плохо. Мне например больше не нравится когда работа недоделана. Пусть и отлично, но сделай до конца, а то бывает 10 листов недосканил и в комментах пишет: "...а там не интересно было...". А может интересно? Меня например раздражает... А так книга целая, ну больше она Кб на 100-200, потерпим даже пару метров... Так же не нравятся цветные картинки в черно-белом варианте... Экономия или издёвки?
 

Ruslan2000

Member
Joined
Apr 22, 2004
Messages
77
Reaction score
2
Я делал книгу (точнее книги 3)
1 с нуля - в нете ее нет и не будет - Потому что я ее не выложу (ну пока учусь в инсте точно не выложу ибо кофедральная - по Политологии) - Делал ее гдето неделю - Но там реально Все слова распознаны все рисунки и графики перересованы заного (практически) для того чтоб лучше Читалось - Сканил в разрешении 300dpi через Finereader 6.0 - Распозновал все в ручшую (Совет при сканировании Очень плотно прижимать книгу к сканеру так как на изгибе(по середине книги) когда она толстая плохо сканируется и не распознается без ошибок - я всегда правил - так что если есть возможность РАсшивайте книги) Сохранил сначала в Ворд (для исправления граматики - так как не всегда можно про контролировать ошибки граматические - не FineReader тоже проверял но по второму разу я обнаруживал все таки ошибки - еще со временем когда стал перечитывать оказалось не иногда часть предложения начинается с Красной строки - не вовремя нажатый Интер) но потом перевел в pdf с оглавлениями(закладками)
Остальные 2 книги просто переводил из формата DjVu сделал тока закладки распозновать было в лом Тока закладки сделал (да и качество было картинок хорошое изначально)
 

Serg104

Member
Joined
Aug 16, 2005
Messages
10
Reaction score
0
Age
41
Location
Спб
toRuslan2000 "...Сохранил сначала в Ворд (для исправления граматики - так как не всегда можно про контролировать ошибки граматические..." С заметками тоже так поступай, их читать невозможно.
Если в слове ХЛЕБ сделать 4 ошибки, то получится ПИВО
Проверяй орфографию...
 

Ruslan2000

Member
Joined
Apr 22, 2004
Messages
77
Reaction score
2
ну без грамотен я чтож поделать)) - ну все равно вроде понятно написал
 
T

Terabyte

Хочу оцифровать одну очень инетересную компьютерную книжку =) Из техники есть сканер EPSON Perfection 1670 и фотик Nikon Coolpix 8700 (8-мегапикселей). На каком девайсе лучше делать сканы (для последующего перевода в TXT, т.к. в книге картинок нет): сканер или фотик (быстрее)?

Формат думаю лучше сделать txt, так что наверно тогда нужно будет юзать (тут вроде альтернатив нет?) Abbyy FineReader...
 

Serg104

Member
Joined
Aug 16, 2005
Messages
10
Reaction score
0
Age
41
Location
Спб
Если есть штатив, то можно попробовать фотик, у меня на 5М получалось, правда несколько страниц делал, правда с освещением надо экспериментировать. Зато по скорости экономия в разы. Но со сканером и привычнее и освещение всегда одинаковое.
 

lohness

Профи
Joined
Mar 26, 2004
Messages
720
Reaction score
1,559
Location
Moscow
Сам сканил очень много книги и журналы.
Сканеры были разные - от ручного до А3 планшетки
В большинстве случаев обработка FineReaderom (прошел от 3-й версии до 8-й)
И проверка на ошибки WORD-ом. С последующим переводом в HTML для таблиц и картинок. по крайней мере размеры всегда удобоваримые.
Раньше то не было гигушных хардов.
Фотиком ни разу ни делал - не было приличного.
 

Estarriol

Member
Joined
Dec 2, 2004
Messages
13
Reaction score
1
Я сделал несколько книжек, 2 "Кокологии", к примеру, сейчас обдумываю что сделать с 900-страничной "Историей атеизма" -- то ли в РТФ, то ли в ПДФ, при этом надо не потерять юникод, поскольку есть сноски на французском.

Как-то фотографировал книги в библиотеке ИГП РАН, до сих пор лежат. К распознаванию, к сожалению, вроде бы не пригодны, однако читать легко. ;)
 

tranvask

Member
Joined
Jun 21, 2004
Messages
33
Reaction score
0
Age
61
Поделитесь, пожалуйста, какими программами делaют .djvu, и как в этом формате можно текст распознавать?
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
Vish666
Не знаю сколько весит DjVu вместе с OCR, т.к. сохранить вместе не удалось
Весит как любой текст 2-3 кб на страницу, ежели текс не мелкий.
А загнать распознаный текс проще простого, распознаем сканы, которые жали в джавю, в файнридере в пакетном режиме (нужен 7 версии, в 8 изменился формат), сохраняем пакет, а затем с помощью замечательной утилиты от Генчо (ищем, это не сложно) в 5 минут несколькими кликами мыши и все проблемы :).
 

OnThink

Member
Joined
Jul 10, 2004
Messages
35
Reaction score
1
tranvask said:
Поделитесь, пожалуйста, какими программами делaют .djvu, и как в этом формате можно текст распознавать?

Дежавю - аналог PDF, только ПДФ на основе формата TIFF, а дежавю - на основе джипега. Поэтому распознаётся намного хуже. О том, чтобы сохранять в дежавю текст, я ещё не слышал.
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
tranvask
Поделитесь, пожалуйста, какими программами делaют .djvu, и как в этом формате можно текст распознавать?
для начала может сойти Dcument Editor Express (1514201 bytes)
качать
Для распознования в djvu нужна полная версия, порядка 200 метров.
Но лучше всего с этим не связываться, а распозновать по старинке в файнридере.
для вставки распознонго текста есть удобная утилита от Генчо
DjvuOCR_2.0_pre.rar (1227416 Bytes)
тут
 

Ognev

ex-Team DUMPz
Joined
Aug 20, 2018
Messages
2,103
Reaction score
902
Age
25
Всем доброго времени суток. Если кто-нибудь пользовался утилитой pdftodjvu, подскажите, что нужно для ее работы. А то то, что у меня есть не желает работать ни в какую. А еще лучше, если кто-нибудь выложит рабочий набор, а то не хочется ради такой мелочи ставить полный Document Express.
 

peps

Member
Joined
Feb 24, 2006
Messages
65
Reaction score
53
Age
43
Location
Дзержинск
В свое время делал для друзей сканы журналов по радиоэлектронике.
Расшивал журнал, сканировал все страницы прямо в DJVueditorpro 4, благо у него есть поддержка TWAIN - источников.
Почему DJVu? Да просто журналы содержат большое количество схем, чертежей и по этому проще выводить их в графическом формате .djv .
Вот Вам и ответы на все вопросы - нет однозначно лучшего формата.
Для текста - лучше .chm или .txt/
Для журналов со схемами и чертежами, а также где не важно качество графики, но ее много - .djv .
Ну, а уж журнал "Плей бой" - лучше смотреть в - .pdf .
Всем Удачи.
 

iggalp

Member
Joined
Apr 28, 2005
Messages
33
Reaction score
0
Age
49
Location
Moscow
Вообще при переводе книг в электронный формат не делать OCR это преступление. С современным алгоритмами распознавания это совсем не трудно, зато проявляется уважение к обществу и своему труду. Если картинок нет (или их мало), то результат должен быть txt ли html (если есть картинки). Если картинок много или нужно кровь из носа максимально сохранить форматирование базового источника, то результат лучше всего выгружать в pdf
 

iggalp

Member
Joined
Apr 28, 2005
Messages
33
Reaction score
0
Age
49
Location
Moscow
Вопрос размера файла все больше и больше уходит в прошлое. Вот станет широкополосный интернет общим местом и будет в этом вопросе последняя точка. Видоизменения Ворда как нельзя лучше иллюстрируют такую тенденцию (размер doc-файла уже первосходит все разумные пределы и ничего, пипл хавает). В этой связи djvu это тупиковая ветвь, которая должна умереть. Проблемы с распространимостью очевидны, а преимуществ глобальных нет.

2Vish666
ИМХО не распознавать отсканированную книгу - это не уважать ни себя ни других. Исключения - математика, Там формул много, а они пока не распознаются
 

lohness

Профи
Joined
Mar 26, 2004
Messages
720
Reaction score
1,559
Location
Moscow
Не скоро еще станет общим местом широкий инет (по крайней мере у нас в России)
А занимаются сканами обычно энтузиасты-бессеребренники
А по диалапу выкладывать большие файлы очень даже тяжко.
По себе сужу если бы не "халявный" инет на работе не удалось бы поддерживать свою страничку и выкладывать для людей такое количество литературы.
Причем могу выкладывать только на зоне РУ, так как рапида для нашей конторы уже не бесплатная и соответственно получу по шапке если с ней свяжусь.
Отсюда же и выкладывание в формате djvu - размер меньше.
А отсканить детскую книжку или журнал какой нибудь с переводом в текст или html не выйдет - слишком много графической информации.
Обычные книги (для взрослых) это да не понимаю почему люди не делают OCR
и выкладывают PDF по 100 метров
 

Serg104

Member
Joined
Aug 16, 2005
Messages
10
Reaction score
0
Age
41
Location
Спб
ИМХО если уж распознал, так и сохрани в Ворд, или txt, а djvu с полураспознанным подслоем это сомнительное удовольствие, выдирать текст оттуда никто не станет - отсутствует смысл самой djvu`хи, а с экрана читать - не нужен OCR, исключение pdf - значительно уменьшается размер, и качество становится несоизмеримо выше, да и пятен лишних нет.
 

xolms

Member
Joined
Feb 23, 2006
Messages
30
Reaction score
1
Age
58
Location
САМАРА
вопрос - как исправить плохой скан ? можно-ли это сделать фотошопом?
 

OnThink

Member
Joined
Jul 10, 2004
Messages
35
Reaction score
1
вопрос - как исправить плохой скан ? можно-ли это сделать фотошопом?

нет. К сожалению, время упущено. Аборт делают только на ранней стадии беременности. ;)
 
Status
Not open for further replies.
Top