Кто делал электронные книги?

Делали ли вы электронные книги?


  • Total voters
    186
Status
Not open for further replies.

lohness

Профи
Joined
Mar 26, 2004
Messages
720
Reaction score
1,559
Location
Moscow
OnThink said:
нет. К сожалению, время упущено. Аборт делают только на ранней стадии беременности. ;)

ну не совсем так
скорее даже совсем не так...
и аборты делают на разных сроках
и чистить можно практически любой скан

Конечно сделать из скана с бликующей или черной полосой по диагонали, вряд-ли что удасться.
Но откорректировать контраст и яркость, убрать мусор и многое другое можно.
Превратить бумагу из желтой (серой в ч/б) в белую убрать пятна и детские каляки-маляки можно - главное желание и ВРЕМЯ (куча времени).

Иногда проще все-таки найти оригинал и отсканить снова (если проблема появилась на стадии сканирования)

А вот брать пережатый в pdf или djvu файл, конвертить его обратно в картинки и снова чистить точно не стоит. Обычно "авторы" таких файлов сильно уменьшают размер и как следствие качество сканов.
 

AlexPkr

Member
Joined
Aug 22, 2004
Messages
54
Reaction score
3
Age
54
Нориально получается делать в FineReader'е.
Распознаешь текст и сохраняешь в pdf и картинки и текст.
 

peps

Member
Joined
Feb 24, 2006
Messages
65
Reaction score
53
Age
43
Location
Дзержинск
Когда готовлю статьи для публикации на сайте то для сканирования изображений пользуюсь Fotocanvas из пакета ACDSee 5.0 очень просто и удобно. Ну а если надо выдрать текст, то конечно это FineReader читает даже старые газетные статьи.
 

Anri

Member
Joined
Aug 16, 2005
Messages
25
Reaction score
65
Location
Samara
Без FineReader в этом деле очень сложно обойтись.
Есть, конечно, и другие распознавалки (раньше пользовался, например, CuneiForm), но рабоают они много хуже.
 

Vadimir

Member
Joined
Dec 8, 2004
Messages
56
Reaction score
13
xolms
вопрос - как исправить плохой скан ? можно-ли это сделать фотошопом?
Пользуйтесь сканкромсатором! Если не испугаетесь :).
 

lohness

Профи
Joined
Mar 26, 2004
Messages
720
Reaction score
1,559
Location
Moscow
Отсканировал не одну сотню книжек и журналов
Перевел в электронный вид почти все художественные книги со своего стелажа. Потом принялся за технические и журналы.
Художественную литературу делать легче всего - отсканил, распознал, проверил, вычитал и готово.
Старые книги приходится еще чистить от мусора возникающего из за старой темной (желтой) бумаги.
Журналы, детские и технические книги содержат большое количество иллюстраций. Возникает дилема в каком виде сохранять. Если картинок немного, то формат HTML со вставкой картинок. Если же много и хочется сохранить оформление (особенно журналы и детские) то сохраняю в JPG 300 dpi для своего архива и сжав до 40-50 процентов сохраняю в DJVU для выкладывания в интернете (проблема размера).
Основное время уходит на очистку таких сканов от мусора.
Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.
 

e-lena

Member
Joined
Oct 1, 2006
Messages
5
Reaction score
0
Location
Москва
Website
imagination-forum.com
Я делала много электронных книг. Сканировала с хорошим разрешением (300 dpi), потом в Фотошопе выравнивала страницы, делала их белыми (скан у меня получался немного серым), обрезала ненужное. Конечно, это требует времени и сил, но зато потом как приятно такую книгу смотреть. :)
 

Alex Pro

Member
Joined
Nov 10, 2006
Messages
25
Reaction score
11
Location
Kisinev
Работа та еще... мне очень жаль тех людей , которые занимаются вычиткой и прочим постоянно

Впервые в этом форуме, дай, думаю, загляну. Ну и, конечно, потянуло в книжный раздел, хотя форум нашел ради музыки.
Сам я сканирую книги около 4 лет, сделал около 300 книг, т.е. отсканил более 100 тыс. страниц. Сканю в ФайнРидере (8-м), сам вычитываю, перегоняю в формат word-doc, картинки к избранным книгам сохраняю в JPG в этом же файле или (для особо-художественных изданий отдельно в виде слайд-шоу, обычно с музыкальным сопровождениям). Это, так сказать, для гурманов. Сканю только художественную, биографическую лит-ру, отборное литературоведение, кое-что по искусству (джаз, живопись), кое-какие исторические труды. Пользуюсь только книгами из своей библиотеки, благо собиралась она около 45 лет и собралось около 8 тыс. книг. Собственно и сканить начал из-за того, что после меня моя библиотека скорее всего разбежится по рукам и сгинет, что хоть и обидно, но неизбежно. Сканирование и особенно вычитка (а это не менее 2 проходов) отнимает много времени и здоровья (глаза сильно устают). Постоянно выкладываюсь в б-ке Александра Белоусенко, делаю посты у Кэпа (kpnemo), модерирую форум библиотеки, отдельно выложил все, сделанное мною в библиотечке на Рапиде.ком.
А теперь постараюсь ответить на цитату, вынесенную в начало. Жалеть окрщиков не нужно, каждый из них (я имею ввиду тех, кто этим занимается постоянно и кого признало сообщество коллег по "профессии") занимается этим сугубо по личным соображениям, имеет склонность к просветительству, альтруизму, озабочен низкой общей и сетевой культурой и, наконец, отличается определенным складом характера. Конечно, окрщик должен быть культурен в самом широком смысле слова, очень грамотен, энциклопедически образован, иметь приличный художественный вкус, быть любознательным и контактным. Конечно, все это в идеале, хотя список требований для занятия этой деятельностью я привел далеко неполный.
И последнее. Сканирование и вычитка книг (не технических) предполагает очень вдумчивое перечитывание обрабатываемой книги. Поэтому каждый, кто сканит, делает в первую очередь свои любимые или близкие ему по духу книги. Подчеркну, что работа эта абсолютно бескорыстна и кроме потери времени и зрения других "доходов" не приносит. Но здесь очень важен моральный фактор. Он является определяющим для постоянного занятия этим нелегким делом.
 

borisrs

Member
Joined
Sep 17, 2004
Messages
28
Reaction score
14
Отсканировал чуть более десятка книг. Все перевел в дежавю. Качество меня (и не только) устраивает.
Предпочитаю по возможности делать черно-белый (двухцветный) вариант.
Если есть полутоновые картинки, то можно только эти страницы сделать в сером формате. Важно в начале сканирования не полениться настроить порог чувствительности сканера. Тут надо попробовать разные варианты и выбрать оптимум. Тогда часто удается избавиться от "грязи" еще на этапе сканирования. Любимое разрешение 400 dpi. Сжатие .jpg к сканам текста применять неправильно, т.к. на контрастных переходах появляются хорошо (а на самом деле это плохо) заметные артефакты. Использую формат - Tiff (ч.-б.: без сжатия для дальнейшей переработки и со сжатием CCITT Group4 - для хранения; серый - сжатие Lzw, в программе ACDSee 5.0). Если книга небольшая (до 300 стр.), то можно сжимать с помощью Document Express Editor v5.0.0 Build 16 plus. Можно и большую но тогда лучше по частям. Приходится временами подождать.
Если загнать очень много страниц (более 300), может и зависнуть.
Подробно о создании книг в дежавю написано по ссылке. Там же куча софта, из которого необходима небольшая часть. OCR я не добавляю. Можно его добавить и после создания книги. Имеется недостаток: русская г становится латинской R.
 

miralita

Member
Joined
Oct 26, 2004
Messages
9
Reaction score
4
Age
45
В свое время довелось, можно сказать, профессионально заниматься электронными книгами. Сканирование, вычищение в фотошопе, сохранение в TIFF CCITT Group 4, а там в зависимости от пожелания заказчика - либо PageMaker -> принтер, либо в PDF.
Неплохо набила руку на сканировании старых книг, где текст был едва различим даже на глаз. Сканировалось в полноцвете, вытягивались уровни, потом уже руками или фильтрами (в зависимости от результата - фильтры сильно бьют коцаный текст) - убрать шум.
 

Ares_XT

Member
Joined
Apr 25, 2007
Messages
41
Reaction score
35
Location
Россия
Делал парочку книг в формате СНМ с бумажного оригинала. Чтобы сделать качественно, нужно МНОГО времени.. Поэтому особенно этим и не занимаюсь. \На заметку: Если есть ксерокс типа WorkCenter 130, то сканирование одной страницы занимает секунд 5.
 

tehspec

Member
Joined
Nov 7, 2007
Messages
6
Reaction score
0
Приветствую всех собравшихся).
Книжек и журналов отсканил в свое время просто огромное кол-во.
Поначалу пытался переводить их в Word-DOC, но потом забросил эту идею, потому как практически весь материал это техническая литература с огромным количеством формул и картинок.
В итоге стал сшивать в pdf и DjVu, но в максимальном качестве, что бы потом без проблем и потерь читать.
 
Joined
Dec 14, 2007
Messages
8
Reaction score
1
Location
Москва
Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.

для этого есть регулировка чувствительности к оттенкам серого =)
гораздо хуже вариант, когда исходный аналорговый вариант сильно затерт и засален(а это чаще всего происходит с часто используемой литературой узкой специализации)...
в таких случаях может не помочь регулировка чувствительности к оттенкам серого, т.к. оттенки засаленности и потертый текст в черно-белом варианте приравниваются...
в таком случае иногда легче распознавать цветной вариант страницы, т.к. желтый и серый сильнее отличаются =)
но обычно такие книги стоят затраченных на них усилий и им ну очень рады коллеги =)
 

fed

Member
Joined
Feb 2, 2004
Messages
20
Reaction score
1
Не все так плохо при наработанном опыте. А чем больше вложишь старания, тем качественнее результат.
 

OnThink

Member
Joined
Jul 10, 2004
Messages
35
Reaction score
1
PDF и DJVU - не электронные книги. От силы электронный архив.
Нормальные форматы epub, RTF (doc), fb2. Только из них возможна нормальная конвертация иллюстриованных книг для электронных устройств.
epub - формат поддерживаемый Adobe и его можно подготавливать в InDesign CS3.
 

dss2002

Member
Joined
Jan 12, 2004
Messages
20
Reaction score
0
Не соглашусь. Берешь доку, например с курсов циски, где дают только распечатки. Суешь в пакетный сканнер. Потом - файнридером распознаешь, по поводу качества не морочишься.
Далее - в djvu, и в него добавляешь прозрачный текстовый слой. И поиск работает и скачеством распознавания можно не морочиться - быстро и качественно и небольшой размер
 

o-mega

Member
Joined
Mar 14, 2008
Messages
7
Reaction score
1
А если не морочиться в файн-ридере то потом будешь морочиться с чтением. Имхо не вариант.
 

RashidOS

Member
Joined
Oct 17, 2008
Messages
5
Reaction score
0
делал много книг. файнридер + pdf. другие варианты меня не устроили.
 

GukaGuka

Member
Joined
Sep 25, 2008
Messages
5
Reaction score
4
Качество сканирования зависит от задачи:
1. Нужен текст, не нужны картинки;
2. Важен текст, чтобы напрямую копировать надо...
и много других
Опять же важно для каких целей: для себя - одно, выкладывание для людей - другое.
Плохо сканированные, с проблемами не только копирования, но и чтения не люблю. Но если честно - не ропщу. Спасибо и на том, хоть времени порой, убивается невозможно много...
Спасибо всем кто сканирует и делает это хорошо!
 
Status
Not open for further replies.
Top