C
cwiz
Многоуважаемый all, предлагаю отказаться от OCR.
Дело в том, что отсканировать средний томик в грейскейле в р-ии 300dpi занимает не больше полутора часов. А вот OCR'ить гораздо сложнее — велико число ошибок разпознавателя, чтобы от них избавиться приходится делать по 2-3 прохода. Врему уходит на очистку от артефактов, следов пылинов и т.д.
Так вот, предлагаю отказаться от OCR'а в пользу png или djvu. Вы тратите меньшн времени, нам удобее и легче читать. Те кому книга понравится могут сделать КАЧЕСТВЕННЫЙ OCR и поделиться с нами. Посмотри на всякие DDU, LiB — они выкладывают либо полный, хороший OCR книжек, либо вообще книги без OCR. До качественного OCR'a русского текста требуется много опыта и времени, что врядли выполнимо. Итак, кто за отмену OCR'a в пользу DJVU, png, etc?
Дело в том, что отсканировать средний томик в грейскейле в р-ии 300dpi занимает не больше полутора часов. А вот OCR'ить гораздо сложнее — велико число ошибок разпознавателя, чтобы от них избавиться приходится делать по 2-3 прохода. Врему уходит на очистку от артефактов, следов пылинов и т.д.
Так вот, предлагаю отказаться от OCR'а в пользу png или djvu. Вы тратите меньшн времени, нам удобее и легче читать. Те кому книга понравится могут сделать КАЧЕСТВЕННЫЙ OCR и поделиться с нами. Посмотри на всякие DDU, LiB — они выкладывают либо полный, хороший OCR книжек, либо вообще книги без OCR. До качественного OCR'a русского текста требуется много опыта и времени, что врядли выполнимо. Итак, кто за отмену OCR'a в пользу DJVU, png, etc?