- Thread starter
- #21
делись, конечноdobri said:Кстати, там где сканы (а они почти везде плохого качества), есть и уже распознанный текст. Могу поделится методикой как его от туда вытянуть ( правда, это занимает какое-то время).
только стоит иметь ввиду что распознанный текст на бизбуке очень далек от идеала ( чисто машинное распознавание (без форматирования и разбития на колонки, если они там есть) - никакой корректуры, т.е. иногда идет откровенный бред, особенно при плохом качестве сканирования и наличия картнок на странице.