Djvu - популярний формат для розповсюдження електронних документів в мережі. Він являє собою компіляцію відсканованих зображень в одному файлі без можливості зміни внесених до нього даних. Для вилучення тексту з документа можна скористатися спеціалізованими утилітами.
Інструкція
Для розпізнання djvu та збереження вмісту файлу у вигляді тексту необхідно виконати кілька кроків і скористатися двома програмами. Першою програмою виконується сканування потрібного документа і його перетворення в файл зображення або pdf. На другому етапі проводиться розпізнання отриманого документа в спеціалізованих OCR-утилітах.
Встановіть на комп'ютер програму DjView або DjvuOCR. Для цього знайдіть потрібну утиліту в інтернеті, зробіть її завантаження і запустіть отриманий файл, а потім дотримуйтесь інструкцій на екрані.
Перейдіть в меню встановленої утиліти і виберіть пункт «Відкрити djvu» або «Декодування DjVu файлу». Вкажіть шлях до потрібного документа, після чого виберіть відповідне меню для його перетворення. Вкажіть шлях для збереження файлу і виберіть потрібний формат.
Встановіть утиліту ABBYY FineReader. Вона дозволяє проводити сканування файлів зображень, pdf та виводити їх в текст у форматах docx, doc, txt і html. Завантажити утиліту можна з офіційного сайту компанії ABBYY.
Відкрийте встановлений FineReader за допомогою ярлика на робочому столі або меню «Пуск». Виберіть пункт «Файл» - «Відкрити» і вкажіть шлях до отриманого файлу pdf. Ви також можете скористатися кнопкою «Відкрити» на панелі інструментів.
Після того як програма відкриє документ, натисніть «Сканувати». Дочекайтеся закінчення процедури розпізнання потрібного тексту і зображень. Потім натисніть кнопку «Розпізнати» на панелі інструментів для виділення і перевірки потрібного тексту. В полі «Мова документу» при необхідності виберіть потрібний пункт.
Після того як сканування було завершено, треба редагувати отриманий текст у правій частині вікна програми. Якщо все відображається вірно, клікніть по клавіші «Зберегти» і виберіть формат збереження, а також папку, куди ви б хотіли помістити документ. Після збереження ви можете редагувати отриманий файл за допомогою будь-якого текстового редактора.