Когато работите с документи, сканирани книги и pdf файлове, често е необходимо да ги редактирате. За да направите това, трябва да разпознаете текста в pdf формат и да го конвертирате в обикновен текстов формат. Това може да стане по няколко начина.
Разпознаване на PDF текст
Електронните документи, създадени от текстов редактор, лесно се разпознават от безплатната програма Adobé Rеader. Отворете необходимия PDF файл в програмата, отидете в менюто "редактиране", в падащия прозорец изберете реда "копиране в клипборда". Създайте нов документ в Word, поставете текста от клипборда в него и го редактирайте, след което го запазете в необходимия формат.
Можете също да конвертирате и редактирате PDF файлове с помощта на многофункционалната помощна програма Acrobat Reader DC. Софтуерният продукт разполага с голям брой инструменти за работа с електронни документи.
Те са добри програми, но няма да могат да разпознаят текст, ако pdf документите са защитени от редактиране или сканирани от хартия. В този случай се нуждаете от специална програма за OCR.
OCR
Безспорен лидер е ABBYY FineReader, програмата разпознава отделни страници и работи в групов режим. Обработеният текст може да бъде запазен в txt, doc, html и други формати. Програмата разпознава pdf текста доста добре. Може да има малък процент неправилно разпознати символи и документът ще се нуждае от ръчна ревизия, резултатът зависи от качеството на сканирането. Тази програма има един недостатък - тя е платена.
Има и други платени и безплатни програми, които ви позволяват да разпознавате и конвертирате текст от pdf в дума: безплатно - CuneiForm, Freemore OCR, FreeOCR; платено - Readiris Pro, Nitro PDF Professional.
Разпознаване на текст онлайн
Ако не конвертирате електронни документи всеки ден, просто трябва да работите с PDF формата веднъж, в този случай няма смисъл да инсталирате програмата на вашия компютър. Има онлайн услуги за такива епизоди. Също така е удобно да ги използвате по време на работа, докато пътувате, когато наблизо няма компютър с инсталирана програма. Онлайн услугите ви позволяват да разпознавате текст безплатно и бързо. Ето няколко:
- Онлайн OCR - www.onlineocr.net
- NewOCR - www.newocr.com
- Безплатно OCR - www.free-ocr.com
- OCRConvert - www.ocrconvert.com
Има много положителни аспекти в онлайн разпознаването на текст, но има и недостатъци: трябва да се регистрирате в услугата; не всички услуги имат функция за експортиране, трябва да копирате разпознатия текст от уеб страницата; някои услуги имат ограничение за броя на обработените документи; качеството на крайния резултат зависи от скоростта на интернет.
Както се оказа, не е трудно да разпознаете pdf текста, има различни програми, можете да изберете всяка.