Блог за уеб технологии, маркетинг и SEO, мотивация и продуктивност
11 най-добри безплатни OCR онлайн инструменти за 2022 (и за кирилица)
В последно време работя повече със социалните медии и често ми е необходим инструмент за оптично разпознаване на символи (OCR) на различни езици, включително и на езици, използващи кирилица. Използвах един иструмент от разширение на Chrome, но се бях заблудила, че не разпознава български език. Затова се наложи да потърся в мрежата други инструменти. Оттам ми дойде и идеята за този мой списък с проверени най-добри безплатни OCR онлайн инструменти за 2022 г. В края на краищата и моят познат инструмент-разширение се оказа, че разпознава кирилица, но трябва всеки път да сменям настройките в опциите му.
Какво е OCR?
Технологията за оптично разпознаване на знаци (optical character recognition – OCR) е автоматизирано извличане на данни от печатен или писмен текст от сканиран документ или файл с изображение и след това преобразуването му в текст. Полученият текст е възможно да бъде четен от машини и да се използва за обработка на данни, като редактиране или търсене.
Предимствата на OCR технологията за бизнеса
(adsbygoogle = window.adsbygoogle || []).push({});Защо е била нужна разработката на OCR приложения? Причината е в проблемите с хартиените носители, като средство за съхраняване на информация. Увеличаването на документите на хартиен носител през годините става неконтролируемо. Това води до използване на огромни пространства, повече работна ръка, спад на производителността, увеличени цени заради заплащане на хартията и на складови помещения. Да не забравяме, че документите на хартиен носител не могат да бъдат редактирани във всеки момент и редактирането им изисква много ресурси.
Всички тези фактори водят до необходимост от създаването на софтуер за оптичното разпознаване на символи, с помощта на който да се разреши проблемът с редуцирането на хартиените носители.
Предимствата на OCR технологията за бизнеса са:
- Премахване на ръчно въвеждане на данни;
- Спестяване на ресурси поради възможността за обработка на повече данни по-бързо и с по-малко ресурси;
- Намаляване на грешките;
- Преразпределение на физическо пространство за съхранение;
- Подобрена производителност.
Най-добри безплатни OCR онлайн инструменти с оптично разпознаване и на текст на кирилица
Инструмента, който най-често ползвам при работа е Copyfish – разширение за Chrome.
Copyfish
Copyfish е удобно разширение за Chrome, Opera, Edge, Firefox, което за няколко секунди оптически разпознава, разчита и дава възможност за копиране на текст от всяко изображение в браузъра.
За да копира текст на кирилица, поради липса на опция за български език, трябва са се използва опцията за руски език, която разпознава отлично всички български букви. Може да се направи съкратена настройка за избор на 3 езика в момента на разпознаване на текста.
Pdf24 OCR
Pdf24 OCR е чудесен инструмент, който бързо разпознава оптично текст на различни езици и го превръща в pdf файл.
- Използвай полето за избор на файл в горната част на страницата, за да избереш файловете, в които искаш да разпознаеш текст.
- Промени настройките, за да кажеш на приложението как трябва да работи разпознаването на текст.
- Стартирай разпознаването, като натиснеш съответния бутон.
- Натисни бутона Download, за да запазиш PDF файловете с разпознат текст на компютъра.
Google Drive
Ако използваш услугите на Google, едно от най-лесните решения за инструмент OCR е Google Drive.
Той не е предназначен изключително за OCR сканиране, но предлага много интересни функции.
За да извлечеш текста от изображение или сканиран PDF, първо трябва да качиш и конвертираш файла в Google Drive.
Влез в своя Google Drive, иди на Настройките горе вдясно и избери Настройки за качване – Settings–>Convert uploads. Сложи отметката на Convert uploaded files to Google Docs editor format.
След това кликни върху бутона Качване – New–>File upload, който се намира горе вляво, и да избери файла за качване от компютъра си.
В края на операцията файлът ще се покаже в списъка с наличните файлове и папки в Google Drive. След това трябва да кликнеш върху него, за да отвориш документа.
След всяка страница на документа Google Docs ще ти показва извлечения текст. С помощта на менюто File е възможно да изтеглиш файла като документ на Word или други формати.
Форматирането се поддържа доста добре, поддържат се PDF и основните графични формати и голям брой езици, включително български.
Има и някои ограничения: файлове с размер, по-голям от 10mb, не могат да се обработват. В документи, състоящи се от няколко страници, текстът се извлича само в първите десет. Но тези трудности с малко хитрост могат да се прескочат.
Виж още: Превод на PDF, DOC, DOCX и други формати документи онлайн
i2OCR
I2OCR е друго интересно решение за тези, които искат да използват онлайн конвертиране на съдържанието на изображения в текст.
Това е също безплатна услуга, която не изисква регистрация и поддържа множество езици, включително български. Използването не е сложно, поддържат се формати Jpg, Png, Bmp и Tif, но не и Pdf.
(adsbygoogle = window.adsbygoogle || []).push({});Качи документа, задай езика на и кликни върху бутона Extract Test. Операцията се извършва доста бързо и след приключване е възможно да се направи директно сравнение между извлечения текст и изображението.
Има опции за правилно конвертиране на многоколонен форматиран текст. Няма ограничения за размера на файла.
MyFreeOCR
MyFreeOcr е друга безплатна онлайн услуга. Действията са подобни, както при горната: зареди PDF файла или изображението, от което да извлечеш текста, избери езика и формата, който искаш да получиш. Поддържа се български език, а изходният формат може да е TXT, PDF или Word.
OcrOnline
OcrOnline.com има няколко ограничения в безплатната версия. Поддържаните формати са PDF, JPG, TIFF, PNG и GIF. След като влезеш в сайта, качи файла, задай езика на текста, съдържащ се в качения файл, и избери изходния формат. Може да бъде DOC, PDF, RTF и TXT файл.
Виж още: Как да извлечеш текст от скрийншот или друго изображение в Windows 10 – OCR инструменти
Други проверени безплатни OCR онлайн инструменти
(adsbygoogle = window.adsbygoogle || []).push({});- ocr.space
- convertio.co/ocr/
- ocrconvert.com
- newocr.com
- Quixy Toolbox: Free Text Extractor, OCR – разширение за Chrome.
Виж още: Преобразуване на текст в аудио онлайн с видеоклип на аватар (Text-to-Speech)
Заключение
Не може да се очаква винаги перфектно OCR разпознаване.
Някои от тези инструменти по-горе достигат много високи нива в повече от случаите. Необходимо е сравняване на входния и изходния текст за корекции.
Разбира се, с платени инструменти грешките са по-малко и могат да се извличат и редактират големи количества текстови страници.
Но за ежедневна употреба изброените безплатни OCR онлайн инструменти са отличен помощник и увеличават значително нашата продуктивност, когато имаме работа с много текст в изображения и сканирани PDF файлове.
Ти използваш ли тези инструменти? От кой от тях си най-много доволен? Сподели в коментарите тук долу.