Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на вебсторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів, штучного інтелекту і комп'ютерного зору.
Оптичне розпізнавання символів | |
Коротка назва | OCR |
---|---|
Досліджується в | обробка природної мови |
Оптичне розпізнавання символів у Вікісховищі |
Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші так звані «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи зображення, колонки й інші нетекстові компоненти.
Історія
В 1929 році Густав Таущек отримав патент на метод оптичного розпізнавання тексту в Німеччині, після чого за ним пішов Гендель, отримавши патент на свій метод у США в 1933. В 1935 Таущек також отримав патент США на свій метод. Машина Таущека являла собою механічний пристрій, що використовує шаблони й фотодетектор.
В 1950 році Девід Х. Шепард, криптоаналітик з агентства безпеки збройних сил Сполучених Штатів, проаналізувавши задачу перетворення друкованих повідомлень у машинну мову для обробки комп'ютером, побудував машину, що розв'язує дане завдання. Після того як він отримав патент США, він сповістив про це в «Вашингтон Дейлі Ньюз» (27 Квітня 1951) і в «Нью-Йорк Таймс» (26 грудня 1953). Потім Шепард заснував компанію, що розробляє інтелектуальні машини, що незабаром випустила перші у світі комерційні системи оптичного розпізнавання символів.
Перша комерційна система була встановлена на «Рідерз дайджест» в 1955 році. Друга система була продана компанії «Standard Oil» для читання кредитних карт для роботи із чеками. Інші системи, що поставляються компанією Шепарда, були продані наприкінці 1950-х років, у тому числі сканер сторінок для національних повітряних сил США для читання й передачі телетайпом машинописних повідомлень. Пізніше ліцензію на використання патентів Шепарда отримала IBM.
Приблизно в 1965 «Рідерз Дайджест» і «Ар-Сі-Ей» почали співробітництво з метою створити машину для читання документів, що використовує оптичне розпізнавання тексту, призначену для оцифрування серійних номерів купонів «Рідерз Дайджест», що повернулися з рекламних оголошень. Для документів, надрукованих барабанним принтером «Ар-Си-Эй», був використаний спеціальний шрифт . Машина для читання документів працювала безпосередньо з комп'ютером RCA 301 (одним із перших масивних комп'ютерів). Швидкість роботи машини була 1500 документів у хвилину: вона перевіряла кожний документ, крім тих, які вона не змогла обробити правильно. Поштова служба Сполучених Штатів використовує машини, що використовують оптичне розпізнавання тексту, для сортування пошти з 1965 року на основі технологій, розроблених дослідником Яковом Рабиновим. В Європі першою організацією, що використовує машини з оптичним розпізнаванням тексту, був британський поштамт. Пошта Канади застосовує системи оптичного розпізнавання символів з 1971 року. На першому етапі в центрі сортування системи оптичного розпізнавання символів зчитують ім'я й адресу одержувача й друкують на конверті штрих-код. Він наноситься спеціальним чорнилом, яке чітко видиме в ультрафіолетовому світлі. Це робиться, щоб уникнути плутанини з полем адреси, заповненим людиною, що може бути в будь-якому місці на конверті.
В 1974 році Рей Курцвейл створив компанію «Курцвейл Комп'ютер Продактс», і почав працювати над розвитком першої системи оптичного розпізнавання символів, здатної розпізнати текст, надрукований будь-яким шрифтом. Курцвейл уважав, що краще застосування цієї технології — створення машини читання для сліпих, котра дозволила б сліпим людям мати комп'ютер, що вміє читати текст уголос. Цей пристрій вимагав винаходу відразу двох технологій — планшетний ПЗЗ-сканер і синтезатор, що перетворює текст у мову. Кінцевий продукт був представлений 13 січня 1976 під час прес-конференції, очолюваної Курцвейлом і керівниками національної федерації сліпих.
В 1978 році компанія «Курцвейл Комп'ютер Продактс» розпочала продаж комерційної версії комп'ютерної програми оптичного розпізнавання символів. Через два роки Курцвейл продав свою компанію «Ксерокс», що була зацікавлена в подальшій комерціалізації систем розпізнавання тексту. «Курцвейл Комп'ютер Продактс» стала дочірньою компанією «Ксерокс», відомого як «Скансофт».
Поточний стан технології оптичного розпізнавання тексту
Точне розпізнавання латинських символів у друкованому тексті зараз можливе тільки, якщо доступні чіткі зображення, такі як друковані документи. Точність при такій постановці задачі перевищує 99%, абсолютна точність може бути досягнута тільки шляхом подальшого редагування людиною. Проблеми розпізнавання рукописного «друкованого» тексту й стандартного рукописного тексту, а також друкованих текстів інших форматів (особливо з дуже великою кількістю символів) зараз є предметом активних досліджень.
Точність роботи методів може бути вимірювана декількома способами, і тому може сильно варіюватися. Приміром, якщо зустрічається спеціалізоване слово, відсутнє в словниках відповідного програмного забезпечення, при пошуку неіснуючих слів, помилка може збільшитися.
Розпізнавання символів он-лайн іноді плутають з оптичним розпізнаванням символів. Метод оптичного розпізнавання символів — офф-лайн-метод, що працює зі статичною формою подання тексту, у той час як он-лайн-розпізнавання символів ураховує рухи під час писання. Наприклад, в он-лайн-розпізнаванні, що використовує PenPoint OS або планшетний ПК, можна визначити, з якого боку пишеться рядок: справа ліворуч або зліва праворуч.
Он-лайн-системи для розпізнавання рукописного тексту «на льоту» останнім часом стали широко відомі як комерційні продукти. Алгоритми таких пристроїв використовують той факт, що порядок, швидкість і напрямок окремих ділянок ліній уведення відомі. Крім того, користувач уміє використовувати тільки конкретні форми письма. Ці методи не можуть бути використані в програмному забезпеченні, що використовує скановані паперові документи, тому проблема розпізнавання рукописного «друкованого» тексту, як і раніше, залишається відкритою. На зображеннях із рукописним «друкованим» текстом без артефактів може бути досягнута точність у 80% — 90%, але з такою точністю зображення буде перетворене в текст із десятками помилок на сторінці. Така технологія корисна в дуже обмеженому числі застосувань.
Ще одною широко досліджуваною проблемою є розпізнавання рукописного тексту. У цей час досягнута точність навіть нижча, ніж для рукописного «друкованого» тексту. Вищі показники можуть бути досягнуті тільки з використанням контекстної й граматичної інформації. Наприклад, у процесі розпізнання шукати цілі слова в словнику легше, ніж намагатися проаналізувати окремі символи з тексту. Знання граматики мови може також допомогти визначити, чи є слово дієсловом чи іменником. Форми окремих рукописних символів іноді можуть не містити достатньо інформації, щоб точно (більше 98%) розпізнати весь рукописний текст.
Для розв'язання складніших проблем у сфері розпізнавання використовуються, як правило, інтелектуальні системи розпізнавання, такі як штучні нейронні мережі.
Програми розпізнавання
Назва | Ліцензія | Операційні системи | Замітки |
---|---|---|---|
ABBYY FineReader | комерційна власницька | Windows; Linux, Mac OS (не для кінцевого споживача) | Для роботи з різними мовами потрібна підтримка відповідної мови. |
[en] | Комерційна [] | Windows | Добування даних із документів і їхня обробка; наприклад, рахунки, повідомлення, накладні й платіжні доручення |
COCR2 | Безкоштовна | Windows 9X, ME, 2000, XP | Програма для розпізнавання спрощених і традиційних китайських ієрогліфів. Основне обмеження програми: для кожного ієрогліфа користувач повинен сам вибирати варіант його розпізнавання за допомогою миші або клавіатури. Але кількість розпізнаваних ієрогліфів досить велика — більше 10 000. |
CuneiForm | BSD | Windows (з GUI), Linux, Mac OS, FreeBSD (CLI) | Промислова, багатомовна система, уміє зберігати форматування тексту й розпізнає заплутані таблиці довільної структури |
TypeReader & RTK | Комерційна [] | Windows, Mac OS X, Unix, Linux, OS/2 | Отримувала високі оцінки на початку 1990-х. |
FineReaderOnline.ru | інтерфейс: Браузер | Online-OCR-сервіс, що дозволяє розпізнати багатомовний текст зі сканованого документа або фотографії. Конвертує результат у формати, що редагуються (PDF, PDF/A, DOC, RTF, XLS, TXT). У цей час до 10 сторінок у день можна розпізнавати безкоштовно. | |
Apache | Інтерфейс: Браузер; Сервер: POSIX, Unix | Платформа для браузерних систем розпізнавання символів. Використовує Tesseract. Велика кількість підтримуваних мов. Сторінка проекту: FreeOCR | |
GOCR | GPL | Крос-Платформна | У початковій стадії розробки |
GPL | Linux | Розпізнавання текстів на івриті | |
img2txt.com | інтерфейс: Браузер | Online-OCR-сервіс дозволяє розпізнати багатомовний текст зі сканованого документа або фотографії. Використовує Tesseract | |
Kirtas Technologies Arabic OCR | Комерційна | Windows | Може розпізнавати арабські й англійські символи на одній сторінці. |
Комерційна | Windows, Mac OS X | ||
Microsoft Office OneNote 2007 | Комерційна | Windows | |
NewOCR.com | інтерфейс: Браузер | Online-OCR-сервіс дозволяє розпізнати багатомовний текст зі сканованого документа або фотографії. Підтримує 29 мов (болгарську, каталонську, чеську, данську, голландську, англійську, фінську, французьку, німецьку, грецьку, угорську, індонезійську, італійську, латиську, литовську, норвезьку, польську, португальську, румунську, російську, сербську, словацьку, словенську, іспанську, шведську, тагальську, турецьку, українську, в'єтнамську) і розпізнає текст, відформатований у декілька колонок. | |
VERUS | Комерційна [] | ? | Спеціалізується на мовах середнього сходу |
Ocrad | GPL | Unix-like, OS/2 | |
OCRopus | Apache | Linux | Розширювана система розпізнавання, що може використовувати Tesseract |
[en] | Комерційна (Nuance EULA) [] | Windows, Mac OS | Виробництво [en] |
інтерфейс: Браузер | Online-OCR-сервіс дозволяє розпізнати багатомовний текст зі сканованого документа або фотографії. Конвертує результат у формати, що редагуються (PDF, DOC, XLS, TXT, HTML) | ||
Комерційна [] | Windows | Спеціалізується перською мовою (фарсі). | |
Комерційна [] | Windows, Mac OS | Виробництво бельгійської . Містить регіональні пакети для розпізнавання азійських мов і мов середнього сходу. | |
[en] | Комерційна [] | Windows | сканування, розпізнавання й класифікація ділових паперів, наприклад, договорів, рахунків і платіжних доручень. |
компанії Alt-N Technologies | Комерційна [] | Windows | багатомовна система використовується для перетворення факсів у доступні для виправлення формати документів (doc, pdf тощо). |
[en] | Комерційна [] | Windows | для роботи з різними мовами потрібна підтримка відповідної мови. |
Комерційна [] | Linux | серверна багатомовна система, має високу якість розпізнавання, може зберігати форматування тексту й розпізнає заплутані таблиці довільної структури | |
Freeware and commercial versions | Windows | ||
[en] | Комерційна [] | Windows, Mac OS | Для розпізнавання нотного запису |
Tesseract | Apache | Windows, Mac OS X, Linux, OS/2 | Розробляється компанією Google |
компанії | Комерційна [] | Windows | Система керування документами |
MIT/X Consortium | Інтерфейс: Браузер; Сервер: POSIX, Unix | Платформа для браузерних систем розпізнавання символів. Сторінка проекту: WeOCR | |
Комерційна [] | Windows | Zonal OCR допомагає автоматизувати добування даних із комп'ютерних зображень. |
Див. також
Посилання
Вікісховище має мультимедійні дані за темою: Оптичне розпізнавання символів |
- Explanation of basic handwriting recognition principles and history
- Unicode OCR — Hex Range: 2440-245F Optical Character Recognition in Unicode
- Free Online OCR Free Online OCR
- Free Online PDF to Excel Converter with OCR Free Online PDF to Excel Converter with OCR
Це незавершена стаття про інформаційні технології. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Optichne rozpiznavannya tekstu angl optical character recognition OCR ce mehanichne abo elektronne perevedennya zobrazhen rukopisnogo mashinopisnogo abo drukovanogo tekstu v poslidovnist kodiv sho vikoristovuyutsya dlya predstavlennya v tekstovomu redaktori Rozpiznavannya shiroko vikoristovuyetsya dlya konvertaciyi knig i dokumentiv v elektronnij viglyad dlya avtomatizaciyi sistem obliku v biznesi abo dlya publikaciyi tekstu na vebstorinci Optichne rozpiznavannya tekstu dozvolyaye redaguvati tekst zdijsnyuvati poshuk slova abo frazi zberigati jogo v kompaktnishij formi demonstruvati abo rozdrukovuvati material ne vtrachayuchi yakosti analizuvati informaciyu a takozh zastosovuvati do tekstu elektronnij pereklad formatuvannya abo peretvorennya v movlennya Optichne rozpiznavannya tekstu ye doslidzhuvanoyu problemoyu v galuzyah rozpiznavannya obraziv shtuchnogo intelektu i komp yuternogo zoru Optichne rozpiznavannya simvoliv Korotka nazvaOCR Doslidzhuyetsya vobrobka prirodnoyi movi Optichne rozpiznavannya simvoliv u Vikishovishi Sistemi optichnogo rozpiznavannya tekstu vimagayut kalibruvannya dlya roboti z konkretnim shriftom u rannih versiyah dlya programuvannya bulo neobhidno zobrazhennya kozhnogo simvolu programa odnochasno mogla pracyuvati tilki z odnim shriftom Zaraz najposhirenishi tak zvani intelektualni sistemi sho rozpiznayut bilshist shriftiv iz visokim stupenem tochnosti Deyaki sistemi optichnogo rozpiznavannya tekstu zdatni vidnovlyuvati vihidne formatuvannya tekstu vklyuchayuchi zobrazhennya kolonki j inshi netekstovi komponenti IstoriyaV 1929 roci Gustav Taushek otrimav patent na metod optichnogo rozpiznavannya tekstu v Nimechchini pislya chogo za nim pishov Gendel otrimavshi patent na svij metod u SShA v 1933 V 1935 Taushek takozh otrimav patent SShA na svij metod Mashina Tausheka yavlyala soboyu mehanichnij pristrij sho vikoristovuye shabloni j fotodetektor V 1950 roci Devid H Shepard kriptoanalitik z agentstva bezpeki zbrojnih sil Spoluchenih Shtativ proanalizuvavshi zadachu peretvorennya drukovanih povidomlen u mashinnu movu dlya obrobki komp yuterom pobuduvav mashinu sho rozv yazuye dane zavdannya Pislya togo yak vin otrimav patent SShA vin spovistiv pro ce v Vashington Dejli Nyuz 27 Kvitnya 1951 i v Nyu Jork Tajms 26 grudnya 1953 Potim Shepard zasnuvav kompaniyu sho rozroblyaye intelektualni mashini sho nezabarom vipustila pershi u sviti komercijni sistemi optichnogo rozpiznavannya simvoliv Persha komercijna sistema bula vstanovlena na Riderz dajdzhest v 1955 roci Druga sistema bula prodana kompaniyi Standard Oil dlya chitannya kreditnih kart dlya roboti iz chekami Inshi sistemi sho postavlyayutsya kompaniyeyu Sheparda buli prodani naprikinci 1950 h rokiv u tomu chisli skaner storinok dlya nacionalnih povitryanih sil SShA dlya chitannya j peredachi teletajpom mashinopisnih povidomlen Piznishe licenziyu na vikoristannya patentiv Sheparda otrimala IBM Priblizno v 1965 Riderz Dajdzhest i Ar Si Ej pochali spivrobitnictvo z metoyu stvoriti mashinu dlya chitannya dokumentiv sho vikoristovuye optichne rozpiznavannya tekstu priznachenu dlya ocifruvannya serijnih nomeriv kuponiv Riderz Dajdzhest sho povernulisya z reklamnih ogoloshen Dlya dokumentiv nadrukovanih barabannim printerom Ar Si Ej buv vikoristanij specialnij shrift Mashina dlya chitannya dokumentiv pracyuvala bezposeredno z komp yuterom RCA 301 odnim iz pershih masivnih komp yuteriv Shvidkist roboti mashini bula 1500 dokumentiv u hvilinu vona pereviryala kozhnij dokument krim tih yaki vona ne zmogla obrobiti pravilno Poshtova sluzhba Spoluchenih Shtativ vikoristovuye mashini sho vikoristovuyut optichne rozpiznavannya tekstu dlya sortuvannya poshti z 1965 roku na osnovi tehnologij rozroblenih doslidnikom Yakovom Rabinovim V Yevropi pershoyu organizaciyeyu sho vikoristovuye mashini z optichnim rozpiznavannyam tekstu buv britanskij poshtamt Poshta Kanadi zastosovuye sistemi optichnogo rozpiznavannya simvoliv z 1971 roku Na pershomu etapi v centri sortuvannya sistemi optichnogo rozpiznavannya simvoliv zchituyut im ya j adresu oderzhuvacha j drukuyut na konverti shtrih kod Vin nanositsya specialnim chornilom yake chitko vidime v ultrafioletovomu svitli Ce robitsya shob uniknuti plutanini z polem adresi zapovnenim lyudinoyu sho mozhe buti v bud yakomu misci na konverti V 1974 roci Rej Kurcvejl stvoriv kompaniyu Kurcvejl Komp yuter Prodakts i pochav pracyuvati nad rozvitkom pershoyi sistemi optichnogo rozpiznavannya simvoliv zdatnoyi rozpiznati tekst nadrukovanij bud yakim shriftom Kurcvejl uvazhav sho krashe zastosuvannya ciyeyi tehnologiyi stvorennya mashini chitannya dlya slipih kotra dozvolila b slipim lyudyam mati komp yuter sho vmiye chitati tekst ugolos Cej pristrij vimagav vinahodu vidrazu dvoh tehnologij planshetnij PZZ skaner i sintezator sho peretvoryuye tekst u movu Kincevij produkt buv predstavlenij 13 sichnya 1976 pid chas pres konferenciyi ocholyuvanoyi Kurcvejlom i kerivnikami nacionalnoyi federaciyi slipih V 1978 roci kompaniya Kurcvejl Komp yuter Prodakts rozpochala prodazh komercijnoyi versiyi komp yuternoyi programi optichnogo rozpiznavannya simvoliv Cherez dva roki Kurcvejl prodav svoyu kompaniyu Kseroks sho bula zacikavlena v podalshij komercializaciyi sistem rozpiznavannya tekstu Kurcvejl Komp yuter Prodakts stala dochirnoyu kompaniyeyu Kseroks vidomogo yak Skansoft Potochnij stan tehnologiyi optichnogo rozpiznavannya tekstuTochne rozpiznavannya latinskih simvoliv u drukovanomu teksti zaraz mozhlive tilki yaksho dostupni chitki zobrazhennya taki yak drukovani dokumenti Tochnist pri takij postanovci zadachi perevishuye 99 absolyutna tochnist mozhe buti dosyagnuta tilki shlyahom podalshogo redaguvannya lyudinoyu Problemi rozpiznavannya rukopisnogo drukovanogo tekstu j standartnogo rukopisnogo tekstu a takozh drukovanih tekstiv inshih formativ osoblivo z duzhe velikoyu kilkistyu simvoliv zaraz ye predmetom aktivnih doslidzhen Tochnist roboti metodiv mozhe buti vimiryuvana dekilkoma sposobami i tomu mozhe silno variyuvatisya Primirom yaksho zustrichayetsya specializovane slovo vidsutnye v slovnikah vidpovidnogo programnogo zabezpechennya pri poshuku neisnuyuchih sliv pomilka mozhe zbilshitisya Rozpiznavannya simvoliv on lajn inodi plutayut z optichnim rozpiznavannyam simvoliv Metod optichnogo rozpiznavannya simvoliv off lajn metod sho pracyuye zi statichnoyu formoyu podannya tekstu u toj chas yak on lajn rozpiznavannya simvoliv urahovuye ruhi pid chas pisannya Napriklad v on lajn rozpiznavanni sho vikoristovuye PenPoint OS abo planshetnij PK mozhna viznachiti z yakogo boku pishetsya ryadok sprava livoruch abo zliva pravoruch On lajn sistemi dlya rozpiznavannya rukopisnogo tekstu na lotu ostannim chasom stali shiroko vidomi yak komercijni produkti Algoritmi takih pristroyiv vikoristovuyut toj fakt sho poryadok shvidkist i napryamok okremih dilyanok linij uvedennya vidomi Krim togo koristuvach umiye vikoristovuvati tilki konkretni formi pisma Ci metodi ne mozhut buti vikoristani v programnomu zabezpechenni sho vikoristovuye skanovani paperovi dokumenti tomu problema rozpiznavannya rukopisnogo drukovanogo tekstu yak i ranishe zalishayetsya vidkritoyu Na zobrazhennyah iz rukopisnim drukovanim tekstom bez artefaktiv mozhe buti dosyagnuta tochnist u 80 90 ale z takoyu tochnistyu zobrazhennya bude peretvorene v tekst iz desyatkami pomilok na storinci Taka tehnologiya korisna v duzhe obmezhenomu chisli zastosuvan She odnoyu shiroko doslidzhuvanoyu problemoyu ye rozpiznavannya rukopisnogo tekstu U cej chas dosyagnuta tochnist navit nizhcha nizh dlya rukopisnogo drukovanogo tekstu Vishi pokazniki mozhut buti dosyagnuti tilki z vikoristannyam kontekstnoyi j gramatichnoyi informaciyi Napriklad u procesi rozpiznannya shukati cili slova v slovniku legshe nizh namagatisya proanalizuvati okremi simvoli z tekstu Znannya gramatiki movi mozhe takozh dopomogti viznachiti chi ye slovo diyeslovom chi imennikom Formi okremih rukopisnih simvoliv inodi mozhut ne mistiti dostatno informaciyi shob tochno bilshe 98 rozpiznati ves rukopisnij tekst Dlya rozv yazannya skladnishih problem u sferi rozpiznavannya vikoristovuyutsya yak pravilo intelektualni sistemi rozpiznavannya taki yak shtuchni nejronni merezhi Programi rozpiznavannyaDokladnishe Porivnyannya programnogo zabezpechennya dlya optichnogo rozpiznavannya simvoliv Nazva Licenziya Operacijni sistemi Zamitki ABBYY FineReader komercijna vlasnicka Windows Linux Mac OS ne dlya kincevogo spozhivacha Dlya roboti z riznimi movami potribna pidtrimka vidpovidnoyi movi en Komercijna dzherelo Windows Dobuvannya danih iz dokumentiv i yihnya obrobka napriklad rahunki povidomlennya nakladni j platizhni doruchennya COCR2 Bezkoshtovna Windows 9X ME 2000 XP Programa dlya rozpiznavannya sproshenih i tradicijnih kitajskih iyeroglifiv Osnovne obmezhennya programi dlya kozhnogo iyeroglifa koristuvach povinen sam vibirati variant jogo rozpiznavannya za dopomogoyu mishi abo klaviaturi Ale kilkist rozpiznavanih iyeroglifiv dosit velika bilshe 10 000 CuneiForm BSD Windows z GUI Linux Mac OS FreeBSD CLI Promislova bagatomovna sistema umiye zberigati formatuvannya tekstu j rozpiznaye zaplutani tablici dovilnoyi strukturi TypeReader amp RTK Komercijna dzherelo Windows Mac OS X Unix Linux OS 2 Otrimuvala visoki ocinki na pochatku 1990 h FineReaderOnline ru interfejs Brauzer Online OCR servis sho dozvolyaye rozpiznati bagatomovnij tekst zi skanovanogo dokumenta abo fotografiyi Konvertuye rezultat u formati sho redaguyutsya PDF PDF A DOC RTF XLS TXT U cej chas do 10 storinok u den mozhna rozpiznavati bezkoshtovno Apache Interfejs Brauzer Server POSIX Unix Platforma dlya brauzernih sistem rozpiznavannya simvoliv Vikoristovuye Tesseract Velika kilkist pidtrimuvanih mov Storinka proektu FreeOCR GOCR GPL Kros Platformna U pochatkovij stadiyi rozrobki GPL Linux Rozpiznavannya tekstiv na ivriti img2txt com interfejs Brauzer Online OCR servis dozvolyaye rozpiznati bagatomovnij tekst zi skanovanogo dokumenta abo fotografiyi Vikoristovuye Tesseract Kirtas Technologies Arabic OCR Komercijna Windows Mozhe rozpiznavati arabski j anglijski simvoli na odnij storinci Komercijna Windows Mac OS X Microsoft Office OneNote 2007 Komercijna Windows NewOCR com interfejs Brauzer Online OCR servis dozvolyaye rozpiznati bagatomovnij tekst zi skanovanogo dokumenta abo fotografiyi Pidtrimuye 29 mov bolgarsku katalonsku chesku dansku gollandsku anglijsku finsku francuzku nimecku grecku ugorsku indonezijsku italijsku latisku litovsku norvezku polsku portugalsku rumunsku rosijsku serbsku slovacku slovensku ispansku shvedsku tagalsku turecku ukrayinsku v yetnamsku i rozpiznaye tekst vidformatovanij u dekilka kolonok VERUS Komercijna dzherelo Specializuyetsya na movah serednogo shodu Ocrad GPL Unix like OS 2 OCRopus Apache Linux Rozshiryuvana sistema rozpiznavannya sho mozhe vikoristovuvati Tesseract en Komercijna Nuance EULA dzherelo Windows Mac OS Virobnictvo en interfejs Brauzer Online OCR servis dozvolyaye rozpiznati bagatomovnij tekst zi skanovanogo dokumenta abo fotografiyi Konvertuye rezultat u formati sho redaguyutsya PDF DOC XLS TXT HTML Komercijna dzherelo Windows Specializuyetsya perskoyu movoyu farsi Komercijna dzherelo Windows Mac OS Virobnictvo belgijskoyi Mistit regionalni paketi dlya rozpiznavannya azijskih mov i mov serednogo shodu en Komercijna dzherelo Windows skanuvannya rozpiznavannya j klasifikaciya dilovih paperiv napriklad dogovoriv rahunkiv i platizhnih doruchen kompaniyi Alt N Technologies Komercijna dzherelo Windows bagatomovna sistema vikoristovuyetsya dlya peretvorennya faksiv u dostupni dlya vipravlennya formati dokumentiv doc pdf tosho en Komercijna dzherelo Windows dlya roboti z riznimi movami potribna pidtrimka vidpovidnoyi movi Komercijna dzherelo Linux serverna bagatomovna sistema maye visoku yakist rozpiznavannya mozhe zberigati formatuvannya tekstu j rozpiznaye zaplutani tablici dovilnoyi strukturi Freeware and commercial versions Windows en Komercijna dzherelo Windows Mac OS Dlya rozpiznavannya notnogo zapisu Tesseract Apache Windows Mac OS X Linux OS 2 Rozroblyayetsya kompaniyeyu Google kompaniyi Komercijna dzherelo Windows Sistema keruvannya dokumentami MIT X Consortium Interfejs Brauzer Server POSIX Unix Platforma dlya brauzernih sistem rozpiznavannya simvoliv Storinka proektu WeOCR Komercijna dzherelo Windows Zonal OCR dopomagaye avtomatizuvati dobuvannya danih iz komp yuternih zobrazhen Div takozhCAPTCHA Informativnist oznak Optichne rozpiznavannya not Porivnyannya programnogo zabezpechennya dlya optichnogo rozpiznavannya simvoliv Rozpiznavannya eskiziv Rozpiznavannya movi Rozpiznavannya rukopisnogo vvedennya TEI iniciativa koduvannya tekstu Teoriya rozpiznavannya obrazivPosilannyaVikishovishe maye multimedijni dani za temoyu Optichne rozpiznavannya simvoliv Explanation of basic handwriting recognition principles and history Unicode OCR Hex Range 2440 245F Optical Character Recognition in Unicode Free Online OCR Free Online OCR Free Online PDF to Excel Converter with OCR Free Online PDF to Excel Converter with OCR Ce nezavershena stattya pro informacijni tehnologiyi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi