CuneiForm — інструмент оптичного розпізнавання символів, розроблений російською компанією Cognitive Technologies. Програма перетворює файли зображень, отримані зі сканера або іншим шляхом на текст. Після декількох років без розвитку, 12 грудня 2007 року анонсовано відкриття джерельних текстів програми, яке відбулося 2 квітня 2008 року .
CuneiForm 12 | |
Тип | ОРС |
---|---|
Автор | |
Розробник | |
Стабільний випуск | 12 (12 грудня 2007) |
Нестабільний випуск | джерельні коди (2 квітня 2008) |
Операційна система | Windows, Linux |
Мова програмування | [2] і C[2] |
Українська мова | інтерфейс — ні, ОРС — так |
Ліцензія | вільна (Відкрите програмне забезпечення з березня 2008), Ліцензія BSD |
Вебсайт | www.cuneiform.ru, www.openocr.org |
Можливості
CuneiForm — шрифтонезалежна (OmniFont) система. Алгоритми, закладені в CuneiForm, ґрунтуються на правилах написання букв, на їхній топології, і не вимагають задавання певних еталонів або навчання. Розпізнаються будь-які друкарські шрифти — книги, газети, журнали, роздруківки з лазерних і матричних принтерів, тексти з друкарських машинок тощо. Не розпізнається рукописний текст і декоративні шрифти (готичний, стилізований під рукописний). В CuneiForm існують спеціальні налаштування для розпізнавання текстів з матричного принтера і факсів 200x100 DPI.
CuneiForm зберігає форматування тексту і розпізнає складні таблиці довільної структури.
Програма розпізнає текст англійською, болгарськіою, голландською, данською, естонською, іспанською, італійською, латвійською, литовською, німецькою, польською, португальською, російською, румунською, сербською, словенською, турецькою, угорською, українською, французькою, хорватською, чеською, шведською мовами та російсько-англійський двомовний текст.
CuneiForm може зберегти розпізнаний текст у форматах RTF, HTML або текстовому. Також можливо передати текст до текстового процесора Word або електронної таблиці Excel.
Історія
Колись лідер програмного забезпечення з розпізнавання символів у Росії, CuneiForm змагався з популярною нині програмою ABBYY FineReader.
Майбутнє
Cognitive Technologies розпочали програму «Розпізнавання має бути на кожному комп'ютері», щоб зробити розпізнавання доступним для всіх споживачів. Перший крок програми — випуск CuneiForm як вільно поширюваного ПЗ. Наступним кроком стане запуск вільної on-line служби розпізнавання на сайті до кінця січня 2008 року.
2 квітня 2008 року компанія Cognitive Technologies оголосила про відкриття джерельного коду програми. В даний час, розробники вибрали для проекту ліцензію BSD.
У квітні 2009 випущена перша версія Cuneiform-Qt [ 12 квітня 2009 у Wayback Machine.] — графічного інтерфейсу до Cuneiform на основі бібліотеки Qt4.
У червні 2009 випущена перша публічна версія — графічної оболонки до Cuneiform на основі бібліотеки Qt4.
Див. також
Посилання
- (рос.)
- Опис CuneiForm [ 16 грудня 2007 у Wayback Machine.](рос.)
- (рос.)
- (рос.)
- інтерфейсу користувача, отримання вхідних документів, розпізнавання (виділення структури отриманого документа, обмеження мовної підтримки, спеціальні інструменти для розпізнавання складно-структурованих документів), первинної мовної та текстової обробки результату, реалізації принципу «What You Scan Is What You Get», інтеграцію з іншими програмними застосунками.(рос.)
- (рос.)
- — визначення системи, огляд використаних технологій, відмінні від інших аналогічних систем риси, аналіз ключових особливостей вхідних документів та вихідних результатів.(рос.)
Виноски
- Jussy Pakkanen портував джерельний код Cuneiform під Linux [ 20 травня 2011 у Wayback Machine.]. Поточний статус --- альфа.
- https://www.openhub.net/p/cuneiform/analyses/latest/languages_summary
- . Архів оригіналу за 6 листопада 2009. Процитовано 28 квітня 2009.
- . Архів оригіналу за 18 грудня 2007. Процитовано 13 грудня 2007.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
CuneiForm instrument optichnogo rozpiznavannya simvoliv rozroblenij rosijskoyu kompaniyeyu Cognitive Technologies Programa peretvoryuye fajli zobrazhen otrimani zi skanera abo inshim shlyahom na tekst Pislya dekilkoh rokiv bez rozvitku 12 grudnya 2007 roku anonsovano vidkrittya dzherelnih tekstiv programi yake vidbulosya 2 kvitnya 2008 roku CuneiFormCuneiForm 12TipORSAvtorRozrobnikStabilnij vipusk12 12 grudnya 2007 Nestabilnij vipuskdzherelni kodi 2 kvitnya 2008 Operacijna sistemaWindows LinuxMova programuvannyaC 2 i C 2 Ukrayinska movainterfejs ni ORS takLicenziyavilna Vidkrite programne zabezpechennya z bereznya 2008 Licenziya BSDVebsajtwww cuneiform ru www openocr orgMozhlivostiCuneiForm shriftonezalezhna OmniFont sistema Algoritmi zakladeni v CuneiForm gruntuyutsya na pravilah napisannya bukv na yihnij topologiyi i ne vimagayut zadavannya pevnih etaloniv abo navchannya Rozpiznayutsya bud yaki drukarski shrifti knigi gazeti zhurnali rozdrukivki z lazernih i matrichnih printeriv teksti z drukarskih mashinok tosho Ne rozpiznayetsya rukopisnij tekst i dekorativni shrifti gotichnij stilizovanij pid rukopisnij V CuneiForm isnuyut specialni nalashtuvannya dlya rozpiznavannya tekstiv z matrichnogo printera i faksiv 200x100 DPI CuneiForm zberigaye formatuvannya tekstu i rozpiznaye skladni tablici dovilnoyi strukturi Programa rozpiznaye tekst anglijskoyu bolgarskioyu gollandskoyu danskoyu estonskoyu ispanskoyu italijskoyu latvijskoyu litovskoyu nimeckoyu polskoyu portugalskoyu rosijskoyu rumunskoyu serbskoyu slovenskoyu tureckoyu ugorskoyu ukrayinskoyu francuzkoyu horvatskoyu cheskoyu shvedskoyu movami ta rosijsko anglijskij dvomovnij tekst CuneiForm mozhe zberegti rozpiznanij tekst u formatah RTF HTML abo tekstovomu Takozh mozhlivo peredati tekst do tekstovogo procesora Word abo elektronnoyi tablici Excel IstoriyaKolis lider programnogo zabezpechennya z rozpiznavannya simvoliv u Rosiyi CuneiForm zmagavsya z populyarnoyu nini programoyu ABBYY FineReader MajbutnyeCognitive Technologies rozpochali programu Rozpiznavannya maye buti na kozhnomu komp yuteri shob zrobiti rozpiznavannya dostupnim dlya vsih spozhivachiv Pershij krok programi vipusk CuneiForm yak vilno poshiryuvanogo PZ Nastupnim krokom stane zapusk vilnoyi on line sluzhbi rozpiznavannya na sajti do kincya sichnya 2008 roku 2 kvitnya 2008 roku kompaniya Cognitive Technologies ogolosila pro vidkrittya dzherelnogo kodu programi V danij chas rozrobniki vibrali dlya proektu licenziyu BSD U kvitni 2009 vipushena persha versiya Cuneiform Qt 12 kvitnya 2009 u Wayback Machine grafichnogo interfejsu do Cuneiform na osnovi biblioteki Qt4 U chervni 2009 vipushena persha publichna versiya grafichnoyi obolonki do Cuneiform na osnovi biblioteki Qt4 Div takozhRozpiznavannya obrazivPosilannya ros Opis CuneiForm 16 grudnya 2007 u Wayback Machine ros ros ros interfejsu koristuvacha otrimannya vhidnih dokumentiv rozpiznavannya vidilennya strukturi otrimanogo dokumenta obmezhennya movnoyi pidtrimki specialni instrumenti dlya rozpiznavannya skladno strukturovanih dokumentiv pervinnoyi movnoyi ta tekstovoyi obrobki rezultatu realizaciyi principu What You Scan Is What You Get integraciyu z inshimi programnimi zastosunkami ros ros viznachennya sistemi oglyad vikoristanih tehnologij vidminni vid inshih analogichnih sistem risi analiz klyuchovih osoblivostej vhidnih dokumentiv ta vihidnih rezultativ ros VinoskiJussy Pakkanen portuvav dzherelnij kod Cuneiform pid Linux 20 travnya 2011 u Wayback Machine Potochnij status alfa https www openhub net p cuneiform analyses latest languages summary Arhiv originalu za 6 listopada 2009 Procitovano 28 kvitnya 2009 Arhiv originalu za 18 grudnya 2007 Procitovano 13 grudnya 2007