Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett-Packard з 1985 до 1994 року, а в наступне десятиріччя залишалася практично без змін. Не так давно Google купив[] її та відкрив початковий код під ліцензією Apache 2.0 у 2006 році. для продовження розробки. У цей час програма вже працює з UTF-8, розпізнає багато мов, серед яких і українська.
Тип | OCR |
---|---|
Розробник | Hewlett-Packard, Google |
Стабільний випуск | 3.02 (28 жовтня 2012) |
Операційна система | Windows, Linux, Mac OS X |
Мова програмування | C |
Ліцензія | Apache 2.0 |
Онлайн-документація | tesseract-ocr.github.io(англ.) |
Репозиторій | github.com/tesseract-ocr/tesseract |
Вебсайт | tesseract-ocr.googlecode.com |
|
Застосування
Tesseract був використаний, зокрема, Міжнародним консорціумом журналістів-розслідувачів для дослідження інформації у так званих «панамських документах».
Примітки
- http://www.isri.unlv.edu/ISRI/Software#Experimental_Open_Source_OCR
- Vincent, Luc (August 2006). Announcing Tesseract OCR. Архів оригіналу за 18 березня 2012. Процитовано 26 червня 2008.
- Mar Cabra, Erin Kissane (11 квітня 2016). . opennews.org. An OpenNews project. Архів оригіналу за 11 квітня 2016. Процитовано 18 квітня 2016.
Див. також
Посилання
- Сторінка завантажень (компіляції, мовні пакети, вихідні коди) [Архівовано 18 березня 2012 у WebCite]
- Керівництво з навчання програми мові [ 5 березня 2009 у Wayback Machine.] (рос.)
Це незавершена стаття про програмне забезпечення. Ви можете проєкту, виправивши або дописавши її. |
Ця стаття потребує додаткових для поліпшення її . (квітень 2016) |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U Vikipediyi ye statti pro inshi znachennya cogo termina TesseracT gurt Tesseract vilna programa dlya rozpiznavannya tekstiv rozroblyalasya Hewlett Packard z 1985 do 1994 roku a v nastupne desyatirichchya zalishalasya praktichno bez zmin Ne tak davno Google kupiv dzherelo yiyi ta vidkriv pochatkovij kod pid licenziyeyu Apache 2 0 u 2006 roci dlya prodovzhennya rozrobki U cej chas programa vzhe pracyuye z UTF 8 rozpiznaye bagato mov sered yakih i ukrayinska TesseractTipOCRRozrobnikHewlett Packard GoogleStabilnij vipusk3 02 28 zhovtnya 2012 Operacijna sistemaWindows Linux Mac OS XMova programuvannyaC C LicenziyaApache 2 0Onlajn dokumentaciyatesseract ocr github io angl Repozitorijgithub com tesseract ocr tesseractVebsajttesseract ocr googlecode com Mediafajli u VikishovishiZastosuvannyaTesseract buv vikoristanij zokrema Mizhnarodnim konsorciumom zhurnalistiv rozsliduvachiv dlya doslidzhennya informaciyi u tak zvanih panamskih dokumentah Primitkihttp www isri unlv edu ISRI Software Experimental Open Source OCR Vincent Luc August 2006 Announcing Tesseract OCR Arhiv originalu za 18 bereznya 2012 Procitovano 26 chervnya 2008 Mar Cabra Erin Kissane 11 kvitnya 2016 opennews org An OpenNews project Arhiv originalu za 11 kvitnya 2016 Procitovano 18 kvitnya 2016 Div takozhOCRopus Yevropejska abetka VojnichaPosilannyaStorinka zavantazhen kompilyaciyi movni paketi vihidni kodi Arhivovano 18 bereznya 2012 u WebCite Kerivnictvo z navchannya programi movi 5 bereznya 2009 u Wayback Machine ros Ce nezavershena stattya pro programne zabezpechennya Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi Cya stattya potrebuye dodatkovih posilan na dzherela dlya polipshennya yiyi perevirnosti Bud laska dopomozhit udoskonaliti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Zvernitsya na storinku obgovorennya za poyasnennyami ta dopomozhit vipraviti nedoliki Material bez dzherel mozhe buti piddano sumnivu ta vilucheno kviten 2016