hOCR — відкритий стандарт, який визначає формат даних для представлення OCR-виводу. Стандарт має на меті долучити до розпізнаного тексту інформацію про макет, рівень імовірності розпізнавання, стиль та інші дані. Для досягнення цілі долучення цієї інформації до розпізнаного тексту використовується стандартний формат HTML.
Тип | мова розмітки даних і формат файлу |
---|
Існує утиліта командного рядка hocr2pdf для перетворення hocr-даних у файли PDF.
Див. також
Примітки
- Exact CODE [ 6 січня 2010 у Wayback Machine.]
Посилання
- Загальнодоступна специфікація для формату hOCR(англ.)
- hocr-tools [ 24 лютого 2017 у Wayback Machine.]
- HOCR (Hebrew OCR) [ 1 червня 2020 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
hOCR vidkritij standart yakij viznachaye format danih dlya predstavlennya OCR vivodu Standart maye na meti doluchiti do rozpiznanogo tekstu informaciyu pro maket riven imovirnosti rozpiznavannya stil ta inshi dani Dlya dosyagnennya cili doluchennya ciyeyi informaciyi do rozpiznanogo tekstu vikoristovuyetsya standartnij format HTML HOCRTipmova rozmitki danih i format fajlu Isnuye utilita komandnogo ryadka hocr2pdf dlya peretvorennya hocr danih u fajli PDF Div takozhOCRopus CuneiFormPrimitkiExact CODE 6 sichnya 2010 u Wayback Machine PosilannyaZagalnodostupna specifikaciya dlya formatu hOCR angl hocr tools 24 lyutogo 2017 u Wayback Machine HOCR Hebrew OCR 1 chervnya 2020 u Wayback Machine