Значення форми[] (англ. shape context) — характеристика опису, що використовується в розпізнаванні об’єктів. Термін було запропоновано Сержем Белонгі та Джинтендра Маліком в їхній статті "Matching with Shape Contexts" (2000).
Теорія
Характеристика призначена для опису форм з метою вимірювання їхньої подібності та відновлення точкових відповідностей. Основною ідеєю є вибір n точок контуру форми. Для кожної точки pi форми розглядаються n − 1, векторів, отриманих шляхом з'єднання точки pi з усіма іншими точками. Множина усіх цих векторів є описом локалізованої форми локалізованої в цій точці, але цей опис є занадто деталізованим. Ключова ідея полягає в тому, що розподіл по відносній позиції є надійним, компактним і характерним ідентифікатором. Таким чином, для точки pi, груба гістограма відносних координат решти n − 1 точок,
визначається як форма контексту . Стовпчики гістограми (англ. – bins) зазвичай приймають рівномірними в полярних координатах. Підтвердження факту, що форма контексту є характерним ідентифікатором, можна побачити на малюнку нижче, де зображено форми контекстів двох різних варіантів написання літери «А».
На мал. (a) і (b) зображено точки контурів двох форм. На мал. (c) є зображення в полярних координатах, призначене для розрахунку значення форми. На мал. (d) зображено значення форми для круга, на мал. (e) – значення форми ромба, на мал. (f) – значення форми трикутника. Як можна помітити з малюнків (d) та (e), значення форми для двох тісно пов'язаних точок, дуже схожі, в той час як значення форми на малюнку (f) істотно відрізняється.
Тепер для того, щоб ідентифікатор ознаки (характеристики) був корисний, він повинен мати інваріанти. Зокрема, він має бути інваріантним відносно перенесення, масштабування, наявності невеликих завад та залежати від повороту. Незмінність значення форми при перенесенні є зрозумілою. Незмінність при масштабуванні досягається за рахунок нормалізації всіх радіальних відстаней середнім значенням відстані між всіма парами точок форми. Для нормалізації також може бути використана медіанна відстань. Емпірично продемонстровано, що при використанні множини синтетичних точок для експериментів , значення форми є стійким до деформації, шумів і відхилень.
Можна забезпечити стійкість значення форми також і при повороті. Один зі способів – виміряти кути в кожній точці по відношенню до напрямку дотичної в цій точці (оскільки точки обираються на краях). В результаті буде отримано абсолютно стійкий до повороту ідентифікатор. Але це не завжди бажано, оскільки деякі локальні характеристики втрачають їхнє описове значення, якщо вимірюються не по відношенню до того ж базису. Багато додатків не використовують стійкість до повороту, щоб, наприклад відрізняти цифри «6» та «9».
Використання в зіставленні форм
Завершена система, що використовує значення форми для зіставлення, складається з таких кроків:
- Довільним чином обрати множину точок, що лежать на краях відомої форми та множину точок, що належать невідомій формі.
- Для кожної точки, знайденої на кроці 1, обрахувати значення форми.
- Зіставити кожну точку відомої форми з точкою невідомої форми. Для зменшення кількості співставлень, спершу потрібно обрати перетворення (наприклад, афінне), що перетворює межі відомої форми в межі невідомої форми. Потім обрати точку невідомої форми, що найбільш точно відповідає кожній перетвореній точці відомої форми.
- Обчислити відстань між значеннями форми для кожної пари точок цих двох форм. Варто використати зважену суму відстаней між значеннями форми, відстань обробки зображення та силу вигину (міра, що вказує наскільки сильні перетворення потрібні, щоб зрівняти дві форми).
- Для визначення невідомої формі, використовуйте , щоб порівняти його форму з формою відомих об'єктів.
Деталі реалізації
Крок 1: Визначення списку точок на краях форми
Цей підхід припускає, що форма об'єкта, по суті, визначається скінченною підмножиною точок, що належать внутрішнім або зовнішнім контурам об'єкта. Множина цих точок може бути отримана за допомогою детектора країв Канні (англ. – ) і вибору випадкового набору точок з цих країв. Зверніть увагу, що ці точки не повинні і в більшості випадків не відповідають ключовим точкам, таким як максимуми кривизни або точкам перегину. Бажано обирати форми з приблизно рівномірним інтервалом, хоча це не критично.
Крок 2: Обчислення значення форми
Цей крок докладно описаний у розділі Теорія.
Крок 3: Розрахунок матриці вартості
Розглянемо дві точки p і q, для яких маємо нормалізовані гістограми з K стовпцями – g(k) і h(k). Оскільки значення форми – розподіли представлені у вигляді гістограм, то закономірно використати як "вартість форми контексту" для двох точок:
Це значення змінюється в діапазоні від 0 до 1. Окрім показника вартості значення форми, може бути використаний показник додаткової вартості, що ґрунтується на зовнішньому вигляді. Наприклад, це може бути міра несхожості тангенса кута (застосовується при розпізнаванні цифр):
Це половина довжини хорди одиничного кола між одиничними векторами з кутами і . Знайдене значення також змінюється від 0 до 1. Загальна вартість співставлення двох точок може бути розрахована як зважена сума двох вищезгаданих вартостей:
Тепер для кожної точки pi першої форми та точки qj другої форми, потрібно розрахувати загальну вартість, як описано вище, і позначити це значення Ci,j. Обраховані значення вартостей для всіх точок формують матрицю вартостей.
Крок 4: Знаходження такого зіставлення, яке мінімізує загальну вартість
Тепер потрібно знайти таке попарне співставлення кожної точки pi першої форми, з точкою qj другої форми, що мінімізує загальну вартість зіставлення:
Це може бути виконано за час , використовуючи угорський метод () , хоча існують більш ефективні алгоритми. Щоб отримати надійну обробку відхилень, можна додати "штучні" вузли, які мають постійну, але досить велику вартість співставлення по відношенню до матриці вартостей. Це змусить алгоритм зіставляти точки, що є відхиленнями, з штучно введеними точками тільки у випадку, якщо немає реального зіставлення.
Крок 5: Моделювання перетворень
Враховуючи безліч відповідностей між скінченною множиною точок двох фігур перетворення може бути оцінене як співставлення будь-якої точки однієї фігури з точкою іншої фігури. Кілька варіантів такого перетворення описані нижче.
Афінне перетворення
Афінне перетворення є стандартним вибором: . Розв’язок методом найменших квадратів матриці і вектор зміщення o обчислюють наступним чином:
Де з аналогічним виразом для . є псевдо оберненою матрицею для .
Крок 6: Обчислення значення форми
Тепер знайдемо відстань між значеннями двох форм і . Ця відстань є зваженою сумою трьох значень:
Відстань значення форми: це симетрична сума вартості зіставлень значень форми для точок з найкращою відповідністю:
де T(•) – це розраховане перетворення, що перетворює точки форми Q в точки форми P.
Вартість входження: Після встановлення відповідностей та правильно перетворення одного зображення в інше, можна визначити вартість входження, як суму квадратів різниць інтенсивностей в навколо відповідних точок зображення:
де та зображення в градаціях сірого кольору ( зображення після перетворення) і Гауссівська функція.
Вартість перетворення: Остаточна вартість вимірює перетворення, що потрібні, щоб вирівняти два зображення.
Тепер маючи спосіб обчислення відстані між двома формами, можемо застосувати (k-NN) з відстанню, яка визначається як відстань форми. Результати застосування наведені в наступному розділі.
Результати
Розпізнавання цифр
Автори та випробували їхній підхід на базі даних рукописних цифр [ 7 квітня 2021 у Wayback Machine.]. Більше, ніж 50 алгоритмів було протестовано на цій базі даних. База містить 60,000 навчальних зразків і 10,000 тестових зразків. Коефіцієнт помилок для цього підходу становив 0.63% для використаних 20,000 навчальних зразків. На даний момент, найнижчий рівень помилок становить 0.35%.
Пошук торгових марок
Значення форми були використані для отримання найбільш подібних торгових знаків з бази даних за запитом (корисно при виявленні порушень, що стосуються товарних знаків). Жоден візуально схожий товарний знак не був пропущений алгоритмом (перевірено вручну авторами).
Див. також
Примітки
- S. Belongie and J. Malik (2000). Matching with Shape Contexts (PDF). IEEE Workshop on Contentbased Access of Image and Video Libraries (CBAIVL-2000).
- S. Belongie, J. Malik, and J. Puzicha (April 2002). (PDF). IEEE Transactions on Pattern Analysis and Machine Intelligence. 24 (24): 509—521. doi:10.1109/34.993558. Архів оригіналу (PDF) за 13 травня 2013. Процитовано 14 грудня 2012.
- S. Belongie, J. Malik, and J. Puzicha (July 2001). (PDF). Eighth IEEE International Conference on Computer Vision (July 2001). Архів оригіналу (PDF) за 13 травня 2013. Процитовано 14 грудня 2012.
- S. Belongie, J. Malik, and J. Puzicha (2000). Shape Context: A new descriptor for shape matching and object recognition. NIPS 2000.
- H. Chui and A. Rangarajan (June 2000). A new algorithm for non-rigid point matching. CVPR. Т. 2. с. 44—51.
- R. Jonker and A. Volgenant (1987). A Shortest Augmenting Path Algorithm for Dense and Sparse Linear Assignment Problems. Computing. 38 (4): 325—340. doi:10.1007/BF02278710.
Посилання
- Matching with Shape Contexts [ 18 грудня 2012 у Wayback Machine.]
- MNIST database of handwritten digits [ 7 квітня 2021 у Wayback Machine.]
- Columbia Object Image Library (COIL-20) [ 21 грудня 2012 у Wayback Machine.]
- Caltech101 Database [ 6 грудня 2013 у Wayback Machine.]
- The clustering agglomerative hierarchical algorithm [ 5 березня 2016 у Wayback Machine.]
- Пошук образів за їх інваріантними та параметричними ознаками [ 5 березня 2016 у Wayback Machine.]
- Пошук образів за індексами кластерів фрагментів зображень [ 20 травня 2018 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Znachennya formi dzherelo angl shape context harakteristika opisu sho vikoristovuyetsya v rozpiznavanni ob yektiv Termin bulo zaproponovano Serzhem Belongi ta Dzhintendra Malikom v yihnij statti Matching with Shape Contexts 2000 TeoriyaHarakteristika priznachena dlya opisu form z metoyu vimiryuvannya yihnoyi podibnosti ta vidnovlennya tochkovih vidpovidnostej Osnovnoyu ideyeyu ye vibir n tochok konturu formi Dlya kozhnoyi tochki pi formi rozglyadayutsya n 1 vektoriv otrimanih shlyahom z yednannya tochki pi z usima inshimi tochkami Mnozhina usih cih vektoriv ye opisom lokalizovanoyi formi lokalizovanoyi v cij tochci ale cej opis ye zanadto detalizovanim Klyuchova ideya polyagaye v tomu sho rozpodil po vidnosnij poziciyi ye nadijnim kompaktnim i harakternim identifikatorom Takim chinom dlya tochki pi gruba gistograma vidnosnih koordinat reshti n 1 tochok h i k q p i q p i bin k displaystyle h i k q neq p i q p i in mbox bin k viznachayetsya yak forma kontekstu p i displaystyle p i Stovpchiki gistogrami angl bins zazvichaj prijmayut rivnomirnimi v polyarnih koordinatah Pidtverdzhennya faktu sho forma kontekstu ye harakternim identifikatorom mozhna pobachiti na malyunku nizhche de zobrazheno formi kontekstiv dvoh riznih variantiv napisannya literi A Na mal a i b zobrazheno tochki konturiv dvoh form Na mal c ye zobrazhennya v polyarnih koordinatah priznachene dlya rozrahunku znachennya formi Na mal d zobrazheno znachennya formi dlya kruga na mal e znachennya formi romba na mal f znachennya formi trikutnika Yak mozhna pomititi z malyunkiv d ta e znachennya formi dlya dvoh tisno pov yazanih tochok duzhe shozhi v toj chas yak znachennya formi na malyunku f istotno vidriznyayetsya Teper dlya togo shob identifikator oznaki harakteristiki buv korisnij vin povinen mati invarianti Zokrema vin maye buti invariantnim vidnosno perenesennya masshtabuvannya nayavnosti nevelikih zavad ta zalezhati vid povorotu Nezminnist znachennya formi pri perenesenni ye zrozumiloyu Nezminnist pri masshtabuvanni dosyagayetsya za rahunok normalizaciyi vsih radialnih vidstanej serednim znachennyam vidstani a displaystyle alpha mizh vsima parami tochok formi Dlya normalizaciyi takozh mozhe buti vikoristana medianna vidstan Empirichno prodemonstrovano sho pri vikoristanni mnozhini sintetichnih tochok dlya eksperimentiv znachennya formi ye stijkim do deformaciyi shumiv i vidhilen Mozhna zabezpechiti stijkist znachennya formi takozh i pri povoroti Odin zi sposobiv vimiryati kuti v kozhnij tochci po vidnoshennyu do napryamku dotichnoyi v cij tochci oskilki tochki obirayutsya na krayah V rezultati bude otrimano absolyutno stijkij do povorotu identifikator Ale ce ne zavzhdi bazhano oskilki deyaki lokalni harakteristiki vtrachayut yihnye opisove znachennya yaksho vimiryuyutsya ne po vidnoshennyu do togo zh bazisu Bagato dodatkiv ne vikoristovuyut stijkist do povorotu shob napriklad vidriznyati cifri 6 ta 9 Vikoristannya v zistavlenni formZavershena sistema sho vikoristovuye znachennya formi dlya zistavlennya skladayetsya z takih krokiv Dovilnim chinom obrati mnozhinu tochok sho lezhat na krayah vidomoyi formi ta mnozhinu tochok sho nalezhat nevidomij formi Dlya kozhnoyi tochki znajdenoyi na kroci 1 obrahuvati znachennya formi Zistaviti kozhnu tochku vidomoyi formi z tochkoyu nevidomoyi formi Dlya zmenshennya kilkosti spivstavlen spershu potribno obrati peretvorennya napriklad afinne sho peretvoryuye mezhi vidomoyi formi v mezhi nevidomoyi formi Potim obrati tochku nevidomoyi formi sho najbilsh tochno vidpovidaye kozhnij peretvorenij tochci vidomoyi formi Obchisliti vidstan mizh znachennyami formi dlya kozhnoyi pari tochok cih dvoh form Varto vikoristati zvazhenu sumu vidstanej mizh znachennyami formi vidstan obrobki zobrazhennya ta silu viginu mira sho vkazuye naskilki silni peretvorennya potribni shob zrivnyati dvi formi Dlya viznachennya nevidomoyi formi vikoristovujte shob porivnyati jogo formu z formoyu vidomih ob yektiv Detali realizaciyiKrok 1 Viznachennya spisku tochok na krayah formi Cej pidhid pripuskaye sho forma ob yekta po suti viznachayetsya skinchennoyu pidmnozhinoyu tochok sho nalezhat vnutrishnim abo zovnishnim konturam ob yekta Mnozhina cih tochok mozhe buti otrimana za dopomogoyu detektora krayiv Kanni angl i viboru vipadkovogo naboru tochok z cih krayiv Zvernit uvagu sho ci tochki ne povinni i v bilshosti vipadkiv ne vidpovidayut klyuchovim tochkam takim yak maksimumi krivizni abo tochkam pereginu Bazhano obirati formi z priblizno rivnomirnim intervalom hocha ce ne kritichno Krok 2 Obchislennya znachennya formi Cej krok dokladno opisanij u rozdili Teoriya Krok 3 Rozrahunok matrici vartosti Rozglyanemo dvi tochki p i q dlya yakih mayemo normalizovani gistogrami z K stovpcyami g k i h k Oskilki znachennya formi rozpodili predstavleni u viglyadi gistogram to zakonomirno vikoristati yak vartist formi kontekstu dlya dvoh tochok C S 1 2 k 1 K g k h k 2 g k h k displaystyle C S frac 1 2 sum k 1 K frac g k h k 2 g k h k Ce znachennya zminyuyetsya v diapazoni vid 0 do 1 Okrim pokaznika vartosti znachennya formi mozhe buti vikoristanij pokaznik dodatkovoyi vartosti sho gruntuyetsya na zovnishnomu viglyadi Napriklad ce mozhe buti mira neshozhosti tangensa kuta zastosovuyetsya pri rozpiznavanni cifr C A 1 2 cos 8 1 sin 8 1 cos 8 2 sin 8 2 displaystyle C A frac 1 2 begin Vmatrix dbinom cos theta 1 sin theta 1 dbinom cos theta 2 sin theta 2 end Vmatrix Ce polovina dovzhini hordi odinichnogo kola mizh odinichnimi vektorami z kutami 8 1 displaystyle theta 1 i 8 2 displaystyle theta 2 Znajdene znachennya takozh zminyuyetsya vid 0 do 1 Zagalna vartist spivstavlennya dvoh tochok mozhe buti rozrahovana yak zvazhena suma dvoh vishezgadanih vartostej C 1 b C S b C A displaystyle C 1 beta C S beta C A Teper dlya kozhnoyi tochki pi pershoyi formi ta tochki qj drugoyi formi potribno rozrahuvati zagalnu vartist yak opisano vishe i poznachiti ce znachennya Ci j Obrahovani znachennya vartostej dlya vsih tochok formuyut matricyu vartostej Krok 4 Znahodzhennya takogo zistavlennya yake minimizuye zagalnu vartist Rezultat zistavlennya Teper potribno znajti take poparne spivstavlennya kozhnoyi tochki pi pershoyi formi z tochkoyu qj drugoyi formi sho minimizuye zagalnu vartist zistavlennya H p i C p i q p i displaystyle H pi sum i C left p i q pi i right Ce mozhe buti vikonano za chas O N 3 displaystyle O N 3 vikoristovuyuchi ugorskij metod hocha isnuyut bilsh efektivni algoritmi Shob otrimati nadijnu obrobku vidhilen mozhna dodati shtuchni vuzli yaki mayut postijnu ale dosit veliku vartist spivstavlennya po vidnoshennyu do matrici vartostej Ce zmusit algoritm zistavlyati tochki sho ye vidhilennyami z shtuchno vvedenimi tochkami tilki u vipadku yaksho nemaye realnogo zistavlennya Krok 5 Modelyuvannya peretvoren Vrahovuyuchi bezlich vidpovidnostej mizh skinchennoyu mnozhinoyu tochok dvoh figur peretvorennya T R 2 R 2 displaystyle T mathbb R 2 to mathbb R 2 mozhe buti ocinene yak spivstavlennya bud yakoyi tochki odniyeyi figuri z tochkoyu inshoyi figuri Kilka variantiv takogo peretvorennya opisani nizhche Afinne peretvorennya Afinne peretvorennya ye standartnim viborom T p A p o displaystyle T p Ap o Rozv yazok metodom najmenshih kvadrativ matrici A displaystyle A i vektor zmishennya o obchislyuyut nastupnim chinom o 1 n i 1 n p i q p i A Q P t displaystyle o frac 1 n sum i 1 n left p i q pi i right A Q P t De P 1 p 11 p 12 1 p n 1 p n 2 displaystyle P begin pmatrix 1 amp p 11 amp p 12 vdots amp vdots amp vdots 1 amp p n1 amp p n2 end pmatrix z analogichnim virazom dlya Q displaystyle Q Q displaystyle Q ye psevdo obernenoyu matriceyu dlya Q displaystyle Q Krok 6 Obchislennya znachennya formi Teper znajdemo vidstan mizh znachennyami dvoh form P displaystyle P i Q displaystyle Q Cya vidstan ye zvazhenoyu sumoyu troh znachen Vidstan znachennya formi ce simetrichna suma vartosti zistavlen znachen formi dlya tochok z najkrashoyu vidpovidnistyu D s c P Q 1 n p P arg min q Q C p T q 1 m q Q arg min p P C p T q displaystyle D sc P Q frac 1 n sum p in P arg underset q in Q min C p T q frac 1 m sum q in Q arg underset p in P min C p T q de T ce rozrahovane peretvorennya sho peretvoryuye tochki formi Q v tochki formi P Vartist vhodzhennya Pislya vstanovlennya vidpovidnostej ta pravilno peretvorennya odnogo zobrazhennya v inshe mozhna viznachiti vartist vhodzhennya yak sumu kvadrativ riznic intensivnostej v navkolo vidpovidnih tochok zobrazhennya D a c P Q 1 n i 1 n D Z 2 G D I P p i D I Q T q p i D 2 displaystyle D ac P Q frac 1 n sum i 1 n sum Delta in Z 2 G Delta left I P p i Delta I Q T q pi i Delta right 2 de I P displaystyle I P ta I Q displaystyle I Q zobrazhennya v gradaciyah sirogo koloru I Q displaystyle I Q zobrazhennya pislya peretvorennya i G displaystyle G Gaussivska funkciya Vartist peretvorennya Ostatochna vartist D b e P Q displaystyle D be P Q vimiryuye peretvorennya sho potribni shob virivnyati dva zobrazhennya Teper mayuchi sposib obchislennya vidstani mizh dvoma formami mozhemo zastosuvati k NN z vidstannyu yaka viznachayetsya yak vidstan formi Rezultati zastosuvannya navedeni v nastupnomu rozdili RezultatiRozpiznavannya cifr Avtori ta viprobuvali yihnij pidhid na bazi danih rukopisnih cifr 7 kvitnya 2021 u Wayback Machine Bilshe nizh 50 algoritmiv bulo protestovano na cij bazi danih Baza mistit 60 000 navchalnih zrazkiv i 10 000 testovih zrazkiv Koeficiyent pomilok dlya cogo pidhodu stanoviv 0 63 dlya vikoristanih 20 000 navchalnih zrazkiv Na danij moment najnizhchij riven pomilok stanovit 0 35 Poshuk torgovih marok Znachennya formi buli vikoristani dlya otrimannya najbilsh podibnih torgovih znakiv z bazi danih za zapitom korisno pri viyavlenni porushen sho stosuyutsya tovarnih znakiv Zhoden vizualno shozhij tovarnij znak ne buv propushenij algoritmom perevireno vruchnu avtorami Div takozhMNIST baza danih PrimitkiS Belongie and J Malik 2000 Matching with Shape Contexts PDF IEEE Workshop on Contentbased Access of Image and Video Libraries CBAIVL 2000 S Belongie J Malik and J Puzicha April 2002 PDF IEEE Transactions on Pattern Analysis and Machine Intelligence 24 24 509 521 doi 10 1109 34 993558 Arhiv originalu PDF za 13 travnya 2013 Procitovano 14 grudnya 2012 S Belongie J Malik and J Puzicha July 2001 PDF Eighth IEEE International Conference on Computer Vision July 2001 Arhiv originalu PDF za 13 travnya 2013 Procitovano 14 grudnya 2012 S Belongie J Malik and J Puzicha 2000 Shape Context A new descriptor for shape matching and object recognition NIPS 2000 H Chui and A Rangarajan June 2000 A new algorithm for non rigid point matching CVPR T 2 s 44 51 R Jonker and A Volgenant 1987 A Shortest Augmenting Path Algorithm for Dense and Sparse Linear Assignment Problems Computing 38 4 325 340 doi 10 1007 BF02278710 PosilannyaMatching with Shape Contexts 18 grudnya 2012 u Wayback Machine MNIST database of handwritten digits 7 kvitnya 2021 u Wayback Machine Columbia Object Image Library COIL 20 21 grudnya 2012 u Wayback Machine Caltech101 Database 6 grudnya 2013 u Wayback Machine The clustering agglomerative hierarchical algorithm 5 bereznya 2016 u Wayback Machine Poshuk obraziv za yih invariantnimi ta parametrichnimi oznakami 5 bereznya 2016 u Wayback Machine Poshuk obraziv za indeksami klasteriv fragmentiv zobrazhen 20 travnya 2018 u Wayback Machine