Гістогра́ма напря́млених градіє́нтів (ГНГ, англ. histogram of oriented gradients, HOG) — це один з [en], які використовують у комп'ютернім баченні та обробці зображень з метою виявляння об'єктів. Ця методика підраховує напрямки градієнта в локалізованих частинах зображення. Цей метод подібний до методу , описувачів масштабоінваріантного перетворення ознак, та значення форми, але відрізняється тим, що його обчислюють на щільній ґратці рівномірно розташованих комірок, і що він використовує нормування локального контрасту з перекриттям для підвищення точності.
Концепції, що лежать в основі HOG, без використання терміну HOG, вперше описав з у патентній заявці 1986 року. 1994 року ці концепції використали [en]. Проте використання набуло широкого поширення лише 2005 року, коли та , дослідники з Французького національного інституту досліджень з комп'ютерних наук і автоматизації (INRIA), представили на [en] (CVPR) свою додаткову працю щодо описувачів HOG. У цій праці вони зосередилися на [en] на статичних зображеннях, хоча відтоді вони розширили свої перевірки, включивши виявляння людей на відео, а також різноманітних поширених тварин та транспортних засобів на статичних зображеннях.
Теорія
Основна ідея описувача гістограмами напрямлених градієнтів полягає в можливості описувати зовнішній вигляд та форму локального об'єкта на зображенні розподілом градієнтів яскравості та напрямків контурів. Зображення ділять на невеликі з'єднані області, звані комірками, й для пікселів у кожній комірці складають гістограму напрямків градієнта. Цей описувач — з'єднання цих гістограм. Для кращої точності локальні гістограми можливо унормовувати за контрастом, обчислюючи міру яскравості в більшій області зображення, званій блоком, й використовуючи потім це значення для унормовування всіх клітинок у блоці. Це унормовування дає кращу інваріантність щодо змін в освітленні та затіненні.
Описувач HOG має кілька ключових переваг над іншими описувачами. Оскільки він діє на локальних комірках, він інваріантний щодо геометричних і фотометричних перетворень, за винятком спрямування об'єкта. Такі зміни проявлятимуться лише у великих просторових областях. Крім того, як виявили Далал та Тріггс, груба просторова вибірка, точна вибірка спрямування, та сильне локальне фотометричне унормовування дозволяють ігнорувати окремі рухи тіла пішоходів, якщо вони зберігають приблизно вертикальне положення. Тож описувач HOG особливо зручний для виявляння людей на зображеннях.
Втілення алгоритму
Обчислення градієнта
Перший крок обчислення в багатьох виявлячах ознак у попередній обробці зображення — забезпечення унормованих значень кольору та гами. Проте, як зазначають Далал та Тріггс, цей крок в обчисленні описувача HOG можливо пропустити, оскільки наступне нормування описувача по суті досягає того же результату. Таким чином, попередня обробка зображення мало впливає на продуктивність. Натомість, першим кроком обчислення є обчислення значень градієнта. Найпоширеніший метод — застосування одновимірної центрованої точкової дискретної маски похідної в одному з, або обох, горизонтальному й вертикальному, напрямках. Конкретніше, цей метод вимагає фільтрування даних кольору або яскравості зображення наступними ядрами фільтрів:
- та
Далал та Тріггс перевіряли інші, складніші маски, такі як маска Собеля 3×3 та діагональні маски, але вони загалом виявляли людей на зображеннях гірше. Вони також експериментували з гауссовим згладжуванням перед застосуванням маски похідної, але так само виявили, що повне уникання згладжування працювало на практиці краще.
Групування спрямувань
Другий крок обчислення — створення гістограм комірок. Кожен піксель у комірці дає зважений голос за залежний від спрямування засік гістограми на основі значень, знайдених під час обчислення градієнта. Самі комірки можуть мати прямокутну або радіальну форму, а канали гістограми розподілено рівномірно від 0 до 180 градусів або від 0 до 360 градусів, залежно від того, чи градієнт «беззнаковий» чи «знаковий». Далал та Тріггс виявили, що беззнакові градієнти, які використовують у поєднанні з 9 каналами гістограми, показали найкращі результати в їхніх експериментах з виявляння людей, і водночас зазначили, що знакові градієнти дають значні поліпшення в розпізнаванні деяких інших класів об'єктів, таких як автомобілі чи мотоцикли. Що стосується ваги голосу, внесок пікселя може бути або власне величиною градієнта, або деякою її функцією. У перевірках найкращі результати зазвичай дає власне величина градієнта. До інших варіантів ваги голосування можуть належати квадратний корінь або квадрат величини градієнта, або деяка усічена версія цієї величини.
Блоки описувача
Щоби враховувати зміни в освітленні та контрасті, вираженість градієнта потрібно локально унормовувати, що вимагає групування комірок у більші, просторово з'єднані блоки. Тож описувач HOG це з'єднаний вектор складових унормованих коміркових гістограм з усіх областей блоку. Ці блоки зазвичай перекриваються, тобто кожна комірка робить внесок у кінцевий описувач понад одного разу. Існує дві основні геометрії блоків: прямокутні (англ. rectangular) блоки R-HOG та кругові (англ. circular) блоки C-HOG. Блоки R-HOG це зазвичай квадратні ґратки, подані трьома параметрами: кількістю комірок на блок, кількістю пікселів на комірку, та кількістю каналів на гістограму комірки. В експерименті Далала та Тріггса з виявляння людей оптимальними параметрами були чотири комірки 8×8 пікселів на блок (16×16 пікселів на блок) з 9 гістограмними каналами. Крім того, вони виявили, що можливо досягти деякого незначного поліпшення продуктивності, застосовуючи гауссове просторове вікно в кожному блоці перед зведенням гістограмних голосів задля зменшення ваги пікселів біля країв блоків. Блоки R-HOG виглядають вельми схожими на описувачі масштабоінваріантного ознакового перетворення (SIFT); проте, незважаючи на подібність їхнього формування, блоки R-HOG обчислюють у щільних ґратках в якомусь одному масштабі без вирівнювання спрямування, тоді як описувачі SIFT зазвичай обчислюють у розріджених масштабоінваріантних ключових точках зображення, й обертають для вирівнювання спрямування. Крім того, блоки R-HOG використовують для кодування інформації про просторову форму у поєднанні, тоді як описувачі SIFT використовують поодинці.
Кругових блоків HOG (C-HOG) буває два варіанти: з єдиною центральною коміркою, та з центральною коміркою, розділеною кутами. Крім цього, ці блоки C-HOG можливо описувати чотирма параметрами: кількістю кутових та радіусних засіків, радіусом центрального засіку, та коефіцієнтом розширення для радіусу додаткових радіусних засіків. Далал та Тріггс виявили, що ці два основні варіанти забезпечують однакову продуктивність, і що два радіусні засіки з чотирма кутовими засіками, центральним радіусом 4 пікселі та коефіцієнтом розширення 2 забезпечують найкращу продуктивність у їхніх експериментах (щоби досягти доброї продуктивності, кінець кінцем скористайтеся цією конфігурацією). Крім того, гауссове зважування при використанні з блоками C-HOG не давало жодної переваги. Блоки C-HOG виглядають схожими на описувачі значення форми, але сильно відрізняються тим, що містять комірки з декількома каналами спрямування, тоді як значення форми в їхньому формулюванні використовують лише один підрахунок присутності контуру.
Унормовування блоків
Далал та Тріггс дослідили чотири різні методи унормовування блоків. Нехай — ненормований вектор, що містить усі гістограми в даному блоці, — його k -норма для , а — деяка мала стала (точне значення, як можна сподіватися, неважливе). Тоді коефіцієнт унормовування може бути одним із наступних:
- L2-норма:
- L2-гіс: L2-норма з подальшим обтинанням (обмеженням максимальних значень v до 0,2) й перенормовуванням, як у
- L1-норма:
- L1-корінь:
У своїх експериментах Далал та Тріггс виявили, що схеми L2-гіс, L2-норма та L1-корінь забезпечують подібну продуктивність, тоді як L1-норма забезпечує трохи менш надійну; проте всі чотири методи показали дуже значне поліпшення порівняно з ненормованими даними.
Розпізнавання об'єктів
Описувачі HOG можна використовувати для розпізнавання об'єктів, надаючи їх як ознаки алгоритмові машинного навчання. Далал та Тріггс використовували описувачі HOG як ознаки в методі опорних векторів (SVM), проте описувачі HOG не прив'язано до певного алгоритму машинного навчання.
Продуктивність
У своєму оригінальному експерименті з виявляння людей Далал та Тріггс порівняли блоки своїх описувачів R-HOG та C-HOG із , описувачами PCA-SIFT, та описувачами значення форми. Узагальнені гаарові вейвлети — це спрямовані гаарові вейвлети, які 2001 року використали Мохан, Папагеоргіу та Поджіо у своїх власних експериментах з виявляння об'єктів. Описувачі PCA-SIFT подібні до описувачів SIFT, але відрізняються застосуванням методу головних компонент до внормованих ділянок градієнта. Описувачі PCA-SIFT вперше використали 2004 року Ке та Суктанкар, і стверджували, вони перевершують звичайні описувачі SIFT. Нарешті, значення форми використовують круглі засіки, подібні до використовуваних у блоках C-HOG, але зводять голоси лише на основі присутності контуру, не роблячи відмінності щодо спрямування. Значення форм первинно використали 2001 року Белогі, Малік та Пуціча.
Перевірку почали на двох різних наборах даних. База даних пішоходів Массачусетського технологічного інституту (MIT) містить 509 тренувальних та 200 перевірних зображень пішоходів на міських вулицях. Цей набір містить лише зображення людських фігур спереду чи ззаду, й містить незначну різноманітність людських поз. Цей набір добре відомий, його використовували в різноманітних експериментах з виявляння людей, таких як ті, які провели Папагеоргіу та Поджіо 2000 року. База даних MIT наразі доступна для досліджень за адресою . Другий набір розробили Далал та Тріггс виключно для свого експерименту з виявляння людей через те, що на наборі MIT описувачі HOG працювали майже ідеально. Їхній набір, відомий як INRIA, містить 1805 зображень людей, взятих із особистих фотографій. Він містить зображення людей у найрізноманітніших позах та включає складне тло, наприклад сцени натовпу, що робить його складнішим за набір MIT. База даних INRIA наразі доступна для досліджень за адресою http://lear.inrialpes.fr/data.
На вищезгаданому сайті є зображення, на якому показано приклади з бази даних INRIA для виявляння людей.
Що стосується результатів, блокові описувачі C-HOG та R-HOG працюють порівнянно, причому описувачі C-HOG зберігають невелику перевагу в рівні пропусків виявлення за незмінних хибнопозитивних рівнів на обох наборах даних. На наборі MIT описувачі C-HOG та R-HOG дали по суті нульовий рівень пропусків виявлення, за хибнопозитивного рівня 10−4. На наборі INRIA описувачі C-HOG та R-HOG дали рівень пропусків виявлення приблизно 0,1 за хибнопозитивного рівня 10−4. Узагальнені гаарові вейвлети становлять наступний за ефективністю підхід: вони дали приблизно 0,01 рівня невиявлень за хибнопозитивного рівня 10−4 на наборі MIT, і приблизно 0,3 рівня невиявлень на наборі INRIA. Описувачі PCA-SIFT й описувачі значення форми обидва показали доволі погану роботу з обома наборами даних. Обидва методи дали рівень невиявлень 0,1 за хибнопозитивного рівня 10−4 на наборі MIT і рівень невиявлень майже 0,5 за хибнопозитивного рівня 10−4 на наборі INRIA.
Подальший розвиток
У рамках семінару Pascal Visual Object Classes 2006 Далал та Тріггс презентували результати застосування описувачів гістограмами напрямлених градієнтів до інших об'єктів зображень, крім людей, таких як автомобілі, автобуси та велосипеди, а також поширених тварин, таких як собаки, коти та корови. До своїх результатів вони включили оптимальні параметри для формулювання блоку та нормування в кожному випадку. Зображення в наведеному нижче посиланні показує деякі приклади їхнього виявлення для мотоциклів.
У рамках [en] (ECCV) 2006 року Далал та Тріггс об'єдналися з [en], щоби застосувати описувачі HOG до задачі виявляння людей у фільмах та відео. Вони поєднали описувачі HOG на окремих відеокадрах із нещодавно запропонованими гістограмами внутрішнього руху (англ. internal motion histograms, IMH) на парах послідовних відеокадрів. Ці гістограми внутрішнього руху використовують величини градієнта з полів оптичного потоку, отриманих із двох послідовних кадрів. Потім ці величини градієнта використовують так само, як і створювані з даних статичного зображення у підході описувача HOG. Під час перевірки на двох великих наборах даних, взятих із кількох фільмів, об'єднаний метод HOG-IMH дав рівень невиявлень приблизно 0,1 за хибнопозитивного рівня .
На 2006 року , та представили повну систему виявляння пішоходів на основі описувачів HOG. Їхня система працює за допомогою двох інфрачервоних камер. Оскільки на інфрачервоних зображеннях люди виглядають яскравішими за навколишнє оточення, система спочатку встановлює особливі положення в більшому полі огляду, де ймовірно можуть перебувати люди. Потім класифікатори методу опорних векторів працюють з описувачами HOG, взятими з цього меншого числа особливих положень, щоби сформулювати рішення щодо присутності пішохода. Коли пішоходи перебувають у полі огляду, фактичне положення пішохода оцінюють за допомогою стереозору.
На [en]IEEE 2006 року , , та представили алгоритм для значного прискорення виявляння людей за допомогою методів описувача HOG. Їхній метод використовує описувачі HOG у поєднанні з алгоритмом [en], який зазвичай успішно застосовують для виявляння облич. Також, замість того, щоби покладатися на блоки однакового розміру, вони запроваджують блоки, які різняться за розміром, розташуванням та співвідношенням сторін. Щоби виділяти блоки, які найкраще підходять для виявляння людей, вони застосували алгоритм [en], щоб обирати блоки для включення до каскаду. Під час експериментів їхній алгоритм досяг продуктивності, порівнянної з оригінальним алгоритмом Далала та Тріггса, але працював у 70 разів швидше. 2006 року [en] подали заявку на отримання патенту США на цей алгоритм з номером заявки 20070237387.
На IEEE 2010 року , та розширили описувач HOG для використання в пошуку зображень за начерками (англ. sketch based image retrieval, SBIR). Щільне поле напрямків було екстрапольовано з переважних відгуків у виявлячі контурів Кенні за лапласового обмеження гладкості, й над цим полем обчислювали HOG. Отриманий описувач HOG градієнтного поля (англ. gradient field HOG, GF-HOG) вловлював локальну просторову структуру в нарисах та відображеннях контурів зображення. Це дозволило використовувати цей описувач у системі пошуку зображень за вмістом, в якій можливо шукати за нарисованими від руки фігурами. Було показано, що пристосування GF-HOG при виконанні завдання SBIR перевершує наявні градієнтно-гістограмні описувачі, такі як SIFT, SURF та HOG, приблизно на 15 відсотків.
2010 року запропонував удосконалення описувача HOG для тривимірних хмар точок. Замість градієнтів зображення він використовував відстані між точками (пікселями) й площинами, так звані залишки, щоб охарактеризувати локальну область у хмарі точок. Його описувач гістограмами напрямлених залишків (англ. histogram of oriented residuals, HOR) успішно використали в задачах виявляння об'єктів тривимірних хмар точок.
Див. також
Примітки
- Method of and apparatus for pattern recognition. (англ.)
- Orientation Histograms for Hand Gesture Recognition. (англ.)
- Histograms of Oriented Gradients for Human Detection (PDF). с. 2. (англ.)
- Histograms of Oriented Gradients for Human Detection (PDF). с. 4. (англ.)
- Histograms of Oriented Gradients for Human Detection (PDF). с. 5. (англ.)
- Histograms of Oriented Gradients for Human Detection (PDF). с. 6. (англ.)
- D. G. Lowe. Distinctive image features from scale-invariant keypoints. IJCV, 60(2):91–110, 2004. (англ.)
- Histograms of Oriented Gradients for Human Detection (PDF). с. 1. (англ.)
- (PDF). Архів оригіналу (PDF) за 5 грудня 2013. Процитовано 10 грудня 2007. (англ.)
- (PDF). Архів оригіналу (PDF) за 5 вересня 2008. Процитовано 10 грудня 2007. (первинний документ більше не доступний; подібна праця [ 2023-01-28 у Wayback Machine.] (англ.))
- Pedestrian Detection using Infrared images and Histograms of Oriented Gradients (PDF). (англ.)
- Fast Human Detection Using a Cascade of Histograms of Oriented Gradients (PDF). (англ.)
- Gradient Field Descriptor for Sketch based Image Retrieval and Localisation (PDF). (англ.)
- A Performance Evaluation of the Gradient Field HOG Descriptor for Sketch based Image Retrieval (PDF). (англ.)
- Krückhans, Martin. (PDF). Архів оригіналу (PDF) за 16 листопада 2010. Процитовано 28 січня 2023. (нім.)
- Semantic 3D Octree Maps based on Conditional Random Fields (PDF). (англ.)
Посилання
- http://www.mathworks.com/matlabcentral/fileexchange/33863 — втілення для Matlab (файл [en])
- https://www.cs.cmu.edu/~yke/pcasift/ — код виявляння об'єктів PCA-SIFT
- http://lear.inrialpes.fr/software/ — програмний інструментарій для виявляння об'єктів HOG (домашня сторінка дослідницької групи)
- — програмний інструментарій для виявляння об'єктів HOG (домашня сторінка Навніта Далала)
- http://dlib.net/imaging.html#scan_fhog_pyramid — програмний інструментарій та Python для виявляння об'єктів HOG
- http://pascal.inrialpes.fr/data/human/ [ 2010-05-05 у Wayback Machine.] — набір даних зображень людей INRIA
- http://cbcl.mit.edu/software-datasets/PedestrianData.html — набір даних зображень пішоходів MIT
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Gistogra ma naprya mlenih gradiye ntiv GNG angl histogram of oriented gradients HOG ce odin z en yaki vikoristovuyut u komp yuternim bachenni ta obrobci zobrazhen z metoyu viyavlyannya ob yektiv Cya metodika pidrahovuye napryamki gradiyenta v lokalizovanih chastinah zobrazhennya Cej metod podibnij do metodu opisuvachiv masshtaboinvariantnogo peretvorennya oznak ta znachennya formi ale vidriznyayetsya tim sho jogo obchislyuyut na shilnij gratci rivnomirno roztashovanih komirok i sho vin vikoristovuye normuvannya lokalnogo kontrastu z perekrittyam dlya pidvishennya tochnosti Koncepciyi sho lezhat v osnovi HOG bez vikoristannya terminu HOG vpershe opisav z u patentnij zayavci 1986 roku 1994 roku ci koncepciyi vikoristali en Prote vikoristannya nabulo shirokogo poshirennya lishe 2005 roku koli ta doslidniki z Francuzkogo nacionalnogo institutu doslidzhen z komp yuternih nauk i avtomatizaciyi INRIA predstavili na en CVPR svoyu dodatkovu pracyu shodo opisuvachiv HOG U cij praci voni zoseredilisya na en na statichnih zobrazhennyah hocha vidtodi voni rozshirili svoyi perevirki vklyuchivshi viyavlyannya lyudej na video a takozh riznomanitnih poshirenih tvarin ta transportnih zasobiv na statichnih zobrazhennyah TeoriyaOsnovna ideya opisuvacha gistogramami napryamlenih gradiyentiv polyagaye v mozhlivosti opisuvati zovnishnij viglyad ta formu lokalnogo ob yekta na zobrazhenni rozpodilom gradiyentiv yaskravosti ta napryamkiv konturiv Zobrazhennya dilyat na neveliki z yednani oblasti zvani komirkami j dlya pikseliv u kozhnij komirci skladayut gistogramu napryamkiv gradiyenta Cej opisuvach z yednannya cih gistogram Dlya krashoyi tochnosti lokalni gistogrami mozhlivo unormovuvati za kontrastom obchislyuyuchi miru yaskravosti v bilshij oblasti zobrazhennya zvanij blokom j vikoristovuyuchi potim ce znachennya dlya unormovuvannya vsih klitinok u bloci Ce unormovuvannya daye krashu invariantnist shodo zmin v osvitlenni ta zatinenni Opisuvach HOG maye kilka klyuchovih perevag nad inshimi opisuvachami Oskilki vin diye na lokalnih komirkah vin invariantnij shodo geometrichnih i fotometrichnih peretvoren za vinyatkom spryamuvannya ob yekta Taki zmini proyavlyatimutsya lishe u velikih prostorovih oblastyah Krim togo yak viyavili Dalal ta Triggs gruba prostorova vibirka tochna vibirka spryamuvannya ta silne lokalne fotometrichne unormovuvannya dozvolyayut ignoruvati okremi ruhi tila pishohodiv yaksho voni zberigayut priblizno vertikalne polozhennya Tozh opisuvach HOG osoblivo zruchnij dlya viyavlyannya lyudej na zobrazhennyah Vtilennya algoritmuObchislennya gradiyenta Pershij krok obchislennya v bagatoh viyavlyachah oznak u poperednij obrobci zobrazhennya zabezpechennya unormovanih znachen koloru ta gami Prote yak zaznachayut Dalal ta Triggs cej krok v obchislenni opisuvacha HOG mozhlivo propustiti oskilki nastupne normuvannya opisuvacha po suti dosyagaye togo zhe rezultatu Takim chinom poperednya obrobka zobrazhennya malo vplivaye na produktivnist Natomist pershim krokom obchislennya ye obchislennya znachen gradiyenta Najposhirenishij metod zastosuvannya odnovimirnoyi centrovanoyi tochkovoyi diskretnoyi maski pohidnoyi v odnomu z abo oboh gorizontalnomu j vertikalnomu napryamkah Konkretnishe cej metod vimagaye filtruvannya danih koloru abo yaskravosti zobrazhennya nastupnimi yadrami filtriv 1 0 1 displaystyle 1 0 1 ta 1 0 1 displaystyle 1 0 1 top Dalal ta Triggs pereviryali inshi skladnishi maski taki yak maska Sobelya 3 3 ta diagonalni maski ale voni zagalom viyavlyali lyudej na zobrazhennyah girshe Voni takozh eksperimentuvali z gaussovim zgladzhuvannyam pered zastosuvannyam maski pohidnoyi ale tak samo viyavili sho povne unikannya zgladzhuvannya pracyuvalo na praktici krashe Grupuvannya spryamuvan Drugij krok obchislennya stvorennya gistogram komirok Kozhen piksel u komirci daye zvazhenij golos za zalezhnij vid spryamuvannya zasik gistogrami na osnovi znachen znajdenih pid chas obchislennya gradiyenta Sami komirki mozhut mati pryamokutnu abo radialnu formu a kanali gistogrami rozpodileno rivnomirno vid 0 do 180 gradusiv abo vid 0 do 360 gradusiv zalezhno vid togo chi gradiyent bezznakovij chi znakovij Dalal ta Triggs viyavili sho bezznakovi gradiyenti yaki vikoristovuyut u poyednanni z 9 kanalami gistogrami pokazali najkrashi rezultati v yihnih eksperimentah z viyavlyannya lyudej i vodnochas zaznachili sho znakovi gradiyenti dayut znachni polipshennya v rozpiznavanni deyakih inshih klasiv ob yektiv takih yak avtomobili chi motocikli Sho stosuyetsya vagi golosu vnesok pikselya mozhe buti abo vlasne velichinoyu gradiyenta abo deyakoyu yiyi funkciyeyu U perevirkah najkrashi rezultati zazvichaj daye vlasne velichina gradiyenta Do inshih variantiv vagi golosuvannya mozhut nalezhati kvadratnij korin abo kvadrat velichini gradiyenta abo deyaka usichena versiya ciyeyi velichini Bloki opisuvacha Shobi vrahovuvati zmini v osvitlenni ta kontrasti virazhenist gradiyenta potribno lokalno unormovuvati sho vimagaye grupuvannya komirok u bilshi prostorovo z yednani bloki Tozh opisuvach HOG ce z yednanij vektor skladovih unormovanih komirkovih gistogram z usih oblastej bloku Ci bloki zazvichaj perekrivayutsya tobto kozhna komirka robit vnesok u kincevij opisuvach ponad odnogo razu Isnuye dvi osnovni geometriyi blokiv pryamokutni angl rectangular bloki R HOG ta krugovi angl circular bloki C HOG Bloki R HOG ce zazvichaj kvadratni gratki podani troma parametrami kilkistyu komirok na blok kilkistyu pikseliv na komirku ta kilkistyu kanaliv na gistogramu komirki V eksperimenti Dalala ta Triggsa z viyavlyannya lyudej optimalnimi parametrami buli chotiri komirki 8 8 pikseliv na blok 16 16 pikseliv na blok z 9 gistogramnimi kanalami Krim togo voni viyavili sho mozhlivo dosyagti deyakogo neznachnogo polipshennya produktivnosti zastosovuyuchi gaussove prostorove vikno v kozhnomu bloci pered zvedennyam gistogramnih golosiv zadlya zmenshennya vagi pikseliv bilya krayiv blokiv Bloki R HOG viglyadayut velmi shozhimi na opisuvachi masshtaboinvariantnogo oznakovogo peretvorennya SIFT prote nezvazhayuchi na podibnist yihnogo formuvannya bloki R HOG obchislyuyut u shilnih gratkah v yakomus odnomu masshtabi bez virivnyuvannya spryamuvannya todi yak opisuvachi SIFT zazvichaj obchislyuyut u rozridzhenih masshtaboinvariantnih klyuchovih tochkah zobrazhennya j obertayut dlya virivnyuvannya spryamuvannya Krim togo bloki R HOG vikoristovuyut dlya koduvannya informaciyi pro prostorovu formu u poyednanni todi yak opisuvachi SIFT vikoristovuyut poodinci Krugovih blokiv HOG C HOG buvaye dva varianti z yedinoyu centralnoyu komirkoyu ta z centralnoyu komirkoyu rozdilenoyu kutami Krim cogo ci bloki C HOG mozhlivo opisuvati chotirma parametrami kilkistyu kutovih ta radiusnih zasikiv radiusom centralnogo zasiku ta koeficiyentom rozshirennya dlya radiusu dodatkovih radiusnih zasikiv Dalal ta Triggs viyavili sho ci dva osnovni varianti zabezpechuyut odnakovu produktivnist i sho dva radiusni zasiki z chotirma kutovimi zasikami centralnim radiusom 4 pikseli ta koeficiyentom rozshirennya 2 zabezpechuyut najkrashu produktivnist u yihnih eksperimentah shobi dosyagti dobroyi produktivnosti kinec kincem skoristajtesya ciyeyu konfiguraciyeyu Krim togo gaussove zvazhuvannya pri vikoristanni z blokami C HOG ne davalo zhodnoyi perevagi Bloki C HOG viglyadayut shozhimi na opisuvachi znachennya formi ale silno vidriznyayutsya tim sho mistyat komirki z dekilkoma kanalami spryamuvannya todi yak znachennya formi v yihnomu formulyuvanni vikoristovuyut lishe odin pidrahunok prisutnosti konturu Unormovuvannya blokiv Dalal ta Triggs doslidili chotiri rizni metodi unormovuvannya blokiv Nehaj v displaystyle v nenormovanij vektor sho mistit usi gistogrami v danomu bloci v k displaystyle v k jogo k norma dlya k 1 2 displaystyle k 1 2 a e displaystyle e deyaka mala stala tochne znachennya yak mozhna spodivatisya nevazhlive Todi koeficiyent unormovuvannya mozhe buti odnim iz nastupnih L2 norma f v v 22 e2 displaystyle f v over sqrt v 2 2 e 2 L2 gis L2 norma z podalshim obtinannyam obmezhennyam maksimalnih znachen v do 0 2 j perenormovuvannyam yak uL1 norma f v v 1 e displaystyle f v over v 1 e L1 korin f v v 1 e displaystyle f sqrt v over v 1 e U svoyih eksperimentah Dalal ta Triggs viyavili sho shemi L2 gis L2 norma ta L1 korin zabezpechuyut podibnu produktivnist todi yak L1 norma zabezpechuye trohi mensh nadijnu prote vsi chotiri metodi pokazali duzhe znachne polipshennya porivnyano z nenormovanimi danimi Rozpiznavannya ob yektiv Opisuvachi HOG mozhna vikoristovuvati dlya rozpiznavannya ob yektiv nadayuchi yih yak oznaki algoritmovi mashinnogo navchannya Dalal ta Triggs vikoristovuvali opisuvachi HOG yak oznaki v metodi opornih vektoriv SVM prote opisuvachi HOG ne priv yazano do pevnogo algoritmu mashinnogo navchannya ProduktivnistU svoyemu originalnomu eksperimenti z viyavlyannya lyudej Dalal ta Triggs porivnyali bloki svoyih opisuvachiv R HOG ta C HOG iz opisuvachami PCA SIFT ta opisuvachami znachennya formi Uzagalneni gaarovi vejvleti ce spryamovani gaarovi vejvleti yaki 2001 roku vikoristali Mohan Papageorgiu ta Podzhio u svoyih vlasnih eksperimentah z viyavlyannya ob yektiv Opisuvachi PCA SIFT podibni do opisuvachiv SIFT ale vidriznyayutsya zastosuvannyam metodu golovnih komponent do vnormovanih dilyanok gradiyenta Opisuvachi PCA SIFT vpershe vikoristali 2004 roku Ke ta Suktankar i stverdzhuvali voni perevershuyut zvichajni opisuvachi SIFT Nareshti znachennya formi vikoristovuyut krugli zasiki podibni do vikoristovuvanih u blokah C HOG ale zvodyat golosi lishe na osnovi prisutnosti konturu ne roblyachi vidminnosti shodo spryamuvannya Znachennya form pervinno vikoristali 2001 roku Belogi Malik ta Pucicha Perevirku pochali na dvoh riznih naborah danih Baza danih pishohodiv Massachusetskogo tehnologichnogo institutu MIT mistit 509 trenuvalnih ta 200 perevirnih zobrazhen pishohodiv na miskih vulicyah Cej nabir mistit lishe zobrazhennya lyudskih figur speredu chi zzadu j mistit neznachnu riznomanitnist lyudskih poz Cej nabir dobre vidomij jogo vikoristovuvali v riznomanitnih eksperimentah z viyavlyannya lyudej takih yak ti yaki proveli Papageorgiu ta Podzhio 2000 roku Baza danih MIT narazi dostupna dlya doslidzhen za adresoyu Drugij nabir rozrobili Dalal ta Triggs viklyuchno dlya svogo eksperimentu z viyavlyannya lyudej cherez te sho na nabori MIT opisuvachi HOG pracyuvali majzhe idealno Yihnij nabir vidomij yak INRIA mistit 1805 zobrazhen lyudej vzyatih iz osobistih fotografij Vin mistit zobrazhennya lyudej u najriznomanitnishih pozah ta vklyuchaye skladne tlo napriklad sceni natovpu sho robit jogo skladnishim za nabir MIT Baza danih INRIA narazi dostupna dlya doslidzhen za adresoyu http lear inrialpes fr data Na vishezgadanomu sajti ye zobrazhennya na yakomu pokazano prikladi z bazi danih INRIA dlya viyavlyannya lyudej Sho stosuyetsya rezultativ blokovi opisuvachi C HOG ta R HOG pracyuyut porivnyanno prichomu opisuvachi C HOG zberigayut neveliku perevagu v rivni propuskiv viyavlennya za nezminnih hibnopozitivnih rivniv na oboh naborah danih Na nabori MIT opisuvachi C HOG ta R HOG dali po suti nulovij riven propuskiv viyavlennya za hibnopozitivnogo rivnya 10 4 Na nabori INRIA opisuvachi C HOG ta R HOG dali riven propuskiv viyavlennya priblizno 0 1 za hibnopozitivnogo rivnya 10 4 Uzagalneni gaarovi vejvleti stanovlyat nastupnij za efektivnistyu pidhid voni dali priblizno 0 01 rivnya neviyavlen za hibnopozitivnogo rivnya 10 4 na nabori MIT i priblizno 0 3 rivnya neviyavlen na nabori INRIA Opisuvachi PCA SIFT j opisuvachi znachennya formi obidva pokazali dovoli poganu robotu z oboma naborami danih Obidva metodi dali riven neviyavlen 0 1 za hibnopozitivnogo rivnya 10 4 na nabori MIT i riven neviyavlen majzhe 0 5 za hibnopozitivnogo rivnya 10 4 na nabori INRIA Podalshij rozvitokU ramkah seminaru Pascal Visual Object Classes 2006 Dalal ta Triggs prezentuvali rezultati zastosuvannya opisuvachiv gistogramami napryamlenih gradiyentiv do inshih ob yektiv zobrazhen krim lyudej takih yak avtomobili avtobusi ta velosipedi a takozh poshirenih tvarin takih yak sobaki koti ta korovi Do svoyih rezultativ voni vklyuchili optimalni parametri dlya formulyuvannya bloku ta normuvannya v kozhnomu vipadku Zobrazhennya v navedenomu nizhche posilanni pokazuye deyaki prikladi yihnogo viyavlennya dlya motocikliv U ramkah en ECCV 2006 roku Dalal ta Triggs ob yednalisya z en shobi zastosuvati opisuvachi HOG do zadachi viyavlyannya lyudej u filmah ta video Voni poyednali opisuvachi HOG na okremih videokadrah iz neshodavno zaproponovanimi gistogramami vnutrishnogo ruhu angl internal motion histograms IMH na parah poslidovnih videokadriv Ci gistogrami vnutrishnogo ruhu vikoristovuyut velichini gradiyenta z poliv optichnogo potoku otrimanih iz dvoh poslidovnih kadriv Potim ci velichini gradiyenta vikoristovuyut tak samo yak i stvoryuvani z danih statichnogo zobrazhennya u pidhodi opisuvacha HOG Pid chas perevirki na dvoh velikih naborah danih vzyatih iz kilkoh filmiv ob yednanij metod HOG IMH dav riven neviyavlen priblizno 0 1 za hibnopozitivnogo rivnya 10 4 displaystyle 10 4 Na 2006 roku ta predstavili povnu sistemu viyavlyannya pishohodiv na osnovi opisuvachiv HOG Yihnya sistema pracyuye za dopomogoyu dvoh infrachervonih kamer Oskilki na infrachervonih zobrazhennyah lyudi viglyadayut yaskravishimi za navkolishnye otochennya sistema spochatku vstanovlyuye osoblivi polozhennya v bilshomu poli oglyadu de jmovirno mozhut perebuvati lyudi Potim klasifikatori metodu opornih vektoriv pracyuyut z opisuvachami HOG vzyatimi z cogo menshogo chisla osoblivih polozhen shobi sformulyuvati rishennya shodo prisutnosti pishohoda Koli pishohodi perebuvayut u poli oglyadu faktichne polozhennya pishohoda ocinyuyut za dopomogoyu stereozoru Na en IEEE 2006 roku ta predstavili algoritm dlya znachnogo priskorennya viyavlyannya lyudej za dopomogoyu metodiv opisuvacha HOG Yihnij metod vikoristovuye opisuvachi HOG u poyednanni z algoritmom en yakij zazvichaj uspishno zastosovuyut dlya viyavlyannya oblich Takozh zamist togo shobi pokladatisya na bloki odnakovogo rozmiru voni zaprovadzhuyut bloki yaki riznyatsya za rozmirom roztashuvannyam ta spivvidnoshennyam storin Shobi vidilyati bloki yaki najkrashe pidhodyat dlya viyavlyannya lyudej voni zastosuvali algoritm en shob obirati bloki dlya vklyuchennya do kaskadu Pid chas eksperimentiv yihnij algoritm dosyag produktivnosti porivnyannoyi z originalnim algoritmom Dalala ta Triggsa ale pracyuvav u 70 raziv shvidshe 2006 roku en podali zayavku na otrimannya patentu SShA na cej algoritm z nomerom zayavki 20070237387 Na IEEE 2010 roku ta rozshirili opisuvach HOG dlya vikoristannya v poshuku zobrazhen za nacherkami angl sketch based image retrieval SBIR Shilne pole napryamkiv bulo ekstrapolovano z perevazhnih vidgukiv u viyavlyachi konturiv Kenni za laplasovogo obmezhennya gladkosti j nad cim polem obchislyuvali HOG Otrimanij opisuvach HOG gradiyentnogo polya angl gradient field HOG GF HOG vlovlyuvav lokalnu prostorovu strukturu v narisah ta vidobrazhennyah konturiv zobrazhennya Ce dozvolilo vikoristovuvati cej opisuvach u sistemi poshuku zobrazhen za vmistom v yakij mozhlivo shukati za narisovanimi vid ruki figurami Bulo pokazano sho pristosuvannya GF HOG pri vikonanni zavdannya SBIR perevershuye nayavni gradiyentno gistogramni opisuvachi taki yak SIFT SURF ta HOG priblizno na 15 vidsotkiv 2010 roku zaproponuvav udoskonalennya opisuvacha HOG dlya trivimirnih hmar tochok Zamist gradiyentiv zobrazhennya vin vikoristovuvav vidstani mizh tochkami pikselyami j ploshinami tak zvani zalishki shob oharakterizuvati lokalnu oblast u hmari tochok Jogo opisuvach gistogramami napryamlenih zalishkiv angl histogram of oriented residuals HOR uspishno vikoristali v zadachah viyavlyannya ob yektiv trivimirnih hmar tochok Div takozhViyavlyannya kutiv en Oznaka komp yuterne bachennya Viyavlyannya oznak komp yuterne bachennya Vidilyannya oznak Viyavlyannya osoblivih tochok en Masshtaboinvariantne oznakove peretvorennyaPrimitkiMethod of and apparatus for pattern recognition angl Orientation Histograms for Hand Gesture Recognition angl Histograms of Oriented Gradients for Human Detection PDF s 2 angl Histograms of Oriented Gradients for Human Detection PDF s 4 angl Histograms of Oriented Gradients for Human Detection PDF s 5 angl Histograms of Oriented Gradients for Human Detection PDF s 6 angl D G Lowe Distinctive image features from scale invariant keypoints IJCV 60 2 91 110 2004 angl Histograms of Oriented Gradients for Human Detection PDF s 1 angl PDF Arhiv originalu PDF za 5 grudnya 2013 Procitovano 10 grudnya 2007 angl PDF Arhiv originalu PDF za 5 veresnya 2008 Procitovano 10 grudnya 2007 pervinnij dokument bilshe ne dostupnij podibna pracya 2023 01 28 u Wayback Machine angl Pedestrian Detection using Infrared images and Histograms of Oriented Gradients PDF angl Fast Human Detection Using a Cascade of Histograms of Oriented Gradients PDF angl Gradient Field Descriptor for Sketch based Image Retrieval and Localisation PDF angl A Performance Evaluation of the Gradient Field HOG Descriptor for Sketch based Image Retrieval PDF angl Kruckhans Martin PDF Arhiv originalu PDF za 16 listopada 2010 Procitovano 28 sichnya 2023 nim Semantic 3D Octree Maps based on Conditional Random Fields PDF angl Posilannyahttp www mathworks com matlabcentral fileexchange 33863 vtilennya dlya Matlab fajl en https www cs cmu edu yke pcasift kod viyavlyannya ob yektiv PCA SIFT http lear inrialpes fr software programnij instrumentarij dlya viyavlyannya ob yektiv HOG domashnya storinka doslidnickoyi grupi programnij instrumentarij dlya viyavlyannya ob yektiv HOG domashnya storinka Navnita Dalala http dlib net imaging html scan fhog pyramid programnij instrumentarij C ta Python dlya viyavlyannya ob yektiv HOG http pascal inrialpes fr data human 2010 05 05 u Wayback Machine nabir danih zobrazhen lyudej INRIA http cbcl mit edu software datasets PedestrianData html nabir danih zobrazhen pishohodiv MIT