Виявля́ння об'є́ктів (англ. object detection) — це комп'ютерна технологія, пов'язана з комп'ютерним баченням та обробкою зображень, яка має справу з виявлянням примірників семантичних об'єктів певного класу (таких як люди, будівлі чи автомобілі) у цифрових зображеннях та відео. До добре досліджених областей виявляння об'єктів належать виявляння облич та [en]. Виявляння об'єктів має застосування у багатьох сферах комп'ютерного бачення, включно з [en] та відеоспостереженням.
Використання
Його широко використовують у задачах комп'ютерного бачення, таких як [en], підрахунок транспортних засобів, [en], виявляння облич, розпізнавання облич, [en]. Його також використовують у відстежуванні об'єктів, наприклад відстежуванні м'яча під час футбольного матчу, відстежуванні руху біти для крикету, або відстежуванні особи на відео.
Концепція
Кожен клас об'єктів має свої ознаки, які допомагають у його класифікуванні — наприклад, усі кола круглі. Виявляння класу об'єктів використовує ці особливі ознаки. Наприклад, при пошуку кіл шукають об'єкти, що перебувають на певній відстані від якоїсь точки (тобто центру). Подібним чином, при пошуку квадратів потрібні об'єкти, які мають перпендикулярні кути та мають однакову довжину сторін. Подібний підхід використовують для встановлювання облич, де можливо знаходити очі, ніс і губи, а також такі ознаки, як колір шкіри та відстань між очима.
Методи
Методи виявляння об'єктів зазвичай належать або до нейромережних, або до ненейронних підходів. Для ненейронних підходів стає необхідним спочатку визначити ознаки за допомогою одного з наведених нижче методів, а потім використовувати метод, такий як опорновекторні машини (ОВМ, англ. SVM), щоби здійснювати класифікування. З іншого боку, нейронні методики здатні здійснювати наскрізне виявляння об'єктів без спеціального визначення ознак, і зазвичай ґрунтуються на згорткових нейронних мережах (ЗНМ, англ. CNN).
- Ненейронні підходи:
- Система Віоли — Джонса виявляння об'єктів на основі гаарових ознак
- Масштабоінваріантне ознакове перетворення (МІОП, англ. SIFT)
- Ознаки гістограм напрямлених градієнтів (ГНГ, англ. HOG)
- Нейромережні підходи:
- [en] (О-ЗНМ, англ. R-CNN, Fast R-CNN, Faster R-CNN, каскадна О-ЗНМ.)
- Одноходовий багаторамковий виявляч (ОКВ, англ. Single Shot MultiBox Detector, SSD)
- You Only Look Once (YOLO, укр. «ви дивитеся лише раз»)
- Одноходова уточнювальна нейронна мережа для виявляння об'єктів (англ. Single-Shot Refinement Neural Network for Object Detection, RefineDet)
- Retina-Net
- Деформовні згорткові мережі (англ. deformable convolutional networks)
Див. також
Примітки
- Dasiopoulou, Stamatia, et al. "Knowledge-assisted semantic video object detection." IEEE Transactions on Circuits and Systems for Video Technology 15.10 (2005): 1210–1224. (англ.)
- Ling Guan; Yifeng He; Sun-Yuan Kung (1 березня 2012). Multimedia Image and Video Processing. CRC Press. с. 331–. ISBN . (англ.)
- Alsanabani, Ala; Ahmed, Mohammed; AL Smadi, Ahmad (2020). Vehicle Counting Using Detecting-Tracking Combinations: A Comparative Analysis. 2020 the 4th International Conference on Video and Image Processing. с. 48—54. doi:10.1145/3447450.3447458. ISBN . S2CID 233194604. (англ.)
- Wu, Jianxin, et al. "A scalable approach to activity recognition based on object use." 2007 IEEE 11th international conference on computer vision. IEEE, 2007. (англ.)
- Bochkovskiy, Alexey (2020). Yolov4: Optimal Speed and Accuracy of Object Detection. arXiv:2004.10934 [cs.CV]. (англ.)
- Dalal, Navneet (2005). Histograms of oriented gradients for human detection (PDF). Computer Vision and Pattern Recognition. 1. (англ.)
- Ross, Girshick (2014). Rich feature hierarchies for accurate object detection and semantic segmentation (PDF). Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. IEEE. с. 580—587. arXiv:1311.2524. doi:10.1109/CVPR.2014.81. ISBN . S2CID 215827080. (англ.)
- Girschick, Ross (2015). Fast R-CNN (PDF). Proceedings of the IEEE International Conference on Computer Vision. с. 1440—1448. arXiv:1504.08083. Bibcode:2015arXiv150408083G. (англ.)
- Shaoqing, Ren (2015). Faster R-CNN. Advances in Neural Information Processing Systems. arXiv:1506.01497. (англ.)
- Pang, Jiangmiao; Chen, Kai; Shi, Jianping; Feng, Huajun; Ouyang, Wanli; Lin, Dahua (4 квітня 2019). Libra R-CNN: Towards Balanced Learning for Object Detection. arXiv:1904.02701v1 [cs.CV]. (англ.)
- Liu, Wei (October 2016). SSD: Single shot multibox detector. Computer Vision – ECCV 2016. Lecture Notes in Computer Science. Т. 9905. с. 21—37. arXiv:1512.02325. doi:10.1007/978-3-319-46448-0_2. ISBN . S2CID 2141740.
{{}}
: Проігноровано|journal=
() (англ.) - Redmon, Joseph (2016). You only look once: Unified, real-time object detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. arXiv:1506.02640. Bibcode:2015arXiv150602640R. (англ.)
- Redmon, Joseph (2017). YOLO9000: better, faster, stronger. arXiv:1612.08242 [cs.CV]. (англ.)
- Redmon, Joseph (2018). Yolov3: An incremental improvement. arXiv:1804.02767 [cs.CV]. (англ.)
- Wang, Chien-Yao (2021). Scaled-YOLOv4: Scaling Cross Stage Partial Network. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). arXiv:2011.08036. Bibcode:2020arXiv201108036W. (англ.)
- Zhang, Shifeng (2018). Single-Shot Refinement Neural Network for Object Detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. с. 4203—4212. arXiv:1711.06897. Bibcode:2017arXiv171106897Z. (англ.)
- Lin, Tsung-Yi (2020). Focal Loss for Dense Object Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence. 42 (2): 318—327. arXiv:1708.02002. Bibcode:2017arXiv170802002L. doi:10.1109/TPAMI.2018.2858826. PMID 30040631. S2CID 47252984. (англ.)
- Zhu, Xizhou (2018). Deformable ConvNets v2: More Deformable, Better Results. arXiv:1811.11168 [cs.CV]. (англ.)
- Dai, Jifeng (2017). Deformable Convolutional Networks. arXiv:1703.06211 [cs.CV]. (англ.)
- . Vision.eecs.ucf.edu. Архів оригіналу за 14 липня 2013. Процитовано 9 жовтня 2013. (англ.)
- . Vision.ee.ethz.ch. Архів оригіналу за 3 червня 2013. Процитовано 9 жовтня 2013. (англ.)
Посилання
- (англ.)
- Spatio-temporal action localization (англ.)
- Video object detection and co-segmentation (англ.)
В іншому мовному розділі є повніша стаття 物体検出(яп.). Ви можете допомогти, розширивши поточну статтю за допомогою з японської.
|
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Viyavlya nnya ob ye ktiv angl object detection ce komp yuterna tehnologiya pov yazana z komp yuternim bachennyam ta obrobkoyu zobrazhen yaka maye spravu z viyavlyannyam primirnikiv semantichnih ob yektiv pevnogo klasu takih yak lyudi budivli chi avtomobili u cifrovih zobrazhennyah ta video Do dobre doslidzhenih oblastej viyavlyannya ob yektiv nalezhat viyavlyannya oblich ta en Viyavlyannya ob yektiv maye zastosuvannya u bagatoh sferah komp yuternogo bachennya vklyuchno z en ta videosposterezhennyam Ob yekti viyavleni za dopomogoyu modulya Deep Neural Network dnn OpenCV za dopomogoyu modeli YOLOv3 natrenovanoyi na nabori danih COCO zdatnomu viyavlyati ob yekti 80 zagalnih klasiv VikoristannyaViyavlyannya ob yektiv na dorozi Jogo shiroko vikoristovuyut u zadachah komp yuternogo bachennya takih yak en pidrahunok transportnih zasobiv en viyavlyannya oblich rozpiznavannya oblich en Jogo takozh vikoristovuyut u vidstezhuvanni ob yektiv napriklad vidstezhuvanni m yacha pid chas futbolnogo matchu vidstezhuvanni ruhu biti dlya kriketu abo vidstezhuvanni osobi na video KoncepciyaKozhen klas ob yektiv maye svoyi oznaki yaki dopomagayut u jogo klasifikuvanni napriklad usi kola krugli Viyavlyannya klasu ob yektiv vikoristovuye ci osoblivi oznaki Napriklad pri poshuku kil shukayut ob yekti sho perebuvayut na pevnij vidstani vid yakoyis tochki tobto centru Podibnim chinom pri poshuku kvadrativ potribni ob yekti yaki mayut perpendikulyarni kuti ta mayut odnakovu dovzhinu storin Podibnij pidhid vikoristovuyut dlya vstanovlyuvannya oblich de mozhlivo znahoditi ochi nis i gubi a takozh taki oznaki yak kolir shkiri ta vidstan mizh ochima MetodiPorivnyannya shvidkosti ta tochnosti riznih viyavlyachiv na nabori danih Microsoft COCO testdev https cocodataset org usi znachennya zi statej https arxiv org avtoriv cih algoritmiv Metodi viyavlyannya ob yektiv zazvichaj nalezhat abo do nejromerezhnih abo do nenejronnih pidhodiv Dlya nenejronnih pidhodiv staye neobhidnim spochatku viznachiti oznaki za dopomogoyu odnogo z navedenih nizhche metodiv a potim vikoristovuvati metod takij yak opornovektorni mashini OVM angl SVM shobi zdijsnyuvati klasifikuvannya Z inshogo boku nejronni metodiki zdatni zdijsnyuvati naskrizne viyavlyannya ob yektiv bez specialnogo viznachennya oznak i zazvichaj gruntuyutsya na zgortkovih nejronnih merezhah ZNM angl CNN Nenejronni pidhodi Sistema Violi Dzhonsa viyavlyannya ob yektiv na osnovi gaarovih oznak Masshtaboinvariantne oznakove peretvorennya MIOP angl SIFT Oznaki gistogram napryamlenih gradiyentiv GNG angl HOG Nejromerezhni pidhodi en O ZNM angl R CNN Fast R CNN Faster R CNN kaskadna O ZNM Odnohodovij bagatoramkovij viyavlyach OKV angl Single Shot MultiBox Detector SSD You Only Look Once YOLO ukr vi divitesya lishe raz Odnohodova utochnyuvalna nejronna merezha dlya viyavlyannya ob yektiv angl Single Shot Refinement Neural Network for Object Detection RefineDet Retina Net Deformovni zgortkovi merezhi angl deformable convolutional networks Div takozhViyavlyannya oznak komp yuterne bachennya en en en Algoritm Teknomo FernandesaPrimitkiDasiopoulou Stamatia et al Knowledge assisted semantic video object detection IEEE Transactions on Circuits and Systems for Video Technology 15 10 2005 1210 1224 angl Ling Guan Yifeng He Sun Yuan Kung 1 bereznya 2012 Multimedia Image and Video Processing CRC Press s 331 ISBN 978 1 4398 3087 1 angl Alsanabani Ala Ahmed Mohammed AL Smadi Ahmad 2020 Vehicle Counting Using Detecting Tracking Combinations A Comparative Analysis 2020 the 4th International Conference on Video and Image Processing s 48 54 doi 10 1145 3447450 3447458 ISBN 9781450389075 S2CID 233194604 angl Wu Jianxin et al A scalable approach to activity recognition based on object use 2007 IEEE 11th international conference on computer vision IEEE 2007 angl Bochkovskiy Alexey 2020 Yolov4 Optimal Speed and Accuracy of Object Detection arXiv 2004 10934 cs CV angl Dalal Navneet 2005 Histograms of oriented gradients for human detection PDF Computer Vision and Pattern Recognition 1 angl Ross Girshick 2014 Rich feature hierarchies for accurate object detection and semantic segmentation PDF Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition IEEE s 580 587 arXiv 1311 2524 doi 10 1109 CVPR 2014 81 ISBN 978 1 4799 5118 5 S2CID 215827080 angl Girschick Ross 2015 Fast R CNN PDF Proceedings of the IEEE International Conference on Computer Vision s 1440 1448 arXiv 1504 08083 Bibcode 2015arXiv150408083G angl Shaoqing Ren 2015 Faster R CNN Advances in Neural Information Processing Systems arXiv 1506 01497 angl Pang Jiangmiao Chen Kai Shi Jianping Feng Huajun Ouyang Wanli Lin Dahua 4 kvitnya 2019 Libra R CNN Towards Balanced Learning for Object Detection arXiv 1904 02701v1 cs CV angl Liu Wei October 2016 SSD Single shot multibox detector Computer Vision ECCV 2016 Lecture Notes in Computer Science T 9905 s 21 37 arXiv 1512 02325 doi 10 1007 978 3 319 46448 0 2 ISBN 978 3 319 46447 3 S2CID 2141740 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Proignorovano journal dovidka angl Redmon Joseph 2016 You only look once Unified real time object detection Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition arXiv 1506 02640 Bibcode 2015arXiv150602640R angl Redmon Joseph 2017 YOLO9000 better faster stronger arXiv 1612 08242 cs CV angl Redmon Joseph 2018 Yolov3 An incremental improvement arXiv 1804 02767 cs CV angl Wang Chien Yao 2021 Scaled YOLOv4 Scaling Cross Stage Partial Network Proceedings of the IEEE CVF Conference on Computer Vision and Pattern Recognition CVPR arXiv 2011 08036 Bibcode 2020arXiv201108036W angl Zhang Shifeng 2018 Single Shot Refinement Neural Network for Object Detection Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition s 4203 4212 arXiv 1711 06897 Bibcode 2017arXiv171106897Z angl Lin Tsung Yi 2020 Focal Loss for Dense Object Detection IEEE Transactions on Pattern Analysis and Machine Intelligence 42 2 318 327 arXiv 1708 02002 Bibcode 2017arXiv170802002L doi 10 1109 TPAMI 2018 2858826 PMID 30040631 S2CID 47252984 angl Zhu Xizhou 2018 Deformable ConvNets v2 More Deformable Better Results arXiv 1811 11168 cs CV angl Dai Jifeng 2017 Deformable Convolutional Networks arXiv 1703 06211 cs CV angl Vision eecs ucf edu Arhiv originalu za 14 lipnya 2013 Procitovano 9 zhovtnya 2013 angl Vision ee ethz ch Arhiv originalu za 3 chervnya 2013 Procitovano 9 zhovtnya 2013 angl Posilannya angl Spatio temporal action localization angl Video object detection and co segmentation angl V inshomu movnomu rozdili ye povnisha stattya 物体検出 yap Vi mozhete dopomogti rozshirivshi potochnu stattyu za dopomogoyu perekladu z yaponskoyi Divitis avtoperekladenu versiyu statti z movi yaponska Perekladach povinen rozumiti sho vidpovidalnist za kincevij vmist statti u Vikipediyi nese same avtor redaguvan Onlajn pereklad nadayetsya lishe yak korisnij instrument pereglyadu vmistu zrozumiloyu movoyu Ne vikoristovujte nevichitanij i nevidkorigovanij mashinnij pereklad u stattyah ukrayinskoyi Vikipediyi Mashinnij pereklad Google ye korisnoyu vidpravnoyu tochkoyu dlya perekladu ale perekladacham neobhidno vipravlyati pomilki ta pidtverdzhuvati tochnist perekladu a ne prosto skopiyuvati mashinnij pereklad do ukrayinskoyi Vikipediyi Ne perekladajte tekst yakij vidayetsya nedostovirnim abo neyakisnim Yaksho mozhlivo perevirte tekst za posilannyami podanimi v inshomovnij statti Dokladni rekomendaciyi div Vikipediya Pereklad