Пірамі́да або пірамі́дне подання́ (англ. pyramid, pyramid representation) — це один з типів багатомасштабного подання сигналу, розроблений спільнотами комп'ютерного бачення, обробки зображень та обробки сигналів, у якому сигнал або зображення підлягає багаторазовому [en] та субдискретизації. Пірамідне подання є попередником масштабопросторового подання та [en].
Породження піраміди
Існує два основні типи пірамід: низькочастотні (англ. lowpass) та смугові (англ. bandpass).
Низькочастотну піраміду створюють згладжуванням зображення відповідним згладжувальним фільтром із наступною субдискретизацією згладженого зображення, зазвичай удвічі вздовж кожного з координатних напрямів. Потім отримане зображення піддають тій же процедурі, й повторюють цей цикл декілька разів. Кожна ітерація цього процесу видає зображення меншого розміру з підвищеним згладжуванням, але зі зниженою густиною просторової вибірки (тобто зменшеною роздільністю зображення). Якщо проілюструвати це графічно, то все багатомасштабне подання виглядатиме як піраміда з первинним зображенням внизу й меншими зображеннями результатів кожної з ітерацій, складеними одне на одне.
Смугову піраміду створюють формуванням різниці між зображеннями на суміжних рівнях піраміди й виконанням інтерполювання зображення між суміжними рівнями роздільності, щоб уможливити обчислення попіксельних різниць.
Ядра породження пірамід
Для породження пірамід було запропоновано багато різних ядер згладжування. Серед запропонованих, біноміальні ядра (англ. binomial kernels), що виникають з біноміальних коефіцієнтів, виділяють як особливо корисний і теоретично добре обґрунтований клас. Таким чином, маючи двовимірне зображення, ми можемо застосовувати (нормований) біноміальний фільтр (1/4, 1/2, 1/4), зазвичай двічі або більше вздовж кожного просторового виміру, а потім субдискретизувати зображення з коефіцієнтом два. Потім цю операцію можна виконувати скільки завгодно разів, отримуючи в результаті компактне та ефективне багатомасштабне подання. Якщо на це є конкретні вимоги, також можна створювати проміжні рівні масштабу, де етап субдискретизації іноді пропускають, що дає наддискретизовану (англ. oversampled) або гібридну піраміду (англ. hybrid pyramid). Зі збільшенням обчислювальної ефективності доступних сьогодні процесорів у деяких ситуаціях також можливо використовувати як ядра згладжування на етапах породження піраміди ширше підтримувані гауссові фільтри.
Гауссова піраміда
У гауссовій піраміді (англ. Gaussian pyramid) послідовні зображення зважують за допомогою гауссового усереднювання (гауссового розмиття) і зменшують. Кожен піксель, що містить локальне усереднення, відповідає окільному пікселю на нижчому рівні піраміди. Цю методику використовують зокрема в [en].
Лапласова піраміда
Лапласова піраміда (англ. Laplacian pyramid) дуже схожа на гауссову, але зберігає зображення різниць розмитих версій між кожними рівнями. Лише найменший рівень не є різницевим зображенням, щоб уможливити відтворення зображення високої роздільності за допомогою різницевих зображень на вищих рівнях. Цю методику можливо використовувати для стискання зображень.
Керована піраміда
Керована піраміда, розроблена [en] та іншими, — це втілення багатомасштабного, багатонапрямового банку смугових фільтрів, який використовують для таких застосувань як стискання зображень, [en], та [en]. Її можливо розглядати як напрямово вибірковий варіант лапласової піраміди, у якій на кожному її рівні використовують банк керованих фільтрів замість одного лапласового чи гауссового фільтра.
Застосування пірамід
Альтернативне подання
У ранні часи комп'ютерного бачення піраміди використовували як основний тип багатомасштабного подання для обчислення багатомасштабних ознак зображень із даних зображень реального світу. До новіших методик належить масштабопросторове подання, що було популярним серед деяких дослідників завдяки його теоретичній основі, здатності відокремлювати етап субдискретизації від багатомасштабного подання, потужнішим інструментам для теоретичного аналізу, а також здатності до обчислення подання в будь-якому бажаному масштабі, з униканням таким чином алгоритмічних проблем зв'язку подань зображень з різною роздільністю. Тим не менше, піраміди все ще часто використовують для вираження обчислювально ефективних наближень масштабопросторового подання.
Маніпулювання детальністю
Рівні лапласової піраміди можливо додавати до первинного зображення або вилучати з нього, щоби посилювати або ослаблювати детальність на різних масштабах. Проте відомо, що маніпулювання детальністю такого вигляду в багатьох випадках створює артефакти гало, що веде до розробки альтернатив, таких як білатеральний фільтр.
Деякі формати файлів стискання зображень використовують [en] або іншу методику [en]. Їх можливо розглядати як своєрідну піраміду зображення. Оскільки ці формати файлів зберігають з початку файлу «великомасштабні» ознаки, з тонкими деталями далі файлом, певний переглядач, який відображує маленьку «мініатюру» або на маленькому екрані, може швидко завантажити рівно стільки зображення, щоби відобразити його в доступні пікселі, щоб один файл міг підтримувати багато роздільностей перегляду, замість того, щоб зберігати або породжувати окремий файл для кожної роздільності.
Див. також
Примітки
- E.H. Andelson and C.H. Anderson and J.R. Bergen and P.J. Burt and J.M. Ogden. "Pyramid methods in image processing". 1984. (англ.)
- Burt, P. J. Fast filter transform for image processing. Computer Graphics and Image Processing. 16: 20—51. doi:10.1016/0146-664X(81)90092-7.
{{}}
: Проігноровано невідомий параметр|dfate=
() (англ.) - Crowley, James L. (November 1981). A representation for visual information. Carnegie-Mellon University, Robotics Institute. tech. report CMU-RI-TR-82-07. (англ.)
- Burt, Peter; Adelson, Ted (1983). The Laplacian Pyramid as a Compact Image Code (PDF). IEEE Trans. Commun. 9 (4): 532—540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851. (англ.)
- Crowley, J. L.; (March 1984). A representation for shape based on peaks and ridges in the difference of low-pass transform. IEEE Transactions on Pattern Analysis and Machine Intelligence. 6 (2): 156—170. CiteSeerX 10.1.1.161.3102. doi:10.1109/TPAMI.1984.4767500. PMID 21869180. S2CID 14348919. (англ.)
- Crowley, J. L.; Sanderson, A. C. (1987). Multiple resolution representation and probabilistic matching of 2-D gray-scale shape (PDF). IEEE Transactions on Pattern Analysis and Machine Intelligence. 9 (1): 113—121. CiteSeerX 10.1.1.1015.9294. doi:10.1109/tpami.1987.4767876. PMID 21869381. S2CID 14999508. (англ.)
- Meer, P.; Baugher, E. S.; Rosenfeld, A. (1987). Frequency domain analysis and synthesis of image generating kernels. IEEE Transactions on Pattern Analysis and Machine Intelligence. 9 (4): 512—522. doi:10.1109/tpami.1987.4767939. PMID 21869409. S2CID 5978760. (англ.)
- Lindeberg, Tony, "Scale-space for discrete signals," PAMI(12), No. 3, March 1990, pp. 234-254. (англ.)
- Lindeberg, Tony. Scale-Space Theory in Computer Vision, Kluwer Academic Publishers, 1994, (див. конкретно огляд гауссових та лапласових пірамід у розділі 2 та теорію про узагальнені біноміальні ядра та дискретні гауссові ядра в розділі 3) (англ.)
- Lindeberg, T. and Bretzner, L. Real-time scale selection in hybrid multi-scale representations, Proc. Scale-Space'03, Isle of Skye, Scotland, Springer Lecture Notes in Computer Science, volume 2695, pages 148-163, 2003. (англ.)
- Див. дуже стислий теоретичний виклад у статті про багатомасштабні підходи
- Burt, Peter J.; Adelson, Edward H. (1983). The Laplacian Pyramid as a Compact Image Code (PDF). IEEE Transactions on Communications. 31 (4): 532—540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851. (англ.)
- Simoncelli, Eero. The Steerable Pyramid. cns.nyu.edu. (англ.)
- Manduchi, Roberto; Perona, Pietro; Shy, Doug (1997). (PDF). California Institute of Technology/University of Padua. Архів оригіналу (PDF) за 12 листопада 2021. Процитовано 6 жовтня 2022.
Також у Manduchi, R.; Perona, P.; Shy, D. (1998). Efficient Deformable Filter Banks. Transactions on Signal Processing. 46 (4): 1168—1173. Bibcode:1998ITSP...46.1168M. CiteSeerX 10.1.1.5.3102. doi:10.1109/78.668570. (англ.) - Stanley A. Klein ; Thom Carney ; Lauren Barghout-Stein and Christopher W. Tyler "Seven models of masking", Proc. SPIE 3016, Human Vision and Electronic Imaging II, 13 (June 3, 1997); DOI:10.1117/12.274510 (англ.)
- Crowley, J, Riff O. Fast computation of scale normalised Gaussian receptive fields, Proc. Scale-Space'03, Isle of Skye, Scotland, Springer [en], volume 2695, 2003. (англ.)
- Lowe, D. G. (2004). Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision. 60 (2): 91—110. CiteSeerX 10.1.1.73.2924. doi:10.1023/B:VISI.0000029664.99615.94. S2CID 221242327. (англ.)
Посилання
- Кодування гауссово-лапласової піраміди зображення — ілюструє методи зменшування роздільності, [en], та гауссової згортки (англ.)
- Гауссова піраміда — містить коротке введення до цієї процедури та цитує декілька джерел (англ.)
- Лапласова неоднорідна графова піраміда — рисунок 1 на цій сторінці ілюструє приклад гауссової піраміди (англ.)
- Лапласова піраміда як компактний код зображення (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Pirami da abo pirami dne podannya angl pyramid pyramid representation ce odin z tipiv bagatomasshtabnogo podannya signalu rozroblenij spilnotami komp yuternogo bachennya obrobki zobrazhen ta obrobki signaliv u yakomu signal abo zobrazhennya pidlyagaye bagatorazovomu en ta subdiskretizaciyi Piramidne podannya ye poperednikom masshtaboprostorovogo podannya ta en Vizualne podannya piramidi zobrazhennya z 5 rivnyamiPorodzhennya piramidiIsnuye dva osnovni tipi piramid nizkochastotni angl lowpass ta smugovi angl bandpass Nizkochastotnu piramidu stvoryuyut zgladzhuvannyam zobrazhennya vidpovidnim zgladzhuvalnim filtrom iz nastupnoyu subdiskretizaciyeyu zgladzhenogo zobrazhennya zazvichaj udvichi vzdovzh kozhnogo z koordinatnih napryamiv Potim otrimane zobrazhennya piddayut tij zhe proceduri j povtoryuyut cej cikl dekilka raziv Kozhna iteraciya cogo procesu vidaye zobrazhennya menshogo rozmiru z pidvishenim zgladzhuvannyam ale zi znizhenoyu gustinoyu prostorovoyi vibirki tobto zmenshenoyu rozdilnistyu zobrazhennya Yaksho proilyustruvati ce grafichno to vse bagatomasshtabne podannya viglyadatime yak piramida z pervinnim zobrazhennyam vnizu j menshimi zobrazhennyami rezultativ kozhnoyi z iteracij skladenimi odne na odne Smugovu piramidu stvoryuyut formuvannyam riznici mizh zobrazhennyami na sumizhnih rivnyah piramidi j vikonannyam interpolyuvannya zobrazhennya mizh sumizhnimi rivnyami rozdilnosti shob umozhliviti obchislennya popikselnih riznic Yadra porodzhennya piramidDlya porodzhennya piramid bulo zaproponovano bagato riznih yader zgladzhuvannya Sered zaproponovanih binomialni yadra angl binomial kernels sho vinikayut z binomialnih koeficiyentiv vidilyayut yak osoblivo korisnij i teoretichno dobre obgruntovanij klas Takim chinom mayuchi dvovimirne zobrazhennya mi mozhemo zastosovuvati normovanij binomialnij filtr 1 4 1 2 1 4 zazvichaj dvichi abo bilshe vzdovzh kozhnogo prostorovogo vimiru a potim subdiskretizuvati zobrazhennya z koeficiyentom dva Potim cyu operaciyu mozhna vikonuvati skilki zavgodno raziv otrimuyuchi v rezultati kompaktne ta efektivne bagatomasshtabne podannya Yaksho na ce ye konkretni vimogi takozh mozhna stvoryuvati promizhni rivni masshtabu de etap subdiskretizaciyi inodi propuskayut sho daye naddiskretizovanu angl oversampled abo gibridnu piramidu angl hybrid pyramid Zi zbilshennyam obchislyuvalnoyi efektivnosti dostupnih sogodni procesoriv u deyakih situaciyah takozh mozhlivo vikoristovuvati yak yadra zgladzhuvannya na etapah porodzhennya piramidi shirshe pidtrimuvani gaussovi filtri Gaussova piramida U gaussovij piramidi angl Gaussian pyramid poslidovni zobrazhennya zvazhuyut za dopomogoyu gaussovogo userednyuvannya gaussovogo rozmittya i zmenshuyut Kozhen piksel sho mistit lokalne userednennya vidpovidaye okilnomu pikselyu na nizhchomu rivni piramidi Cyu metodiku vikoristovuyut zokrema v en Laplasova piramida Laplasova piramida angl Laplacian pyramid duzhe shozha na gaussovu ale zberigaye zobrazhennya riznic rozmitih versij mizh kozhnimi rivnyami Lishe najmenshij riven ne ye riznicevim zobrazhennyam shob umozhliviti vidtvorennya zobrazhennya visokoyi rozdilnosti za dopomogoyu riznicevih zobrazhen na vishih rivnyah Cyu metodiku mozhlivo vikoristovuvati dlya stiskannya zobrazhen Kerovana piramida Kerovana piramida rozroblena en ta inshimi ce vtilennya bagatomasshtabnogo bagatonapryamovogo banku smugovih filtriv yakij vikoristovuyut dlya takih zastosuvan yak stiskannya zobrazhen en ta en Yiyi mozhlivo rozglyadati yak napryamovo vibirkovij variant laplasovoyi piramidi u yakij na kozhnomu yiyi rivni vikoristovuyut bank kerovanih filtriv zamist odnogo laplasovogo chi gaussovogo filtra Zastosuvannya piramidAlternativne podannya U ranni chasi komp yuternogo bachennya piramidi vikoristovuvali yak osnovnij tip bagatomasshtabnogo podannya dlya obchislennya bagatomasshtabnih oznak zobrazhen iz danih zobrazhen realnogo svitu Do novishih metodik nalezhit masshtaboprostorove podannya sho bulo populyarnim sered deyakih doslidnikiv zavdyaki jogo teoretichnij osnovi zdatnosti vidokremlyuvati etap subdiskretizaciyi vid bagatomasshtabnogo podannya potuzhnishim instrumentam dlya teoretichnogo analizu a takozh zdatnosti do obchislennya podannya v bud yakomu bazhanomu masshtabi z unikannyam takim chinom algoritmichnih problem zv yazku podan zobrazhen z riznoyu rozdilnistyu Tim ne menshe piramidi vse she chasto vikoristovuyut dlya virazhennya obchislyuvalno efektivnih nablizhen masshtaboprostorovogo podannya Manipulyuvannya detalnistyu Rivni laplasovoyi piramidi mozhlivo dodavati do pervinnogo zobrazhennya abo viluchati z nogo shobi posilyuvati abo oslablyuvati detalnist na riznih masshtabah Prote vidomo sho manipulyuvannya detalnistyu takogo viglyadu v bagatoh vipadkah stvoryuye artefakti galo sho vede do rozrobki alternativ takih yak bilateralnij filtr Deyaki formati fajliv stiskannya zobrazhen vikoristovuyut en abo inshu metodiku en Yih mozhlivo rozglyadati yak svoyeridnu piramidu zobrazhennya Oskilki ci formati fajliv zberigayut z pochatku fajlu velikomasshtabni oznaki z tonkimi detalyami dali fajlom pevnij pereglyadach yakij vidobrazhuye malenku miniatyuru abo na malenkomu ekrani mozhe shvidko zavantazhiti rivno stilki zobrazhennya shobi vidobraziti jogo v dostupni pikseli shob odin fajl mig pidtrimuvati bagato rozdilnostej pereglyadu zamist togo shob zberigati abo porodzhuvati okremij fajl dlya kozhnoyi rozdilnosti Div takozhMIP teksturuvannya Vtilennya prostoru masshtabiv Riven detalizaciyi JPEG 2000PrimitkiE H Andelson and C H Anderson and J R Bergen and P J Burt and J M Ogden Pyramid methods in image processing 1984 angl Burt P J Fast filter transform for image processing Computer Graphics and Image Processing 16 20 51 doi 10 1016 0146 664X 81 90092 7 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite journal title Shablon Cite journal cite journal a Proignorovano nevidomij parametr dfate dovidka angl Crowley James L November 1981 A representation for visual information Carnegie Mellon University Robotics Institute tech report CMU RI TR 82 07 angl Burt Peter Adelson Ted 1983 The Laplacian Pyramid as a Compact Image Code PDF IEEE Trans Commun 9 4 532 540 CiteSeerX 10 1 1 54 299 doi 10 1109 TCOM 1983 1095851 angl Crowley J L March 1984 A representation for shape based on peaks and ridges in the difference of low pass transform IEEE Transactions on Pattern Analysis and Machine Intelligence 6 2 156 170 CiteSeerX 10 1 1 161 3102 doi 10 1109 TPAMI 1984 4767500 PMID 21869180 S2CID 14348919 angl Crowley J L Sanderson A C 1987 Multiple resolution representation and probabilistic matching of 2 D gray scale shape PDF IEEE Transactions on Pattern Analysis and Machine Intelligence 9 1 113 121 CiteSeerX 10 1 1 1015 9294 doi 10 1109 tpami 1987 4767876 PMID 21869381 S2CID 14999508 angl Meer P Baugher E S Rosenfeld A 1987 Frequency domain analysis and synthesis of image generating kernels IEEE Transactions on Pattern Analysis and Machine Intelligence 9 4 512 522 doi 10 1109 tpami 1987 4767939 PMID 21869409 S2CID 5978760 angl Lindeberg Tony Scale space for discrete signals PAMI 12 No 3 March 1990 pp 234 254 angl Lindeberg Tony Scale Space Theory in Computer Vision Kluwer Academic Publishers 1994 ISBN 0 7923 9418 6 div konkretno oglyad gaussovih ta laplasovih piramid u rozdili 2 ta teoriyu pro uzagalneni binomialni yadra ta diskretni gaussovi yadra v rozdili 3 angl Lindeberg T and Bretzner L Real time scale selection in hybrid multi scale representations Proc Scale Space 03 Isle of Skye Scotland Springer Lecture Notes in Computer Science volume 2695 pages 148 163 2003 angl Div duzhe stislij teoretichnij viklad u statti pro bagatomasshtabni pidhodi Burt Peter J Adelson Edward H 1983 The Laplacian Pyramid as a Compact Image Code PDF IEEE Transactions on Communications 31 4 532 540 CiteSeerX 10 1 1 54 299 doi 10 1109 TCOM 1983 1095851 angl Simoncelli Eero The Steerable Pyramid cns nyu edu angl Manduchi Roberto Perona Pietro Shy Doug 1997 PDF California Institute of Technology University of Padua Arhiv originalu PDF za 12 listopada 2021 Procitovano 6 zhovtnya 2022 Takozh u Manduchi R Perona P Shy D 1998 Efficient Deformable Filter Banks Transactions on Signal Processing 46 4 1168 1173 Bibcode 1998ITSP 46 1168M CiteSeerX 10 1 1 5 3102 doi 10 1109 78 668570 angl Stanley A Klein Thom Carney Lauren Barghout Stein and Christopher W Tyler Seven models of masking Proc SPIE 3016 Human Vision and Electronic Imaging II 13 June 3 1997 DOI 10 1117 12 274510 angl Crowley J Riff O Fast computation of scale normalised Gaussian receptive fields Proc Scale Space 03 Isle of Skye Scotland Springer en volume 2695 2003 angl Lowe D G 2004 Distinctive image features from scale invariant keypoints International Journal of Computer Vision 60 2 91 110 CiteSeerX 10 1 1 73 2924 doi 10 1023 B VISI 0000029664 99615 94 S2CID 221242327 angl PosilannyaKoduvannya gaussovo laplasovoyi piramidi zobrazhennya ilyustruye metodi zmenshuvannya rozdilnosti en ta gaussovoyi zgortki angl Gaussova piramida mistit korotke vvedennya do ciyeyi proceduri ta cituye dekilka dzherel angl Laplasova neodnoridna grafova piramida risunok 1 na cij storinci ilyustruye priklad gaussovoyi piramidi angl Laplasova piramida yak kompaktnij kod zobrazhennya angl