SSIM — це модель, заснована на сприйнятті, яка розглядає погіршення зображення як сприйняту зміну структурної інформації, а також включає важливі явища сприйняття, включаючи як маскування яскравості, так і терміни маскування контрасту. Відмінність від інших методів, таких як середньоквадратична похибка (англ. MSE) або PSNR (англ. peak signal-to-noise ratio), полягає в тому, що ці підходи оцінюють абсолютні похибки. Структурна інформація — це ідея, що пікселі мають сильні взаємозалежності, особливо коли вони просторово близькі. Ці залежності несуть важливу інформацію про структуру об'єктів у візуальній сцені. Маскування яскравості — це явище, при якому спотворення зображення (у цьому контексті) мають тенденцію бути менш помітними в яскравих областях, тоді як контрастне маскування — це явище, при якому спотворення стають менш помітними там, де є значна активність або «текстура» зображення.
Історія
Попередник SSIM називався Universal Quality Index (UQI) або Wang-Bovik Index, який був розроблений Чжоу Вангом та [en] у 2001 році. Завдяки співпраці з Хамідом Шейхом та [en] це переросло в поточну версію SSIM, яка була опублікована в квітні 2004 року в [en]. На додаток до визначення індексу якості SSIM, стаття надає загальний контекст для розробки та оцінки показників якості сприйняття, включаючи зв'язки з людською візуальною нейробіологією та сприйняттям, а також пряму перевірку індексу щодо оцінок людини.
Основна модель була розроблена в Лабораторії інженерії зображень і відео (англ. Laboratory for Image and Video Engineering, LIVE) Техаського університету в Остіні та в подальшому розроблена спільно з Лабораторією обчислювального зору (англ. Laboratory for Computational Vision, LCV) Нью-Йоркського університету. Подальші варіанти моделі були розроблені в Лабораторії зображень і візуальних обчислень в університеті Ватерлоо і були комерційно продані.
Згодом SSIM знайшов широке поширення в спільноті обробки зображень, а також у телевізійній індустрії та в соціальних мережах. Стаття SSIM 2004 року була процитована понад 20 000 разів за даними Google Scholar, що робить її однією з найбільш цитованих робіт у сферах обробки зображень та відеоінженерії. Він був удостоєний нагороди [en] Best Paper Award у 2009 році. Він також отримав нагороду [en] Sustained Impact Award за 2016 рік, що свідчить про надзвичайно високий вплив статті протягом принаймні 10 років після її публікації. Через його високе поширення в телевізійній індустрії, кожен із авторів оригінальної статті SSIM отримав премію [en] у 2015 році від Телевізійної академії.
Алгоритм
Індекс SSIM розраховується для різних вікон зображення. Міра між двома вікнами і загального розміру є:
- середнє значення ;
- середнє значення ;
- дисперсія ;
- дисперсія ;
- коваріантність і ;
- , дві змінні для стабілізації ділення зі слабким знаменником;
- динамічний діапазон значень пікселів (зазвичай це );
- і за замовчуванням.
Компоненти формули
Формула SSIM заснована на трьох порівняльних вимірюваннях між зразками і : яскравість (), контраст
() і структура (). Окремі функції порівняння:крім наведених вище визначень:
Тоді SSIM є зваженою комбінацією цих порівняльних показників:
Якщо взяти ваги рівними 1, то формула буде зведега до наведеного вище виду.
Математичні властивості
SSIM задовольняє тотожності нерозрізнених і властивостей симетрії, але не відповідає нерівності трикутника чи невід'ємності, таким чином, не є функцією відстані. Однак за певних умов SSIM може бути перетворений на нормовану кореневу міру MSE, яка є функцією відстані. Квадрат такої функції не є опуклим, а локально опуклим і квазіопуклим, що робить SSIM можливою метою для оптимізації.
Застосування формули
Щоб оцінити якість зображення, ця формула зазвичай застосовується лише до [en], хоча вона також може застосовуватися до значень кольору (наприклад, RGB) або хроматичних (наприклад, значення [en]). Отриманий індекс SSIM є десятковим значенням від 0 до 1, а значення 1 доступне лише у випадку двох ідентичних наборів даних, отже, вказує на повну структурну схожість. Значення 0 вказує на відсутність структурної подібності. Для зображення він зазвичай розраховується за допомогою ковзного гауссового вікна розміром 11x11 або блокового вікна розміром 8×8. Вікно можна зміщувати піксель за пікселем на зображенні, щоб створити карту якості зображення SSIM. У разі оцінки якості відео автори пропонують використовувати лише підгрупу можливих вікон, щоб зменшити складність розрахунку.
Варіанти
Багатомасштабна SSIM
Більш просунута форма SSIM, яка називається Multiscale SSIM (MS-SSIM), проводиться в декількох масштабах за допомогою процесу кількох етапів підвибірки, що нагадує багатомасштабну обробку в системі раннього бачення. Було показано, що він працює однаково добре або краще, ніж SSIM на різних суб'єктивних базах даних зображень і відео.
Багатокомпонентний SSIM
Трикомпонентний SSIM (3-SSIM) це форма SSIM, яка враховує той факт, що людське око може бачити відмінності точніше на текстурованих або крайових областях, ніж на гладких областях. Отримана метрика розраховується як середнє зважене значення SSIM для трьох категорій областей: країв, текстур і гладких областей. Запропонована зважування становить 0,5 для країв, 0,25 для текстурованих і гладких областей. Автори зазначають, що зважування 1/0/0 (ігноруючи будь-що, крім викривлень країв) призводить до результатів, ближчих до суб'єктивних оцінок. Це говорить про те, що краєві області відіграють домінуючу роль у сприйнятті якості зображення.
Автори 3-SSIM також розширили модель на чотирикомпонентний SSIM (4-SSIM). Типи країв далі поділяються на збережені та змінені ребра за статусом спотворення. Запропонована зважування становить 0,25 для всіх чотирьох компонентів.
Структурна несхожість
Структурна несхожість (DSSIM) може бути отримана з SSIM, хоча вона не є функцією відстані, оскільки нерівність трикутника не обов'язково виконується.
Показники якості відео та тимчасові варіанти
Варто зазначити, що оригінальна версія SSIM була розроблена для вимірювання якості нерухомих зображень. Він не містить жодних параметрів, безпосередньо пов'язаних із тимчасовими ефектами людського сприйняття та людських суджень. Звичайною практикою є обчислення середнього значення SSIM для всіх кадрів у відеопослідовності. Проте було розроблено кілька тимчасових варіантів SSIM.
Комплексний вейвлет SSIM
Складний варіант вейвлет-перетворення SSIM (CW-SSIM) призначений для вирішення проблем масштабування, трансляції та повороту зображення. Замість того, щоб давати низькі оцінки зображенням з такими умовами, CW-SSIM використовує переваги складного вейвлет-перетворення, отже дає вищі оцінки зазначеним зображенням. CW-SSIM визначається наступним чином:Де — це комплексне вейвлет-перетворення сигналу і — комплексне вейвлет-перетворення для сигналу . Крім того, це невелике додатне число, яке використовується для забезпечення стабільності функції. В ідеалі вона повинна бути нульовою. Як і SSIM, CW-SSIM має максимальне значення 1. Максимальне значення 1 вказує на те, що два сигнали абсолютно схожі за структурою, тоді як значення 0 вказує на відсутність структурної подібності.
SSIMPLUS
Індекс SSIMPLUS заснований на SSIM і є комерційно доступним інструментом. Він розширює можливості SSIM, в основному для цільових відеопрограм. Він надає оцінки в діапазоні від 0 до 100, які лінійно відповідають суб'єктивним оцінкам людини. Він також дозволяє адаптувати оцінки до призначеного пристрою для перегляду, порівнюючи відео з різними роздільною здатністю та вмістом.
За словами його авторів, SSIMPLUS досягає більш високої точності та швидкості, ніж інші показники якості зображення та відео. Однак незалежне оцінювання SSIMPLUS не проводилося, оскільки сам алгоритм не є загальнодоступним.
cSSIM
Для подальшого дослідження стандартної дискретної SSIM з теоретичної точки зору було введено та досліджено неперервну SSIM (cSSIM) в контексті [en].
Інші прості модифікації
Метрика взаємної кореляції r* заснована на метриці дисперсії SSIM. Він визначається як r*(x, y) = σxy/σxσy
коли обидва стандартних відхилення дорівнюють нулю, і 0, коли лише один дорівнює нулю. Він знайшов застосування при аналізі реакції людини на фантоми з контрастними деталями.
SSIM також використовувався для градієнта зображень, що робить його «G-SSIM». G-SSIM особливо корисний для розмитих зображень.
Наведені вище модифікації можна комбінувати. Наприклад, 4-Gr* є комбінацією 4-SSIM, G-SSIM і r*. Він здатний відображати переваги рентгенологів до зображень набагато краще, ніж інші протестовані варіанти SSIM.
Застосування
SSIM має програми для вирішення різноманітних проблем. Деякі приклади:
- Стиснення зображення: під час стиснення зображень із втратами інформація навмисно відкидається, щоб зменшити простір для зберігання зображень і відео. MSE зазвичай використовується в таких схемах стиснення. За словами його авторів, використання SSIM замість MSE пропонується для отримання кращих результатів для розпакованих зображень.
- Відновлення зображення: відновлення зображення фокусується на вирішенні проблеми де є розмитим зображенням, яке слід відновити, це ядро розмиття, є адитивним шумом і це оригінальне зображення, яке ми хочемо відновити. Традиційним фільтром, який використовується для вирішення цієї проблеми, є фільтр Вінера. Однак конструкція фільтра Вінера заснована на MSE. За словами авторів алгоритму, використання варіанту SSIM, зокрема Stat-SSIM, дає кращі візуальні результати.
- Розпізнавання шаблонів: оскільки SSIM імітує аспекти людського сприйняття, його можна використовувати для розпізнавання шаблонів. Коли стикаються з такими проблемами, як масштабування зображення, переклад і поворот, автори алгоритму стверджують, що краще використовувати CW-SSIM, який нечутливий до цих варіацій і може бути безпосередньо застосований шляхом зіставлення шаблонів без використання навчального зразка. Оскільки підходи до розпізнавання шаблонів, керовані даними, можуть забезпечити кращу продуктивність, коли велика кількість даних доступна для навчання, автори пропонують використовувати CW-SSIM в підходах, керованих даними.
Порівняння продуктивності
Через його популярність SSIM часто порівнюють з іншими показниками, включаючи простіші показники, такі як MSE і PSNR, а також інші показники якості зображення та відео, що сприймаються. Неодноразово було показано, що SSIM значно перевершує MSE та його похідні за точністю, включаючи дослідження його власних авторів та інших.
У статті Доссельмана і Янга стверджується, що продуктивність SSIM «набагато ближча до продуктивності MSE», ніж зазвичай припускається. Хоча вони не заперечують переваги SSIM над MSE, вони констатують аналітичну та функціональну залежність між двома показниками. Згідно з їхніми дослідженнями, було виявлено, що SSIM корелює, а також методи на основі MSE для суб'єктивних баз даних, відмінних від баз даних від творців SSIM. Як приклад вони наводять Рейбмана і Пула, які виявили, що MSE випереджає SSIM у базі даних, що містить відео з втратою пакетів. В іншій статті було виявлено аналітичний зв'язок між PSNR та SSIM.
Див. також
Примітки
- Wang, Zhou; Bovik, A.C.; Sheikh, H.R.; Simoncelli, E.P. (1 квітня 2004). Image quality assessment: from error visibility to structural similarity. IEEE Transactions on Image Processing. 13 (4): 600—612. Bibcode:2004ITIP...13..600W. CiteSeerX 10.1.1.2.5689. doi:10.1109/TIP.2003.819861. ISSN 1057-7149. PMID 15376593.
- Google Scholar. scholar.google.com. Процитовано 4 липня 2019.
- IEEE Signal Processing Society, Best Paper Award (PDF).
- Wang, Z.; Simoncelli, E.P.; Bovik, A.C. (1 листопада 2003). Multiscale structural similarity for image quality assessment. Т. 2. с. 1398–1402 Vol.2. doi:10.1109/ACSSC.2003.1292216. ISBN .
{{}}
: Проігноровано|journal=
() - Brunet, D.; Vass, J.; Vrscay, E. R.; Wang, Z. (April 2012). On the mathematical properties of the structural similarity index (PDF). IEEE Transactions on Image Processing. 21 (4): 2324—2328. Bibcode:2012ITIP...21.1488B. doi:10.1109/TIP.2011.2173206. PMID 22042163.
- Wang, Z.; Lu, L.; Bovik, A. C. (February 2004). Video quality assessment based on structural distortion measurement. Signal Processing: Image Communication. 19 (2): 121—132. CiteSeerX 10.1.1.2.6330. doi:10.1016/S0923-5965(03)00076-6.
- Søgaard, Jacob; Krasula, Lukáš; Shahid, Muhammad; Temel, Dogancan; Brunnström, Kjell; Razaak, Manzoor (14 лютого 2016). Applicability of Existing Objective Metrics of Perceptual Quality for Adaptive Video Streaming (PDF). Electronic Imaging. 2016 (13): 1—7. doi:10.2352/issn.2470-1173.2016.13.iqsp-206.
- Dosselmann, Richard; Yang, Xue Dong (6 листопада 2009). A comprehensive assessment of the structural similarity index. Signal, Image and Video Processing. 5 (1): 81—91. doi:10.1007/s11760-009-0144-1. ISSN 1863-1703.
- Li, Chaofeng; Bovik, Alan Conrad (1 січня 2010). Content-weighted video quality assessment using a three-component image model. Journal of Electronic Imaging. 19 (1): 011003–011003–9. Bibcode:2010JEI....19a1003L. doi:10.1117/1.3267087. ISSN 1017-9909.
- Li, Chaofeng; Bovik, Alan C. (August 2010). Content-partitioned structural similarity index for image quality assessment. Signal Processing: Image Communication. 25 (7): 517—526. doi:10.1016/j.image.2010.03.004.
- Redirect page. www.compression.ru.
- Wang, Z.; Li, Q. (December 2007). Video quality assessment using a statistical model of human visual speed perception (PDF). Journal of the Optical Society of America A. 24 (12): B61—B69. Bibcode:2007JOSAA..24...61W. CiteSeerX 10.1.1.113.4177. doi:10.1364/JOSAA.24.000B61. PMID 18059915.
- Zhou Wang; Bovik, A.C. (January 2009). Mean squared error: Love it or leave it? A new look at Signal Fidelity Measures. IEEE Signal Processing Magazine. 26 (1): 98—117. Bibcode:2009ISPM...26...98W. doi:10.1109/msp.2008.930649. ISSN 1053-5888.
- Rehman, A.; Zeng, K.; Wang, Zhou (February 2015). Rogowitz, Bernice E; Pappas, Thrasyvoulos N; De Ridder, Huib (ред.). Display device-adapted video quality-of-experience assessment (PDF). IS&T-SPIE Electronic Imaging, Human Vision and Electronic Imaging XX. Human Vision and Electronic Imaging XX. 9394: 939406. Bibcode:2015SPIE.9394E..06R. doi:10.1117/12.2077917.
- Marchetti, F. (January 2021). Convergence rate in terms of the continuous SSIM (cSSIM) index in RBF interpolation (PDF). Dolom. Res. Notes Approx. 14: 27—32.
- Prieto, Gabriel; Guibelalde, Eduardo; Chevalier, Margarita; Turrero, Agustín (21 липня 2011). Use of the cross-correlation component of the multiscale structural similarity metric (R* metric) for the evaluation of medical images: R* metric for the evaluation of medical images. Medical Physics. 38 (8): 4512—4517. doi:10.1118/1.3605634.
- Chen, Guan-hao; Yang, Chun-ling; Xie, Sheng-li (October 2006). Gradient-Based Structural Similarity for Image Quality Assessment. 2006 International Conference on Image Processing: 2929—2932. doi:10.1109/ICIP.2006.313132.
- Renieblas, Gabriel Prieto; Nogués, Agustín Turrero; González, Alberto Muñoz; Gómez-Leon, Nieves; del Castillo, Eduardo Guibelalde (26 липня 2017). Structural similarity index family for image quality assessment in radiological images. Journal of Medical Imaging. 4 (3): 035501. doi:10.1117/1.JMI.4.3.035501. PMC 5527267. PMID 28924574.
- Gao, Y.; Rehman, A.; Wang, Z. (September 2011). CW-SSIM based image classification (PDF). IEEE International Conference on Image Processing (ICIP11).
- Zhang, Lin; Zhang, Lei; Mou, X.; Zhang, D. (September 2012). A comprehensive evaluation of full reference image quality assessment algorithms. с. 1477—1480. doi:10.1109/icip.2012.6467150. ISBN .
{{}}
: Проігноровано|journal=
() - Zhou Wang; Wang, Zhou; Li, Qiang (May 2011). Information Content Weighting for Perceptual Image Quality Assessment. IEEE Transactions on Image Processing. 20 (5): 1185—1198. Bibcode:2011ITIP...20.1185W. doi:10.1109/tip.2010.2092435. PMID 21078577.
- Channappayya, S. S.; Bovik, A. C.; Caramanis, C.; Heath, R. W. (March 2008). SSIM-optimal linear image restoration. с. 765—768. doi:10.1109/icassp.2008.4517722. ISBN .
{{}}
: Проігноровано|journal=
() - Gore, Akshay; Gupta, Savita (1 лютого 2015). Full reference image quality metrics for JPEG compressed images. AEU - International Journal of Electronics and Communications. 69 (2): 604—608. doi:10.1016/j.aeue.2014.09.002.
- Wang, Z.; Simoncelli, E. P. (September 2008). Maximum differentiation (MAD) competition: a methodology for comparing computational models of perceptual quantities (PDF). Journal of Vision. 8 (12): 8.1—13. doi:10.1167/8.12.8. PMC 4143340. PMID 18831621.
- Reibman, A. R.; Poole, D. (September 2007). Characterizing packet-loss impairments in compressed video. Т. 5. с. V – 77–V – 80. doi:10.1109/icip.2007.4379769. ISBN .
{{}}
: Проігноровано|journal=
() - Hore, A.; Ziou, D. (August 2010). Image Quality Metrics: PSNR vs. SSIM. с. 2366—2369. doi:10.1109/icpr.2010.579. ISBN .
{{}}
: Проігноровано|journal=
()
Посилання
- Домашня сторінка
- Реалізація Rust
- Реалізація C/C++
- Реалізація C# Кріса Ломонта
- Реалізація qpsnr (багатопотоковий C++)
- Реалізація в програмному забезпеченні VQMT
- Реалізація на Python
- «Таємниця вимірювань подібності MSE та SSIM», Гінтаутас Палубінскас, 2014 р.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
SSIM ce model zasnovana na sprijnyatti yaka rozglyadaye pogirshennya zobrazhennya yak sprijnyatu zminu strukturnoyi informaciyi a takozh vklyuchaye vazhlivi yavisha sprijnyattya vklyuchayuchi yak maskuvannya yaskravosti tak i termini maskuvannya kontrastu Vidminnist vid inshih metodiv takih yak serednokvadratichna pohibka angl MSE abo PSNR angl peak signal to noise ratio polyagaye v tomu sho ci pidhodi ocinyuyut absolyutni pohibki Strukturna informaciya ce ideya sho pikseli mayut silni vzayemozalezhnosti osoblivo koli voni prostorovo blizki Ci zalezhnosti nesut vazhlivu informaciyu pro strukturu ob yektiv u vizualnij sceni Maskuvannya yaskravosti ce yavishe pri yakomu spotvorennya zobrazhennya u comu konteksti mayut tendenciyu buti mensh pomitnimi v yaskravih oblastyah todi yak kontrastne maskuvannya ce yavishe pri yakomu spotvorennya stayut mensh pomitnimi tam de ye znachna aktivnist abo tekstura zobrazhennya IstoriyaPoperednik SSIM nazivavsya Universal Quality Index UQI abo Wang Bovik Index yakij buv rozroblenij Chzhou Vangom ta en u 2001 roci Zavdyaki spivpraci z Hamidom Shejhom ta en ce pereroslo v potochnu versiyu SSIM yaka bula opublikovana v kvitni 2004 roku v en Na dodatok do viznachennya indeksu yakosti SSIM stattya nadaye zagalnij kontekst dlya rozrobki ta ocinki pokaznikiv yakosti sprijnyattya vklyuchayuchi zv yazki z lyudskoyu vizualnoyu nejrobiologiyeyu ta sprijnyattyam a takozh pryamu perevirku indeksu shodo ocinok lyudini Osnovna model bula rozroblena v Laboratoriyi inzheneriyi zobrazhen i video angl Laboratory for Image and Video Engineering LIVE Tehaskogo universitetu v Ostini ta v podalshomu rozroblena spilno z Laboratoriyeyu obchislyuvalnogo zoru angl Laboratory for Computational Vision LCV Nyu Jorkskogo universitetu Podalshi varianti modeli buli rozrobleni v Laboratoriyi zobrazhen i vizualnih obchislen v universiteti Vaterloo i buli komercijno prodani Zgodom SSIM znajshov shiroke poshirennya v spilnoti obrobki zobrazhen a takozh u televizijnij industriyi ta v socialnih merezhah Stattya SSIM 2004 roku bula procitovana ponad 20 000 raziv za danimi Google Scholar sho robit yiyi odniyeyu z najbilsh citovanih robit u sferah obrobki zobrazhen ta videoinzheneriyi Vin buv udostoyenij nagorodi en Best Paper Award u 2009 roci Vin takozh otrimav nagorodu en Sustained Impact Award za 2016 rik sho svidchit pro nadzvichajno visokij vpliv statti protyagom prinajmni 10 rokiv pislya yiyi publikaciyi Cherez jogo visoke poshirennya v televizijnij industriyi kozhen iz avtoriv originalnoyi statti SSIM otrimav premiyu en u 2015 roci vid Televizijnoyi akademiyi AlgoritmIndeks SSIM rozrahovuyetsya dlya riznih vikon zobrazhennya Mira mizh dvoma viknami x displaystyle x i y displaystyle y zagalnogo rozmiru N N displaystyle N times N ye SSIM x y 2 m x m y c 1 2 s x y c 2 m x 2 m y 2 c 1 s x 2 s y 2 c 2 displaystyle hbox SSIM x y frac 2 mu x mu y c 1 2 sigma xy c 2 mu x 2 mu y 2 c 1 sigma x 2 sigma y 2 c 2 m x displaystyle mu x serednye znachennya x displaystyle x m y displaystyle mu y serednye znachennya y displaystyle y s x 2 displaystyle sigma x 2 dispersiya x displaystyle x s y 2 displaystyle sigma y 2 dispersiya y displaystyle y s x y displaystyle sigma xy kovariantnist x displaystyle x i y displaystyle y c 1 k 1 L 2 displaystyle c 1 k 1 L 2 c 2 k 2 L 2 displaystyle c 2 k 2 L 2 dvi zminni dlya stabilizaciyi dilennya zi slabkim znamennikom L displaystyle L dinamichnij diapazon znachen pikseliv zazvichaj ce 2 b i t s p e r p i x e l 1 displaystyle 2 bits per pixel 1 k 1 0 01 displaystyle k 1 0 01 i k 2 0 03 displaystyle k 2 0 03 za zamovchuvannyam Komponenti formuli Formula SSIM zasnovana na troh porivnyalnih vimiryuvannyah mizh zrazkami x displaystyle x i y displaystyle y yaskravist l displaystyle l kontrast c displaystyle c i struktura s displaystyle s Okremi funkciyi porivnyannya l x y 2 m x m y c 1 m x 2 m y 2 c 1 displaystyle l x y frac 2 mu x mu y c 1 mu x 2 mu y 2 c 1 c x y 2 s x s y c 2 s x 2 s y 2 c 2 displaystyle c x y frac 2 sigma x sigma y c 2 sigma x 2 sigma y 2 c 2 s x y s x y c 3 s x s y c 3 displaystyle s x y frac sigma xy c 3 sigma x sigma y c 3 krim navedenih vishe viznachen c 3 c 2 2 displaystyle c 3 c 2 2 Todi SSIM ye zvazhenoyu kombinaciyeyu cih porivnyalnih pokaznikiv SSIM x y l x y a c x y b s x y g displaystyle text SSIM x y left l x y alpha cdot c x y beta cdot s x y gamma right Yaksho vzyati vagi a b g displaystyle alpha beta gamma rivnimi 1 to formula bude zvedega do navedenogo vishe vidu Matematichni vlastivosti SSIM zadovolnyaye totozhnosti nerozriznenih i vlastivostej simetriyi ale ne vidpovidaye nerivnosti trikutnika chi nevid yemnosti takim chinom ne ye funkciyeyu vidstani Odnak za pevnih umov SSIM mozhe buti peretvorenij na normovanu korenevu miru MSE yaka ye funkciyeyu vidstani Kvadrat takoyi funkciyi ne ye opuklim a lokalno opuklim i kvaziopuklim sho robit SSIM mozhlivoyu metoyu dlya optimizaciyi Zastosuvannya formuli Shob ociniti yakist zobrazhennya cya formula zazvichaj zastosovuyetsya lishe do en hocha vona takozh mozhe zastosovuvatisya do znachen koloru napriklad RGB abo hromatichnih napriklad znachennya en Otrimanij indeks SSIM ye desyatkovim znachennyam vid 0 do 1 a znachennya 1 dostupne lishe u vipadku dvoh identichnih naboriv danih otzhe vkazuye na povnu strukturnu shozhist Znachennya 0 vkazuye na vidsutnist strukturnoyi podibnosti Dlya zobrazhennya vin zazvichaj rozrahovuyetsya za dopomogoyu kovznogo gaussovogo vikna rozmirom 11x11 abo blokovogo vikna rozmirom 8 8 Vikno mozhna zmishuvati piksel za pikselem na zobrazhenni shob stvoriti kartu yakosti zobrazhennya SSIM U razi ocinki yakosti video avtori proponuyut vikoristovuvati lishe pidgrupu mozhlivih vikon shob zmenshiti skladnist rozrahunku Varianti Bagatomasshtabna SSIM Bilsh prosunuta forma SSIM yaka nazivayetsya Multiscale SSIM MS SSIM provoditsya v dekilkoh masshtabah za dopomogoyu procesu kilkoh etapiv pidvibirki sho nagaduye bagatomasshtabnu obrobku v sistemi rannogo bachennya Bulo pokazano sho vin pracyuye odnakovo dobre abo krashe nizh SSIM na riznih sub yektivnih bazah danih zobrazhen i video Bagatokomponentnij SSIM Trikomponentnij SSIM 3 SSIM ce forma SSIM yaka vrahovuye toj fakt sho lyudske oko mozhe bachiti vidminnosti tochnishe na teksturovanih abo krajovih oblastyah nizh na gladkih oblastyah Otrimana metrika rozrahovuyetsya yak serednye zvazhene znachennya SSIM dlya troh kategorij oblastej krayiv tekstur i gladkih oblastej Zaproponovana zvazhuvannya stanovit 0 5 dlya krayiv 0 25 dlya teksturovanih i gladkih oblastej Avtori zaznachayut sho zvazhuvannya 1 0 0 ignoruyuchi bud sho krim vikrivlen krayiv prizvodit do rezultativ blizhchih do sub yektivnih ocinok Ce govorit pro te sho krayevi oblasti vidigrayut dominuyuchu rol u sprijnyatti yakosti zobrazhennya Avtori 3 SSIM takozh rozshirili model na chotirikomponentnij SSIM 4 SSIM Tipi krayiv dali podilyayutsya na zberezheni ta zmineni rebra za statusom spotvorennya Zaproponovana zvazhuvannya stanovit 0 25 dlya vsih chotiroh komponentiv Strukturna neshozhist Strukturna neshozhist DSSIM mozhe buti otrimana z SSIM hocha vona ne ye funkciyeyu vidstani oskilki nerivnist trikutnika ne obov yazkovo vikonuyetsya DSSIM x y 1 SSIM x y 2 displaystyle hbox DSSIM x y frac 1 hbox SSIM x y 2 Pokazniki yakosti video ta timchasovi varianti Varto zaznachiti sho originalna versiya SSIM bula rozroblena dlya vimiryuvannya yakosti neruhomih zobrazhen Vin ne mistit zhodnih parametriv bezposeredno pov yazanih iz timchasovimi efektami lyudskogo sprijnyattya ta lyudskih sudzhen Zvichajnoyu praktikoyu ye obchislennya serednogo znachennya SSIM dlya vsih kadriv u videoposlidovnosti Prote bulo rozrobleno kilka timchasovih variantiv SSIM Kompleksnij vejvlet SSIM Skladnij variant vejvlet peretvorennya SSIM CW SSIM priznachenij dlya virishennya problem masshtabuvannya translyaciyi ta povorotu zobrazhennya Zamist togo shob davati nizki ocinki zobrazhennyam z takimi umovami CW SSIM vikoristovuye perevagi skladnogo vejvlet peretvorennya otzhe daye vishi ocinki zaznachenim zobrazhennyam CW SSIM viznachayetsya nastupnim chinom CW SSIM c x c y 2 i 1 N c x i c y i K i 1 N c x i 2 i 1 N c y i 2 K 2 i 1 N c x i c y i K 2 i 1 N c x i c y i K displaystyle text CW SSIM c x c y bigg frac 2 sum i 1 N c x i c y i K sum i 1 N c x i 2 sum i 1 N c y i 2 K bigg bigg frac 2 sum i 1 N c x i c y i K 2 sum i 1 N c x i c y i K bigg De c x displaystyle c x ce kompleksne vejvlet peretvorennya signalu x displaystyle x i c y displaystyle c y kompleksne vejvlet peretvorennya dlya signalu y displaystyle y Krim togo K displaystyle K ce nevelike dodatne chislo yake vikoristovuyetsya dlya zabezpechennya stabilnosti funkciyi V ideali vona povinna buti nulovoyu Yak i SSIM CW SSIM maye maksimalne znachennya 1 Maksimalne znachennya 1 vkazuye na te sho dva signali absolyutno shozhi za strukturoyu todi yak znachennya 0 vkazuye na vidsutnist strukturnoyi podibnosti SSIMPLUS Indeks SSIMPLUS zasnovanij na SSIM i ye komercijno dostupnim instrumentom Vin rozshiryuye mozhlivosti SSIM v osnovnomu dlya cilovih videoprogram Vin nadaye ocinki v diapazoni vid 0 do 100 yaki linijno vidpovidayut sub yektivnim ocinkam lyudini Vin takozh dozvolyaye adaptuvati ocinki do priznachenogo pristroyu dlya pereglyadu porivnyuyuchi video z riznimi rozdilnoyu zdatnistyu ta vmistom Za slovami jogo avtoriv SSIMPLUS dosyagaye bilsh visokoyi tochnosti ta shvidkosti nizh inshi pokazniki yakosti zobrazhennya ta video Odnak nezalezhne ocinyuvannya SSIMPLUS ne provodilosya oskilki sam algoritm ne ye zagalnodostupnim cSSIM Dlya podalshogo doslidzhennya standartnoyi diskretnoyi SSIM z teoretichnoyi tochki zoru bulo vvedeno ta doslidzheno neperervnu SSIM cSSIM v konteksti en Inshi prosti modifikaciyi Metrika vzayemnoyi korelyaciyi r zasnovana na metrici dispersiyi SSIM Vin viznachayetsya yak r x y sxy sxsy koli obidva standartnih vidhilennya dorivnyuyut nulyu i 0 koli lishe odin dorivnyuye nulyu Vin znajshov zastosuvannya pri analizi reakciyi lyudini na fantomi z kontrastnimi detalyami SSIM takozh vikoristovuvavsya dlya gradiyenta zobrazhen sho robit jogo G SSIM G SSIM osoblivo korisnij dlya rozmitih zobrazhen Navedeni vishe modifikaciyi mozhna kombinuvati Napriklad 4 Gr ye kombinaciyeyu 4 SSIM G SSIM i r Vin zdatnij vidobrazhati perevagi rentgenologiv do zobrazhen nabagato krashe nizh inshi protestovani varianti SSIM ZastosuvannyaSSIM maye programi dlya virishennya riznomanitnih problem Deyaki prikladi Stisnennya zobrazhennya pid chas stisnennya zobrazhen iz vtratami informaciya navmisno vidkidayetsya shob zmenshiti prostir dlya zberigannya zobrazhen i video MSE zazvichaj vikoristovuyetsya v takih shemah stisnennya Za slovami jogo avtoriv vikoristannya SSIM zamist MSE proponuyetsya dlya otrimannya krashih rezultativ dlya rozpakovanih zobrazhen Vidnovlennya zobrazhennya vidnovlennya zobrazhennya fokusuyetsya na virishenni problemiy h x n displaystyle y h x n de y displaystyle y ye rozmitim zobrazhennyam yake slid vidnoviti h displaystyle h ce yadro rozmittya n displaystyle n ye aditivnim shumom i x displaystyle x ce originalne zobrazhennya yake mi hochemo vidnoviti Tradicijnim filtrom yakij vikoristovuyetsya dlya virishennya ciyeyi problemi ye filtr Vinera Odnak konstrukciya filtra Vinera zasnovana na MSE Za slovami avtoriv algoritmu vikoristannya variantu SSIM zokrema Stat SSIM daye krashi vizualni rezultati Rozpiznavannya shabloniv oskilki SSIM imituye aspekti lyudskogo sprijnyattya jogo mozhna vikoristovuvati dlya rozpiznavannya shabloniv Koli stikayutsya z takimi problemami yak masshtabuvannya zobrazhennya pereklad i povorot avtori algoritmu stverdzhuyut sho krashe vikoristovuvati CW SSIM yakij nechutlivij do cih variacij i mozhe buti bezposeredno zastosovanij shlyahom zistavlennya shabloniv bez vikoristannya navchalnogo zrazka Oskilki pidhodi do rozpiznavannya shabloniv kerovani danimi mozhut zabezpechiti krashu produktivnist koli velika kilkist danih dostupna dlya navchannya avtori proponuyut vikoristovuvati CW SSIM v pidhodah kerovanih danimi Porivnyannya produktivnostiCherez jogo populyarnist SSIM chasto porivnyuyut z inshimi pokaznikami vklyuchayuchi prostishi pokazniki taki yak MSE i PSNR a takozh inshi pokazniki yakosti zobrazhennya ta video sho sprijmayutsya Neodnorazovo bulo pokazano sho SSIM znachno perevershuye MSE ta jogo pohidni za tochnistyu vklyuchayuchi doslidzhennya jogo vlasnih avtoriv ta inshih U statti Dosselmana i Yanga stverdzhuyetsya sho produktivnist SSIM nabagato blizhcha do produktivnosti MSE nizh zazvichaj pripuskayetsya Hocha voni ne zaperechuyut perevagi SSIM nad MSE voni konstatuyut analitichnu ta funkcionalnu zalezhnist mizh dvoma pokaznikami Zgidno z yihnimi doslidzhennyami bulo viyavleno sho SSIM korelyuye a takozh metodi na osnovi MSE dlya sub yektivnih baz danih vidminnih vid baz danih vid tvorciv SSIM Yak priklad voni navodyat Rejbmana i Pula yaki viyavili sho MSE viperedzhaye SSIM u bazi danih sho mistit video z vtratoyu paketiv V inshij statti bulo viyavleno analitichnij zv yazok mizh PSNR ta SSIM Div takozhSerednokvadratichna pohibka Pikove spivvidnoshennya signal shum Yakist videoPrimitkiWang Zhou Bovik A C Sheikh H R Simoncelli E P 1 kvitnya 2004 Image quality assessment from error visibility to structural similarity IEEE Transactions on Image Processing 13 4 600 612 Bibcode 2004ITIP 13 600W CiteSeerX 10 1 1 2 5689 doi 10 1109 TIP 2003 819861 ISSN 1057 7149 PMID 15376593 Google Scholar scholar google com Procitovano 4 lipnya 2019 IEEE Signal Processing Society Best Paper Award PDF Wang Z Simoncelli E P Bovik A C 1 listopada 2003 Multiscale structural similarity for image quality assessment T 2 s 1398 1402 Vol 2 doi 10 1109 ACSSC 2003 1292216 ISBN 978 0 7803 8104 9 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Proignorovano journal dovidka Brunet D Vass J Vrscay E R Wang Z April 2012 On the mathematical properties of the structural similarity index PDF IEEE Transactions on Image Processing 21 4 2324 2328 Bibcode 2012ITIP 21 1488B doi 10 1109 TIP 2011 2173206 PMID 22042163 Wang Z Lu L Bovik A C February 2004 Video quality assessment based on structural distortion measurement Signal Processing Image Communication 19 2 121 132 CiteSeerX 10 1 1 2 6330 doi 10 1016 S0923 5965 03 00076 6 Sogaard Jacob Krasula Lukas Shahid Muhammad Temel Dogancan Brunnstrom Kjell Razaak Manzoor 14 lyutogo 2016 Applicability of Existing Objective Metrics of Perceptual Quality for Adaptive Video Streaming PDF Electronic Imaging 2016 13 1 7 doi 10 2352 issn 2470 1173 2016 13 iqsp 206 Dosselmann Richard Yang Xue Dong 6 listopada 2009 A comprehensive assessment of the structural similarity index Signal Image and Video Processing 5 1 81 91 doi 10 1007 s11760 009 0144 1 ISSN 1863 1703 Li Chaofeng Bovik Alan Conrad 1 sichnya 2010 Content weighted video quality assessment using a three component image model Journal of Electronic Imaging 19 1 011003 011003 9 Bibcode 2010JEI 19a1003L doi 10 1117 1 3267087 ISSN 1017 9909 Li Chaofeng Bovik Alan C August 2010 Content partitioned structural similarity index for image quality assessment Signal Processing Image Communication 25 7 517 526 doi 10 1016 j image 2010 03 004 Redirect page www compression ru Wang Z Li Q December 2007 Video quality assessment using a statistical model of human visual speed perception PDF Journal of the Optical Society of America A 24 12 B61 B69 Bibcode 2007JOSAA 24 61W CiteSeerX 10 1 1 113 4177 doi 10 1364 JOSAA 24 000B61 PMID 18059915 Zhou Wang Bovik A C January 2009 Mean squared error Love it or leave it A new look at Signal Fidelity Measures IEEE Signal Processing Magazine 26 1 98 117 Bibcode 2009ISPM 26 98W doi 10 1109 msp 2008 930649 ISSN 1053 5888 Rehman A Zeng K Wang Zhou February 2015 Rogowitz Bernice E Pappas Thrasyvoulos N De Ridder Huib red Display device adapted video quality of experience assessment PDF IS amp T SPIE Electronic Imaging Human Vision and Electronic Imaging XX Human Vision and Electronic Imaging XX 9394 939406 Bibcode 2015SPIE 9394E 06R doi 10 1117 12 2077917 Marchetti F January 2021 Convergence rate in terms of the continuous SSIM cSSIM index in RBF interpolation PDF Dolom Res Notes Approx 14 27 32 Prieto Gabriel Guibelalde Eduardo Chevalier Margarita Turrero Agustin 21 lipnya 2011 Use of the cross correlation component of the multiscale structural similarity metric R metric for the evaluation of medical images R metric for the evaluation of medical images Medical Physics 38 8 4512 4517 doi 10 1118 1 3605634 Chen Guan hao Yang Chun ling Xie Sheng li October 2006 Gradient Based Structural Similarity for Image Quality Assessment 2006 International Conference on Image Processing 2929 2932 doi 10 1109 ICIP 2006 313132 Renieblas Gabriel Prieto Nogues Agustin Turrero Gonzalez Alberto Munoz Gomez Leon Nieves del Castillo Eduardo Guibelalde 26 lipnya 2017 Structural similarity index family for image quality assessment in radiological images Journal of Medical Imaging 4 3 035501 doi 10 1117 1 JMI 4 3 035501 PMC 5527267 PMID 28924574 Gao Y Rehman A Wang Z September 2011 CW SSIM based image classification PDF IEEE International Conference on Image Processing ICIP11 Zhang Lin Zhang Lei Mou X Zhang D September 2012 A comprehensive evaluation of full reference image quality assessment algorithms s 1477 1480 doi 10 1109 icip 2012 6467150 ISBN 978 1 4673 2533 2 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Proignorovano journal dovidka Zhou Wang Wang Zhou Li Qiang May 2011 Information Content Weighting for Perceptual Image Quality Assessment IEEE Transactions on Image Processing 20 5 1185 1198 Bibcode 2011ITIP 20 1185W doi 10 1109 tip 2010 2092435 PMID 21078577 Channappayya S S Bovik A C Caramanis C Heath R W March 2008 SSIM optimal linear image restoration s 765 768 doi 10 1109 icassp 2008 4517722 ISBN 978 1 4244 1483 3 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Proignorovano journal dovidka Gore Akshay Gupta Savita 1 lyutogo 2015 Full reference image quality metrics for JPEG compressed images AEU International Journal of Electronics and Communications 69 2 604 608 doi 10 1016 j aeue 2014 09 002 Wang Z Simoncelli E P September 2008 Maximum differentiation MAD competition a methodology for comparing computational models of perceptual quantities PDF Journal of Vision 8 12 8 1 13 doi 10 1167 8 12 8 PMC 4143340 PMID 18831621 Reibman A R Poole D September 2007 Characterizing packet loss impairments in compressed video T 5 s V 77 V 80 doi 10 1109 icip 2007 4379769 ISBN 978 1 4244 1436 9 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Proignorovano journal dovidka Hore A Ziou D August 2010 Image Quality Metrics PSNR vs SSIM s 2366 2369 doi 10 1109 icpr 2010 579 ISBN 978 1 4244 7542 1 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Proignorovano journal dovidka PosilannyaDomashnya storinka Realizaciya Rust Realizaciya C C Realizaciya C Krisa Lomonta Realizaciya qpsnr bagatopotokovij C Realizaciya v programnomu zabezpechenni VQMT Realizaciya na Python Tayemnicya vimiryuvan podibnosti MSE ta SSIM Gintautas Palubinskas 2014 r