Багатовимірне шкалювання (БШ; англ. Multidimensional scaling; (MDS)) – ряд пов’язаних між собою статистичних технік, що часто використовують в інформаційній візуалізації для дослідження схожості та відмінності у даних. БШ є особливим видом розміщення. БШ будується як матриця подібних елементів, після чого підписується розміщення кожного елементу у N-вимірному просторі, де через N позначають пріоритетність. Для достатньо малих N результат розміщень може бути представлений як графік чи візуалізований у 3D. БШ потрапляє в залежно від значення вхідних матриць.
Типи
Класичне багатовимірне шкалювання
Також відоме як Аналіз Нормальних Координат, масштабування Торгенса або Торгенса-Гувера. Вхідна матриця містить значення відмінностей між парами елементів і видає координовану матрицю, конфігурація якої мінімізує функцію втрат.
Метричне багатовимірне шкалювання
Множина класичних БШ, що узагальнює оптимізаційну процедуру до ряду втрачених функцій та вхідних матриць з відомими відстанями та вагами і т. і. Корисна втрачена функція називається стресовою, яку часто мінімізують використовуючи процедуру, що називається мажорування стресу.
Неметричне багатовимірне шкалювання
На відміну від метричного багатовимірного шкалювання Неметричне багатовимірне шкалювання здійснює пошук як непараметричних монотонних зв’язків між відмінностями в поелементній матриці та відмінності в евклідових відстанях між елементами так і розміщення кожного елементу у маловимірному просторі. Зв’язки зазвичай встановлюють використовуючи ізотонічну регресію.
Дослідження Найменшого вимру Луїза Гатмена є прикладом неметричної БШ процедури.
Узагальнене БШ
Розширене метричне БШ, в якому цільовий вимір є випадково згладженим неевклідовим виміром. У випадку, якщо відмінними є відстані на поверхні, цільовим простором є інша поверхня. Узагальнене БШ дозволяє знайти мінімально-спотворене проникнення однієї поверхні в іншу.
Деталі
Дані що аналізуються збираються за однією ознакою (кольором, стороною, родом), для якої визначена функція відстані δi,j := Відстань між i-им та j-им об’єктами. Ця відстань вноситься в матрицю відмінностей
Ціль БШ маючи Δ знайти вектори так щоб
- для всіх ,
де є Нормою у векторному просторі. В класичному БШ цією нормою є Евклідова відстань, але в ширшому розумінні це може бути метрична функція або функція випадкової відстані.
Іншими словами, БШ дозволяє шукати вкладення з I об’єктів у RN при дотриманні відстаней. Якщо вимір N вибраний як 2 або 3 ми можемо побудувати вектор XI для отримання візуалізації схожостей між I-ми об’єктами. Варто зазначити, що вектор x_i не є унікальним: за допомогою евклідових відстаней він може бути випадково перекладений, переміщений, відображений, оскільки такі зміни не впливають на попарні відстані.
Існують різноманітні підходи до визначення векторів xi. Зазвичай БШ формулюється як оптимізаційна проблема, де розглядається як деяка функція витрат, наприклад:
- .
Розв’язок може бути знайдений через числові оптимізаційні методи. Для конкретно вибраної функції витрат мінімізація може бути вибраною аналітично в межах матриці власного розкладу (спектрального розкладу).
Методика
Нижче наведені кроки для здійснення БШ дослідження:
- Формулювання проблеми – як змінні ви хочете порівняти?Скільки? Порівняння більше, ніж 20 змінних завжди дуже громіздке. Менше ніж 8 (4 пари) не дасть обґрунтованого результату. Яка ціль дослідження для якого проводиться даний аналіз?
- Пошук вхідних даних – респондентам задають ряд питань. Для кожної пари продуктів респондентів просять навести подібності (зазвичай за семизначною шкалою Лікерта, від дуже схожих до дуже різних). Перше питання наприклад могло б бути про Кока-колу/Пепсі, наступне - Кока-кола/Пиво, далі -Пепсі/Доктор Пепер, наступне – Доктор Пепер/Пиво. Кількість питань є функцією від кількості брендів може бути обчислено як , де Q- кількість питань, N- кількість брендів. Такий підхід посилається на «даних про сприйняття: прямий метод». Існує два інших підходи. «Дані про сприйняття: похідний метод», є методом в якому продукцію ділять за характеристиками, як оцінюють за семантичною шкалою відмінностей. Ще один метод – «Метод даних за вподобаннями», якому респондентів просять надати перевагу якомусь товару, а не схожості між товарами.
- Робота з БШ статистичними програмами - процедура БШ доступна в більшості статистичних програм. Існує вибір між метричним БШ (який дозволяє працювати з інтервалами чи даними про співвідношення рівня), і неметричним БШ (який працює з порядковими даними).
- Вибір кількості вимірів – Дослідник має вибрати кількість вимірів, які він хоче створити. Чим більше вимірів тим краща статистична схожість, проте важче інтерпретувати дані.
- Відображення результатів та обґрунтування вимірів – статистична програма відобразить результати. Відображення буде здійснено по кожному продукту (зазвичай у двовимірному просторі). Наближення продуктів один до одного буде свідчити про те, наскільки вони схожі, або бажані, залежно від методу, що був застосований. Результати мають бути прокоментовані та інтерпретовані дослідником, що означає суб’єктивність у судженні та складність у роботі.
- Тестування результатів на надійність та валідність – пошук R-квадрату для визначення частки варіації шкальованих даних, які спричинені БШ процедурою. R-квадрат з значенням 0,6 розглядається як мінімальний прийнятний рівень; R-квадрат з значенням 0,8 – хороший рівень для метричного БШ; R-квадрат з значенням 0,9 – хороший рівень для неметричного БШ. Інші можливі тести – тест Краскелса (Kruskal’s Stress Test), тест розбиття даних, тест стабільності даних (виключення одного бренду) чи повторна перевірка надійності.
- Всесторонній виклад результатів – з графічним відображенням мають зазначатися як мінімум метод виміру відстані (індекс Соренсона, індекс Жаккарда) та надійність (в т. ч. критичне значення). Також дуже інформативно надавати алгоритм, який визначений у програмі, яку було використано, якщо вам було надано конфігурацію чи початковий довільний вибір, оцінка розмірності, результати тесту Монте-Карло, кількість ітерацій, оцінка стабільності та пропорцій відмінності кожної шкали (R-квадрат).
Застосування
Застосування включає наукову візуалізацію та глибокий аналіз даних в сфер когнітивних наук, інформаційних наук, психофізики, психометрики, маркетингу та екології. Нові застосування виникли з використанням незалежних безпровідних вузлів, які займають простір чи площу. БШ може застосовуватися як реальний підхід покращення використання часу для моніторингу та управління таким парком.
Більше того, БШ активно використовується у геостатистиці для моделювання просторової мінливості у графічних моделях, представляючи їх у вигляд точок у маловимірному просторі.
Маркетинг
У маркетингу БШ методику застосовують для опитування вподобань та сприйняття респондентів та презентацій візуальної сітки, яку ще називають картою сприйняття.
Порівняння та переваги
Потенційних покупців просять порівняти пари продуктів та скласти судження про їх подібність. Тоді як інші методи (такі, як факторний аналіз, дискримінантний аналіз, і спільний аналіз) отримують основні дані від відповідей про характеристики продукту, визначені дослідником, БШ отримує основні дані від суджень респондентів про подібність продукції. Це є важливою перевагою. Воно не залежить від суджень дослідників. Воно не вимагає список характеристик, які потрібно надати респондентам. Дані походять від суджень респондентів по парах продукції. Завдяки цим перевагам, БШ є найбільш поширеною технікою, що використовується для побудови карт сприйняття.
Посилання
- , and Wish, M. (1978), Multidimensional Scaling, Sage University Paper series on Quantitative Application in the Social Sciences, 07-011. Beverly Hills and London: Sage Publications.
- Honarkhah, M and Caers, J, 2010, Stochastic Simulation of Patterns Using Distance-Based Pattern Modeling, Mathematical Geosciences, 42: 487–517
Зовнішні посилання
- NewMDSX: Multidimensional Scaling Software [ 17 липня 2012 у Wayback Machine.]
- MDS page [ 17 липня 2012 у Wayback Machine.]
- MDS in C++ [ 20 лютого 2012 у Wayback Machine.] by Antonio Gulli
- for MDS from
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Bagatovimirne shkalyuvannya BSh angl Multidimensional scaling MDS ryad pov yazanih mizh soboyu statistichnih tehnik sho chasto vikoristovuyut v informacijnij vizualizaciyi dlya doslidzhennya shozhosti ta vidminnosti u danih BSh ye osoblivim vidom rozmishennya BSh buduyetsya yak matricya podibnih elementiv pislya chogo pidpisuyetsya rozmishennya kozhnogo elementu u N vimirnomu prostori de cherez N poznachayut prioritetnist Dlya dostatno malih N rezultat rozmishen mozhe buti predstavlenij yak grafik chi vizualizovanij u 3D BSh potraplyaye v zalezhno vid znachennya vhidnih matric TipiKlasichne bagatovimirne shkalyuvannya Takozh vidome yak Analiz Normalnih Koordinat masshtabuvannya Torgensa abo Torgensa Guvera Vhidna matricya mistit znachennya vidminnostej mizh parami elementiv i vidaye koordinovanu matricyu konfiguraciya yakoyi minimizuye funkciyu vtrat Metrichne bagatovimirne shkalyuvannya Mnozhina klasichnih BSh sho uzagalnyuye optimizacijnu proceduru do ryadu vtrachenih funkcij ta vhidnih matric z vidomimi vidstanyami ta vagami i t i Korisna vtrachena funkciya nazivayetsya stresovoyu yaku chasto minimizuyut vikoristovuyuchi proceduru sho nazivayetsya mazhoruvannya stresu Nemetrichne bagatovimirne shkalyuvannya Na vidminu vid metrichnogo bagatovimirnogo shkalyuvannya Nemetrichne bagatovimirne shkalyuvannya zdijsnyuye poshuk yak neparametrichnih monotonnih zv yazkiv mizh vidminnostyami v poelementnij matrici ta vidminnosti v evklidovih vidstanyah mizh elementami tak i rozmishennya kozhnogo elementu u malovimirnomu prostori Zv yazki zazvichaj vstanovlyuyut vikoristovuyuchi izotonichnu regresiyu Doslidzhennya Najmenshogo vimru Luyiza Gatmena ye prikladom nemetrichnoyi BSh proceduri Uzagalnene BSh Rozshirene metrichne BSh v yakomu cilovij vimir ye vipadkovo zgladzhenim neevklidovim vimirom U vipadku yaksho vidminnimi ye vidstani na poverhni cilovim prostorom ye insha poverhnya Uzagalnene BSh dozvolyaye znajti minimalno spotvorene proniknennya odniyeyi poverhni v inshu DetaliDani sho analizuyutsya zbirayutsya za odniyeyu oznakoyu kolorom storonoyu rodom dlya yakoyi viznachena funkciya vidstani di j Vidstan mizh i im ta j im ob yektami Cya vidstan vnositsya v matricyu vidminnostej D d 1 1 d 1 2 d 1 I d 2 1 d 2 2 d 2 I d I 1 d I 2 d I I displaystyle Delta begin pmatrix delta 1 1 amp delta 1 2 amp cdots amp delta 1 I delta 2 1 amp delta 2 2 amp cdots amp delta 2 I vdots amp vdots amp amp vdots delta I 1 amp delta I 2 amp cdots amp delta I I end pmatrix Cil BSh mayuchi D znajti vektori I displaystyle I x 1 x I R N displaystyle x 1 ldots x I in mathbb R N tak shob x i x j d i j displaystyle x i x j approx delta i j dlya vsih i j I displaystyle i j in I de displaystyle cdot ye Normoyu u vektornomu prostori V klasichnomu BSh ciyeyu normoyu ye Evklidova vidstan ale v shirshomu rozuminni ce mozhe buti metrichna funkciya abo funkciya vipadkovoyi vidstani Inshimi slovami BSh dozvolyaye shukati vkladennya z I ob yektiv u RN pri dotrimanni vidstanej Yaksho vimir N vibranij yak 2 abo 3 mi mozhemo pobuduvati vektor XI dlya otrimannya vizualizaciyi shozhostej mizh I mi ob yektami Varto zaznachiti sho vektor x i ne ye unikalnim za dopomogoyu evklidovih vidstanej vin mozhe buti vipadkovo perekladenij peremishenij vidobrazhenij oskilki taki zmini ne vplivayut na poparni vidstani Isnuyut riznomanitni pidhodi do viznachennya vektoriv xi Zazvichaj BSh formulyuyetsya yak optimizacijna problema de x 1 x I displaystyle x 1 ldots x I rozglyadayetsya yak deyaka funkciya vitrat napriklad min x 1 x I i lt j x i x j d i j 2 displaystyle min x 1 ldots x I sum i lt j x i x j delta i j 2 Rozv yazok mozhe buti znajdenij cherez chislovi optimizacijni metodi Dlya konkretno vibranoyi funkciyi vitrat minimizaciya mozhe buti vibranoyu analitichno v mezhah matrici vlasnogo rozkladu spektralnogo rozkladu MetodikaNizhche navedeni kroki dlya zdijsnennya BSh doslidzhennya Formulyuvannya problemi yak zminni vi hochete porivnyati Skilki Porivnyannya bilshe nizh 20 zminnih zavzhdi duzhe gromizdke Menshe nizh 8 4 pari ne dast obgruntovanogo rezultatu Yaka cil doslidzhennya dlya yakogo provoditsya danij analiz Poshuk vhidnih danih respondentam zadayut ryad pitan Dlya kozhnoyi pari produktiv respondentiv prosyat navesti podibnosti zazvichaj za semiznachnoyu shkaloyu Likerta vid duzhe shozhih do duzhe riznih Pershe pitannya napriklad moglo b buti pro Koka kolu Pepsi nastupne Koka kola Pivo dali Pepsi Doktor Peper nastupne Doktor Peper Pivo Kilkist pitan ye funkciyeyu vid kilkosti brendiv mozhe buti obchisleno yak Q N N 1 2 displaystyle Q N N 1 2 de Q kilkist pitan N kilkist brendiv Takij pidhid posilayetsya na danih pro sprijnyattya pryamij metod Isnuye dva inshih pidhodi Dani pro sprijnyattya pohidnij metod ye metodom v yakomu produkciyu dilyat za harakteristikami yak ocinyuyut za semantichnoyu shkaloyu vidminnostej She odin metod Metod danih za vpodobannyami yakomu respondentiv prosyat nadati perevagu yakomus tovaru a ne shozhosti mizh tovarami Robota z BSh statistichnimi programami procedura BSh dostupna v bilshosti statistichnih program Isnuye vibir mizh metrichnim BSh yakij dozvolyaye pracyuvati z intervalami chi danimi pro spivvidnoshennya rivnya i nemetrichnim BSh yakij pracyuye z poryadkovimi danimi Vibir kilkosti vimiriv Doslidnik maye vibrati kilkist vimiriv yaki vin hoche stvoriti Chim bilshe vimiriv tim krasha statistichna shozhist prote vazhche interpretuvati dani Vidobrazhennya rezultativ ta obgruntuvannya vimiriv statistichna programa vidobrazit rezultati Vidobrazhennya bude zdijsneno po kozhnomu produktu zazvichaj u dvovimirnomu prostori Nablizhennya produktiv odin do odnogo bude svidchiti pro te naskilki voni shozhi abo bazhani zalezhno vid metodu sho buv zastosovanij Rezultati mayut buti prokomentovani ta interpretovani doslidnikom sho oznachaye sub yektivnist u sudzhenni ta skladnist u roboti Testuvannya rezultativ na nadijnist ta validnist poshuk R kvadratu dlya viznachennya chastki variaciyi shkalovanih danih yaki sprichineni BSh proceduroyu R kvadrat z znachennyam 0 6 rozglyadayetsya yak minimalnij prijnyatnij riven R kvadrat z znachennyam 0 8 horoshij riven dlya metrichnogo BSh R kvadrat z znachennyam 0 9 horoshij riven dlya nemetrichnogo BSh Inshi mozhlivi testi test Kraskelsa Kruskal s Stress Test test rozbittya danih test stabilnosti danih viklyuchennya odnogo brendu chi povtorna perevirka nadijnosti Vsestoronnij viklad rezultativ z grafichnim vidobrazhennyam mayut zaznachatisya yak minimum metod vimiru vidstani indeks Sorensona indeks Zhakkarda ta nadijnist v t ch kritichne znachennya Takozh duzhe informativno nadavati algoritm yakij viznachenij u programi yaku bulo vikoristano yaksho vam bulo nadano konfiguraciyu chi pochatkovij dovilnij vibir ocinka rozmirnosti rezultati testu Monte Karlo kilkist iteracij ocinka stabilnosti ta proporcij vidminnosti kozhnoyi shkali R kvadrat ZastosuvannyaZastosuvannya vklyuchaye naukovu vizualizaciyu ta glibokij analiz danih v sfer kognitivnih nauk informacijnih nauk psihofiziki psihometriki marketingu ta ekologiyi Novi zastosuvannya vinikli z vikoristannyam nezalezhnih bezprovidnih vuzliv yaki zajmayut prostir chi ploshu BSh mozhe zastosovuvatisya yak realnij pidhid pokrashennya vikoristannya chasu dlya monitoringu ta upravlinnya takim parkom Bilshe togo BSh aktivno vikoristovuyetsya u geostatistici dlya modelyuvannya prostorovoyi minlivosti u grafichnih modelyah predstavlyayuchi yih u viglyad tochok u malovimirnomu prostori Marketing U marketingu BSh metodiku zastosovuyut dlya opituvannya vpodoban ta sprijnyattya respondentiv ta prezentacij vizualnoyi sitki yaku she nazivayut kartoyu sprijnyattya Porivnyannya ta perevagiPotencijnih pokupciv prosyat porivnyati pari produktiv ta sklasti sudzhennya pro yih podibnist Todi yak inshi metodi taki yak faktornij analiz diskriminantnij analiz i spilnij analiz otrimuyut osnovni dani vid vidpovidej pro harakteristiki produktu viznacheni doslidnikom BSh otrimuye osnovni dani vid sudzhen respondentiv pro podibnist produkciyi Ce ye vazhlivoyu perevagoyu Vono ne zalezhit vid sudzhen doslidnikiv Vono ne vimagaye spisok harakteristik yaki potribno nadati respondentam Dani pohodyat vid sudzhen respondentiv po parah produkciyi Zavdyaki cim perevagam BSh ye najbilsh poshirenoyu tehnikoyu sho vikoristovuyetsya dlya pobudovi kart sprijnyattya Posilannya and Wish M 1978 Multidimensional Scaling Sage University Paper series on Quantitative Application in the Social Sciences 07 011 Beverly Hills and London Sage Publications Honarkhah M and Caers J 2010 Stochastic Simulation of Patterns Using Distance Based Pattern Modeling Mathematical Geosciences 42 487 517Zovnishni posilannyaNewMDSX Multidimensional Scaling Software 17 lipnya 2012 u Wayback Machine MDS page 17 lipnya 2012 u Wayback Machine MDS in C 20 lyutogo 2012 u Wayback Machine by Antonio Gulli for MDS from