Багатови́мірна стати́стика — це форма статистики, яка охоплює одночасне спостереження й аналіз більш ніж однієї змінної. Застосування багатовимірної статистики є багатовимірний аналіз. Основна задача багатовимірної статистики — це розуміння різних цілей та умови кожної форми багатовимірного аналізу, та відношення між ними. Практична реалізація багатовимірної статистики для конкретної проблеми може включати декілька типів одновимірного і багатовимірного аналізів з метою зрозуміти відношення між змінними та їх доцільність для фактичної проблеми, яку досліджують.
Крім того, багатовимірна статистика пов'язана з багатовимірним розподілом ймовірностей, з обох точок зору:
- як вони можуть бути використані для представлення розподілів спостережуваних даних;
- яким чином вони можуть бути використані як частина статистичного висновку, особливо коли декілька різних величин є цікавими для того ж аналізу.
Деякі типи задач, які пов'язані з багатовимірними даними, наприклад проста лінійна регресія та множинна регресія, зазвичай не розглядаються як окремий випадок багатовимірної статистики, оскільки розглядаються з урахуванням (одновимірного) умовного розподілу однієї змінної, яка визначена іншими змінними.
Типи аналізу
Є багато моделей, кожна з власним типом аналізу:
- Багатофакторний дисперсійний аналіз розширює дисперсійний аналіз, щоб покрити випадки, коли є більш ніж одна залежних змінних, для одночасного їх аналізу.
- Багатовимірний регресійний аналіз намагається визначити формулу, яка зможе описати як елементи векторних змінних міняються при зміні інших елементів. При лінійних співвідношеннях регресійний аналіз має за основу форми загальної лінійної моделі.
- Аналіз головних компонент створює новий набір ортогональних змінних, які містять ту ж інформацію, що й вихідний набір. Таким чином повертаючи осі змінних, створюється новий набір ортогональних осей, впорядкованих так, що вибіркова дисперсія даних вздовж кожної координати була максимальною, за умови ортогональності всіх попередніх координат.
- Факторний аналіз схожий на аналіз головних компонент, але дозволяє користувачеві вилучати вказану кількість штучних змінних, яка менша за кількість змінних всього набору, залишаючи непоясненні змінні як помилку. Вилучені змінні відомі як приховані змінні або фактори, припускається що кожна з них пояснює коваріацію в групі досліджуваних змінних.
- Канонічний аналіз кореляції знаходить лінійні зв'язки між двома наборами змінних, це узагальнена версія парної кореляції.
- Аналіз надмірності схожий на канонічний аналіз кореляції, але на відміну від нього дозволяє користувачеві отримати вказану кількість штучних змінних від одного набору незалежних змінних, які пояснюють як можливо багато змінних в іншому наборі незалежних змінних. Це — багатовимірний аналог регресу.
- Аналіз відповідностей або взаємне усереднення, знаходить штучні змінні, що узагальнюють початковий набір. Основна модель приймає відмінності хі-квадрат серед записів (випадки). Існує канонічний (або обмежений) аналіз відповідностей: робить висновки про спільні змінні двох наборів (схоже як канонічний аналіз кореляції).
- Багатовимірне шкалювання (масштабуваня) включає в себе різні алгоритми для визначення набору штучних змінних, які найкращим чином зображують попарні відстані між записами. Первісний метод — це аналіз головних координат.
- Дискримінантний аналіз або канонічний аналіз варіаційної величини намагається встановити, чи може набір змінних використовуватись для відокремлення двох або більше груп випадків.
- Лінійний дискримінантний аналіз обчислює лінійного предиктора двох наборів нормально розподілених даних з метою класифікації нових спостережень.
- Кластеризація систем призначають об'єкти в групи (так звані кластери), таким чином що об'єкти з одного кластера більш схожі один на одного. Ніж об'єкти з різних кластерів.
- Рекурсивне розбиття створює дерево рішень, яке намагається правильно класифікувати елементи множини на основі дихотомічна залежна змінна.
- Штучні нейроні мережі розширюють регресію та метод кластеризації до нелінійних багатовимірних моделей.
Важливі ймовірнісні розподіли
Існує множина ймовірнісних розподілів, які використовуються в багатофакторному аналізі, який відіграє ту ж роль відносно множини розподілів, які використовуються в одновимірному аналізі, коли нормальний розподіл відповідає набору даних. Ці багатовимірні розподіли такі:
- Багатовимірний нормальний розподіл
- Розподіл Уішарта
- Багатовимірний розподіл Т-Стьюдента
Зворотні розподілу Уішарта відіграють важливу роль у теоріях Баєса, наприклад в баєсівькій багатовимірній лінійній регресії. Крім того, Т-розподіл Хотеллінга є одновимірним розподілом, узагальненням Т-розподілу Стьюдента, що використовується в перевірці статистичних гіпотез.
Програмне забезпечення та інструменти
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Bagatovi mirna stati stika ce forma statistiki yaka ohoplyuye odnochasne sposterezhennya j analiz bilsh nizh odniyeyi zminnoyi Zastosuvannya bagatovimirnoyi statistiki ye bagatovimirnij analiz Osnovna zadacha bagatovimirnoyi statistiki ce rozuminnya riznih cilej ta umovi kozhnoyi formi bagatovimirnogo analizu ta vidnoshennya mizh nimi Praktichna realizaciya bagatovimirnoyi statistiki dlya konkretnoyi problemi mozhe vklyuchati dekilka tipiv odnovimirnogo i bagatovimirnogo analiziv z metoyu zrozumiti vidnoshennya mizh zminnimi ta yih docilnist dlya faktichnoyi problemi yaku doslidzhuyut Krim togo bagatovimirna statistika pov yazana z bagatovimirnim rozpodilom jmovirnostej z oboh tochok zoru yak voni mozhut buti vikoristani dlya predstavlennya rozpodiliv sposterezhuvanih danih yakim chinom voni mozhut buti vikoristani yak chastina statistichnogo visnovku osoblivo koli dekilka riznih velichin ye cikavimi dlya togo zh analizu Deyaki tipi zadach yaki pov yazani z bagatovimirnimi danimi napriklad prosta linijna regresiya ta mnozhinna regresiya zazvichaj ne rozglyadayutsya yak okremij vipadok bagatovimirnoyi statistiki oskilki rozglyadayutsya z urahuvannyam odnovimirnogo umovnogo rozpodilu odniyeyi zminnoyi yaka viznachena inshimi zminnimi Tipi analizuYe bagato modelej kozhna z vlasnim tipom analizu Bagatofaktornij dispersijnij analiz rozshiryuye dispersijnij analiz shob pokriti vipadki koli ye bilsh nizh odna zalezhnih zminnih dlya odnochasnogo yih analizu Bagatovimirnij regresijnij analiz namagayetsya viznachiti formulu yaka zmozhe opisati yak elementi vektornih zminnih minyayutsya pri zmini inshih elementiv Pri linijnih spivvidnoshennyah regresijnij analiz maye za osnovu formi zagalnoyi linijnoyi modeli Analiz golovnih komponent stvoryuye novij nabir ortogonalnih zminnih yaki mistyat tu zh informaciyu sho j vihidnij nabir Takim chinom povertayuchi osi zminnih stvoryuyetsya novij nabir ortogonalnih osej vporyadkovanih tak sho vibirkova dispersiya danih vzdovzh kozhnoyi koordinati bula maksimalnoyu za umovi ortogonalnosti vsih poperednih koordinat Faktornij analiz shozhij na analiz golovnih komponent ale dozvolyaye koristuvachevi viluchati vkazanu kilkist shtuchnih zminnih yaka mensha za kilkist zminnih vsogo naboru zalishayuchi nepoyasnenni zminni yak pomilku Vilucheni zminni vidomi yak prihovani zminni abo faktori pripuskayetsya sho kozhna z nih poyasnyuye kovariaciyu v grupi doslidzhuvanih zminnih Kanonichnij analiz korelyaciyi znahodit linijni zv yazki mizh dvoma naborami zminnih ce uzagalnena versiya parnoyi korelyaciyi Analiz nadmirnosti shozhij na kanonichnij analiz korelyaciyi ale na vidminu vid nogo dozvolyaye koristuvachevi otrimati vkazanu kilkist shtuchnih zminnih vid odnogo naboru nezalezhnih zminnih yaki poyasnyuyut yak mozhlivo bagato zminnih v inshomu nabori nezalezhnih zminnih Ce bagatovimirnij analog regresu Analiz vidpovidnostej abo vzayemne userednennya znahodit shtuchni zminni sho uzagalnyuyut pochatkovij nabir Osnovna model prijmaye vidminnosti hi kvadrat sered zapisiv vipadki Isnuye kanonichnij abo obmezhenij analiz vidpovidnostej robit visnovki pro spilni zminni dvoh naboriv shozhe yak kanonichnij analiz korelyaciyi Bagatovimirne shkalyuvannya masshtabuvanya vklyuchaye v sebe rizni algoritmi dlya viznachennya naboru shtuchnih zminnih yaki najkrashim chinom zobrazhuyut poparni vidstani mizh zapisami Pervisnij metod ce analiz golovnih koordinat Diskriminantnij analiz abo kanonichnij analiz variacijnoyi velichini namagayetsya vstanoviti chi mozhe nabir zminnih vikoristovuvatis dlya vidokremlennya dvoh abo bilshe grup vipadkiv Linijnij diskriminantnij analiz obchislyuye linijnogo prediktora dvoh naboriv normalno rozpodilenih danih z metoyu klasifikaciyi novih sposterezhen Klasterizaciya sistem priznachayut ob yekti v grupi tak zvani klasteri takim chinom sho ob yekti z odnogo klastera bilsh shozhi odin na odnogo Nizh ob yekti z riznih klasteriv Rekursivne rozbittya stvoryuye derevo rishen yake namagayetsya pravilno klasifikuvati elementi mnozhini na osnovi dihotomichna zalezhna zminna Shtuchni nejroni merezhi rozshiryuyut regresiyu ta metod klasterizaciyi do nelinijnih bagatovimirnih modelej Vazhlivi jmovirnisni rozpodiliIsnuye mnozhina jmovirnisnih rozpodiliv yaki vikoristovuyutsya v bagatofaktornomu analizi yakij vidigraye tu zh rol vidnosno mnozhini rozpodiliv yaki vikoristovuyutsya v odnovimirnomu analizi koli normalnij rozpodil vidpovidaye naboru danih Ci bagatovimirni rozpodili taki Bagatovimirnij normalnij rozpodil Rozpodil Uisharta Bagatovimirnij rozpodil T Styudenta Zvorotni rozpodilu Uisharta vidigrayut vazhlivu rol u teoriyah Bayesa napriklad v bayesivkij bagatovimirnij linijnij regresiyi Krim togo T rozpodil Hotellinga ye odnovimirnim rozpodilom uzagalnennyam T rozpodilu Styudenta sho vikoristovuyetsya v perevirci statistichnih gipotez Programne zabezpechennya ta instrumentiOpenOffice Calc PSPP R mova programuvannya SciPy Python SPSS Statistica ROOT en