Дисперсійний аналіз (англ. analysis of variance (ANOVA)) являє собою статистичний метод аналізу результатів, які залежать від якісних ознак.
Кожен фактор може бути дискретною чи неперервною випадковою змінною, яку розділяють на декілька сталих рівнів (градацій, інтервалів). Якщо кількість вимірювань (проб, даних) на всіх рівнях кожного з факторів однакова, то дисперсійний аналіз називають рівномірним, інакше — нерівномірним.
В основі дисперсійного аналізу є такий принцип (факт з математичної статистики): якщо на випадкову величину діють взаємно незалежні фактори A, B, …, то загальна дисперсія дорівнює сумі дисперсій, зумовлених дією окремо кожного з факторів:
Задачі дисперсійного аналізу
В будь-якому експерименті середні значення досліджуваних величин змінюються у зв'язку зі зміною основних факторів (кількісних та якісних), що визначають умови досліду, а також і випадкових факторів. Дослідження впливу тих чи інших факторів на мінливість середніх є задачею дисперсійного аналізу.
Дисперсійний аналіз використовує властивість адитивності дисперсії випадкової величини, що обумовлено дією незалежних факторів. В залежності від числа джерел дисперсії розрізняють однофакторний та багатофакторний дисперсійний аналіз.
Дисперсійний аналіз особливо ефективний при вивченні кількох факторів. При класичному методі вивчення змінюють тільки один фактор, а решту залишають постійними. При цьому для кожного фактору проводиться своя серія спостережень, що не використовується при вивченні інших факторів. Крім того, при такому методі досліджень не вдається визначити взаємодію факторів при одночасній їх зміні. При дисперсійному аналізі кожне спостереження служить для одночасної оцінки всіх факторів та їх взаємодії.
Дисперсійний аналіз полягає у виділенні й оцінюванні окремих факторів, що викликають зміну досліджуваної випадкової величини. При цьому проводиться розклад сумарної вибіркової дисперсії на складові, обумовлені незалежними факторами. Кожна з цих складових є оцінкою дисперсії генеральної сукупності. Щоб дати оцінку дієвості впливу даного фактору, необхідно оцінити значимість відповідної вибіркової дисперсії у порівнянні з дисперсією відтворення, обумовленою випадковими факторами. Перевірка значимості оцінок дисперсії проводять з допомогою критерію Фішера.
Коли розрахункове значення критерію Фішера виявиться меншим табличного, то вплив досліджуваного фактору немає підстав вважати значимим. Коли ж розрахункове значення критерію Фішера виявиться більшим табличного, то цей фактор впливає на зміни середніх. В подальшому ми вважаємо, що виконуються наступні припущення:
- Випадкові помилки спостережень мають нормальний розподіл.
- Фактори впливають тільки на зміну середніх значень, а дисперсія спостережень залишається постійною.
Фактори, що розглядаються в дисперсійному аналізі, бувають трьох родів:
- з випадковими рівнями, коли вибір рівнів проходить з безмежної сукупності можливих рівнів та супроводжується рандомізацією і рівні вибираються випадковим чином;
- з фіксованими рівнями;
- змішаного типу — частина факторів розглядається на фіксованих рівнях, але рівні решти вибираються випадковим чином.
Дисперсійний аналіз застосовується в різних формах в залежності від структури об'єкту, що досліджується; вибір відповідної форми є однією з головних трудностей в практичному застосуванні аналізу.
Однофакторний дисперсійний аналіз
Розглядається дія одиничного фактору А (кількісного чи якісного), котрий приймає k різних значень (рівнів фактора). Найпростіші розрахунки виходять при рівній кількості дослідів на кожному рівні фактора А.
Номер досліду | Рівні фактору | |||
1 | ||||
2 | ||||
… | … | … | … | … |
n | … |
Дисперсійний аналіз можна провести за наступним алгоритмом:
- Обчислити:
- суми за стовпцями:
- суму квадратів усіх дослідів:
- суму квадратів сум за стовпцями, поділену на число дослідів в стовпці:
- квадрат загальної суми, поділений на число всіх дослідів (коректуючий член):
- суму квадратів для стовпчика:
- загальну суму квадратів, рівну різниці між сумою квадратів всіх дослідів та коректуючим членом:
- залишкову суму квадратів для оцінки помилки експерименту:
- дисперсію : ;
- дисперсію: : ;
- Результати розрахунків представити у вигляді таблиці дисперсного аналізу:
Джерело дисперсії | Число ступенів вільності | Сума квадратів | Середній квадрат | Математичне сподівання середнього квадрату |
Залишок | ||||
Загальна сума |
Якщо то вплив фактора слід вважати незначним. При цьому загальна дисперсія пов'язана тільки з фактором випадковості і може служити оцінкою для дисперсії відтворення. Така оцінка краща від , бо має більше число ступенів вільності. Якщо ж справедлива нерівність
де та , різниця між дисперсіями та значна і, відповідно, значний вплив фактора .
Двофакторний дисперсійний аналіз
Детальніші відомості з цієї теми ви можете знайти в статті [en].
Цей розділ статті ще . (липень 2021) |
Див. також
Джерела
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Дисперсійний аналіз[недоступне посилання з липня 2019] — Львівська політехніка.
- Дисперсійний аналіз (Геостатистика) [ 14 грудня 2017 у Wayback Machine.] — Львівський національний університет імені Івана Франка
Це незавершена стаття з математики. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Dispersijnij analiz angl analysis of variance ANOVA yavlyaye soboyu statistichnij metod analizu rezultativ yaki zalezhat vid yakisnih oznak Kozhen faktor mozhe buti diskretnoyu chi neperervnoyu vipadkovoyu zminnoyu yaku rozdilyayut na dekilka stalih rivniv gradacij intervaliv Yaksho kilkist vimiryuvan prob danih na vsih rivnyah kozhnogo z faktoriv odnakova to dispersijnij analiz nazivayut rivnomirnim inakshe nerivnomirnim V osnovi dispersijnogo analizu ye takij princip fakt z matematichnoyi statistiki yaksho na vipadkovu velichinu diyut vzayemno nezalezhni faktori A B to zagalna dispersiya dorivnyuye sumi dispersij zumovlenih diyeyu okremo kozhnogo z faktoriv s 2 s A 2 s B 2 displaystyle sigma 2 sigma A 2 sigma B 2 ldots Zadachi dispersijnogo analizuV bud yakomu eksperimenti seredni znachennya doslidzhuvanih velichin zminyuyutsya u zv yazku zi zminoyu osnovnih faktoriv kilkisnih ta yakisnih sho viznachayut umovi doslidu a takozh i vipadkovih faktoriv Doslidzhennya vplivu tih chi inshih faktoriv na minlivist serednih ye zadacheyu dispersijnogo analizu Dispersijnij analiz vikoristovuye vlastivist aditivnosti dispersiyi vipadkovoyi velichini sho obumovleno diyeyu nezalezhnih faktoriv V zalezhnosti vid chisla dzherel dispersiyi rozriznyayut odnofaktornij ta bagatofaktornij dispersijnij analiz Dispersijnij analiz osoblivo efektivnij pri vivchenni kilkoh faktoriv Pri klasichnomu metodi vivchennya zminyuyut tilki odin faktor a reshtu zalishayut postijnimi Pri comu dlya kozhnogo faktoru provoditsya svoya seriya sposterezhen sho ne vikoristovuyetsya pri vivchenni inshih faktoriv Krim togo pri takomu metodi doslidzhen ne vdayetsya viznachiti vzayemodiyu faktoriv pri odnochasnij yih zmini Pri dispersijnomu analizi kozhne sposterezhennya sluzhit dlya odnochasnoyi ocinki vsih faktoriv ta yih vzayemodiyi Dispersijnij analiz polyagaye u vidilenni j ocinyuvanni okremih faktoriv sho viklikayut zminu doslidzhuvanoyi vipadkovoyi velichini Pri comu provoditsya rozklad sumarnoyi vibirkovoyi dispersiyi na skladovi obumovleni nezalezhnimi faktorami Kozhna z cih skladovih ye ocinkoyu dispersiyi generalnoyi sukupnosti Shob dati ocinku diyevosti vplivu danogo faktoru neobhidno ociniti znachimist vidpovidnoyi vibirkovoyi dispersiyi u porivnyanni z dispersiyeyu vidtvorennya obumovlenoyu vipadkovimi faktorami Perevirka znachimosti ocinok dispersiyi provodyat z dopomogoyu kriteriyu Fishera Koli rozrahunkove znachennya kriteriyu Fishera viyavitsya menshim tablichnogo to vpliv doslidzhuvanogo faktoru nemaye pidstav vvazhati znachimim Koli zh rozrahunkove znachennya kriteriyu Fishera viyavitsya bilshim tablichnogo to cej faktor vplivaye na zmini serednih V podalshomu mi vvazhayemo sho vikonuyutsya nastupni pripushennya Vipadkovi pomilki sposterezhen mayut normalnij rozpodil Faktori vplivayut tilki na zminu serednih znachen a dispersiya sposterezhen zalishayetsya postijnoyu Faktori sho rozglyadayutsya v dispersijnomu analizi buvayut troh rodiv z vipadkovimi rivnyami koli vibir rivniv prohodit z bezmezhnoyi sukupnosti mozhlivih rivniv ta suprovodzhuyetsya randomizaciyeyu i rivni vibirayutsya vipadkovim chinom z fiksovanimi rivnyami zmishanogo tipu chastina faktoriv rozglyadayetsya na fiksovanih rivnyah ale rivni reshti vibirayutsya vipadkovim chinom Dispersijnij analiz zastosovuyetsya v riznih formah v zalezhnosti vid strukturi ob yektu sho doslidzhuyetsya vibir vidpovidnoyi formi ye odniyeyu z golovnih trudnostej v praktichnomu zastosuvanni analizu Odnofaktornij dispersijnij analizSyudi perenapravlyayetsya zapit Odnofaktornij dispersijnij analiz Na cyu temu potribna okrema stattya Rozglyadayetsya diya odinichnogo faktoru A kilkisnogo chi yakisnogo kotrij prijmaye k riznih znachen rivniv faktora Najprostishi rozrahunki vihodyat pri rivnij kilkosti doslidiv na kozhnomu rivni faktora A Vhidni dani dlya odnofaktornogo dispersijnogo analizu z rivnim chislom paralelnih doslidiv Nomer doslidu Rivni faktoru A displaystyle A a 1 displaystyle a 1 a 2 displaystyle a 2 displaystyle a k displaystyle a k 1 y 11 displaystyle y 11 y 12 displaystyle y 12 displaystyle y 1 k displaystyle y 1k 2 y 21 displaystyle y 21 y 22 displaystyle y 22 displaystyle y 2 k displaystyle y 2k n y n 1 displaystyle y n1 y n 2 displaystyle y n2 y n k displaystyle y nk Dispersijnij analiz mozhna provesti za nastupnim algoritmom Obchisliti sumi za stovpcyami A i j 1 n y j i displaystyle A i sum limits j 1 n y ji sumu kvadrativ usih doslidiv S S 1 i 1 k j 1 n y i j 2 displaystyle S S 1 sum limits i 1 k sum limits j 1 n y ij 2 sumu kvadrativ sum za stovpcyami podilenu na chislo doslidiv v stovpci S S 2 1 n i 1 k A i 2 displaystyle S S 2 frac 1 n sum limits i 1 k A i 2 kvadrat zagalnoyi sumi podilenij na chislo vsih doslidiv korektuyuchij chlen S S 3 1 N i 1 k A i 2 displaystyle S S 3 frac 1 N left sum limits i 1 k A i right 2 sumu kvadrativ dlya stovpchika S S A S S 2 S S 3 displaystyle S S A S S 2 S S 3 zagalnu sumu kvadrativ rivnu riznici mizh sumoyu kvadrativ vsih doslidiv ta korektuyuchim chlenom S S z a g S S 1 S S 3 displaystyle S S zag S S 1 S S 3 zalishkovu sumu kvadrativ dlya ocinki pomilki eksperimentu S S z a l S S 1 S S 2 displaystyle S S zal S S 1 S S 2 dispersiyu s A 2 displaystyle s A 2 s p o m 2 S S A k 1 displaystyle s pom 2 frac S S A k 1 dispersiyu s p o m 2 displaystyle s pom 2 s p o m 2 S S z a l k n 1 displaystyle s pom 2 frac S S zal k left n 1 right Rezultati rozrahunkiv predstaviti u viglyadi tablici dispersnogo analizu Vihidni dani dlya odnofaktornogo dispersijnogo analizu z rivnim chislom paralelnih doslidiv Dzherelo dispersiyi Chislo stupeniv vilnosti Suma kvadrativ Serednij kvadrat Matematichne spodivannya serednogo kvadratu A displaystyle A k 1 displaystyle k 1 S S A displaystyle S S A s A 2 displaystyle s A 2 n s A 2 s p o m 2 displaystyle n sigma A 2 sigma pom 2 Zalishok k n 1 displaystyle k left n 1 right S S z a l displaystyle S S zal s p o m 2 displaystyle s pom 2 s p o m 2 displaystyle sigma pom 2 Zagalna suma k n 1 displaystyle kn 1 S S z a g displaystyle S S zag S S z a g k n 1 displaystyle frac S S zag kn 1 Yaksho s A 2 s p o m 2 F 1 p displaystyle frac s A 2 s pom 2 leq F 1 p to vpliv faktora A displaystyle A slid vvazhati neznachnim Pri comu zagalna dispersiya s 2 displaystyle s 2 pov yazana tilki z faktorom vipadkovosti i mozhe sluzhiti ocinkoyu dlya dispersiyi vidtvorennya Taka ocinka krasha vid s p o m 2 displaystyle s pom 2 bo maye bilshe chislo stupeniv vilnosti Yaksho zh spravedliva nerivnist s A 2 s p o m 2 gt F 1 p f 1 f 2 displaystyle frac s A 2 s pom 2 gt F 1 p left f 1 f 2 right de f 1 k 1 displaystyle f 1 k 1 ta f 2 k n 1 N k displaystyle f 2 k left n 1 right N k riznicya mizh dispersiyami s A 2 displaystyle s A 2 ta s p o m 2 displaystyle s pom 2 znachna i vidpovidno znachnij vpliv faktora A displaystyle A Dvofaktornij dispersijnij analizDetalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en Cej rozdil statti she ne napisano Vi mozhete dopomogti proyektu napisavshi jogo lipen 2021 Div takozhTest Levene Pasivnij eksperimentDzherelaKartashov M V Imovirnist procesi statistika Kiyiv VPC Kiyivskij universitet 2007 504 s Dispersijnij analiz nedostupne posilannya z lipnya 2019 Lvivska politehnika Dispersijnij analiz Geostatistika 14 grudnya 2017 u Wayback Machine Lvivskij nacionalnij universitet imeni Ivana Franka Ce nezavershena stattya z matematiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi