Тест Куйпера використовується в статистиці для перевірки того чи даний розподіл, або сімейство розподілів, не має підстав у вибірці даних. Названий на честь голландського математика [en].
Тест Куйпера тісно пов'язаний з більш відомим тестом Колмогорова – Смирнова (або як його часто називають КС тестом). Як і у випадку з тестом КС, статистика розбіжностей D+ і D— позначає абсолютні значення найбільших позитивних і найбільших негативних похибок між двома порівнюваними функціями розподілу. Хитрість тесту Куйпера полягає у використанні величини D+ + D— як тестової статистики. Ця невеличка зміна робить тест Куйпера настільки ж чутливим у хвостах як в медіані, а також робить його інваріантним до циклічних перетворень незалежної змінної. Тест Андерсона-Дарлінга - інший тест, що забезпечує однакову чутливість в хвостах і медіані, проте він не гарантує циклічної інваріантності.
Ця інваріантність до циклічних перетворень робить тест Куйпера неоціненним при тестуванні циклічних варіацій за часом року або днем тижня або часу доби, і взагалі для тестування відповідності і відмінностей між кільцевими розподілами ймовірностей .
Означення
Тестова статистика, V, тесту Куйпера визначена так: нехай F неперервна функція розподілу, яку приймають за нульову гіпотезу. Позначимо вибірку даних, що є незалежними реалізаціями випадкових величин, з функцією розподілу F, xi (i=1,...,n). Далі визначають
і, нарешті,
Таблиці критичних значень тестової статистики доступні і до них належать деякі випадки, коли тестований розподіл цілком не відомий, тож параметри сімейства розподілів оцінюють.
Якщо тестована гіпотеза правильна, то статистика прямує до розподілу:
.
Аби зменшити залежність розподілу статистики від розміру вибірки, можна в критерії використовувати модифікацію статистики вигляду
,
чи модифікацію статистики типу
.
У першому випадку розбіжностями між розподілом статистики від граничного розподілу можна знехтувати при , у другому — при .
При перевірці простих гіпотез критерій не залежить від розподілу, тобто не залежить від типу тестованого розподілу.
Гіпотезу відхиляють при великих значеннях статистики.
Приклад
Спробуємо перевірити гіпотезу, що комп'ютери ламаються частіше в певний проміжок в році ніж решту часу. Щоб перевірити це, потрібно зібрати дати коли комп'ютери ламаються і побудувати емпіричну функцію розподілу. Тоді нульова гіпотеза полягає в тому, що невдачі є рівномірно розподіленими. Статистика Куйпера не змінюється, якщо ми змінюємо початок року і для нього не потрібно групувати несправності за місяцями чи щось такого штибу. Ще один приклад тестової статистики з такою ж властивістю статистика Уотсона, яка пов'язана з тестом Крамера–фон Мізеса.
Однак, якщо збої стаються в основному у вихідні, багато тестів рівномірного розподілу, такі як K-С і Куйпера б не здатні цього виявити, оскільки вихідні трапляються протягом року. Ця неможливість відрізнити гребінце-подібні розподіли від неперервного рівномірного розподілу -- є наріжною проблемою статистистик варіацій К-С тесту. Тест Куйпера, застосований до часових подій з модулем один тиждень здатний виявити таку закономірність. Застосовуючи до промодулювані в часі подій К-С тест може дати різні результати, в залежності від фазування даних. У такому прикладі К-С тест може виявляти нерівномірність вибірки даних, якщо починати тиждень в суботу, але не в змозі виявити нерівномірність, якщо вважати початком тижня середу.
Див. також
Джерела
- (1960). Tests concerning random points on a circle. Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen, Series A. 63: 38—47. (англ.)
- Pearson, E.S., Hartley, H.O. (1972) Biometrika Tables for Statisticians, Volume 2, CUP. (page 118)
- Pearson, E.S., Hartley, H.O. (1972) Biometrika Tables for Statisticians, Volume 2, CUP. (Table 54)
- Stephens M. A. EDF statistics for goodness of fit and some comparisons // J. American Statistic. Association. 1974. V. 69. N 347. P. 730—737. (англ.)
- Лемешко Б. Ю., Горбунова А. А. О применении и мощности непараметрических критериев согласия Купера, Ватсона и Жанга // Измерительная техника. 2013. № 5. — С.3-9. (рос.)
- Watson, G.S. (1961) "Goodness-Of-Fit Tests on a Circle", [en], 48 (1/2), 109–114 JSTOR 2333135
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Nemaye perevirenih versij ciyeyi storinki jmovirno yiyi she ne pereviryali na vidpovidnist pravilam proektu Test Kujpera vikoristovuyetsya v statistici dlya perevirki togo chi danij rozpodil abo simejstvo rozpodiliv ne maye pidstav u vibirci danih Nazvanij na chest gollandskogo matematika Nikolasa Kojpera en 1 Test Kujpera tisno pov yazanij z bilsh vidomim testom Kolmogorova Smirnova abo yak jogo chasto nazivayut KS testom Yak i u vipadku z testom KS statistika rozbizhnostej D i D poznachaye absolyutni znachennya najbilshih pozitivnih i najbilshih negativnih pohibok mizh dvoma porivnyuvanimi funkciyami rozpodilu Hitrist testu Kujpera polyagaye u vikoristanni velichini D D yak testovoyi statistiki Cya nevelichka zmina robit test Kujpera nastilki zh chutlivim u hvostah yak v mediani a takozh robit jogo invariantnim do ciklichnih peretvoren nezalezhnoyi zminnoyi Test Andersona Darlinga inshij test sho zabezpechuye odnakovu chutlivist v hvostah i mediani prote vin ne garantuye ciklichnoyi invariantnosti Cya invariantnist do ciklichnih peretvoren robit test Kujpera neocinennim pri testuvanni ciklichnih variacij za chasom roku abo dnem tizhnya abo chasu dobi i vzagali dlya testuvannya vidpovidnosti i vidminnostej mizh kilcevimi rozpodilami jmovirnostej Zmist 1 Oznachennya 2 Priklad 3 Div takozh 4 DzherelaOznachennyared nbsp Ilyustraciya dvovimirnoyi statistiki testu Kujpera Kozhna z chervonih i sinih linij vidpovidaye empirichnij funkciyi rozpodilu a chorni strilki pokazuyut vidstani tochok yaki skladayut statistiku Kujpera Testova statistika V testu Kujpera viznachena tak nehaj F neperervna funkciya rozpodilu yaku prijmayut za nulovu gipotezu Poznachimo vibirku danih sho ye nezalezhnimi realizaciyami vipadkovih velichin z funkciyeyu rozpodilu F xi i 1 n Dali viznachayut 2 D m a x i n F x i displaystyle D mathrm max left i n F x i right nbsp D m a x F x i i 1 n displaystyle D mathrm max left F x i i 1 n right nbsp i nareshti V D D displaystyle V D D nbsp Tablici kritichnih znachen testovoyi statistiki dostupni 3 i do nih nalezhat deyaki vipadki koli testovanij rozpodil cilkom ne vidomij tozh parametri simejstva rozpodiliv ocinyuyut Yaksho testovana gipoteza pravilna to statistika n V n displaystyle sqrt n V n nbsp pryamuye do rozpodilu 1 G v 1 m 1 2 4 m 2 v 2 1 e 2 m 2 v 2 displaystyle G v 1 sum m 1 infty 2 4m 2 v 2 1 e 2m 2 v 2 nbsp Abi zmenshiti zalezhnist rozpodilu statistiki vid rozmiru vibirki mozhna v kriteriyi vikoristovuvati modifikaciyu statistiki viglyadu 4 V V n n 0 155 0 24 n displaystyle V V n left sqrt n 0 155 0 24 sqrt n right nbsp chi modifikaciyu statistiki tipu 5 V n m o d n D n D n 1 3 n displaystyle V n mod sqrt n left D n D n right 1 3 sqrt n nbsp U pershomu vipadku rozbizhnostyami mizh rozpodilom statistiki vid granichnogo rozpodilu mozhna znehtuvati pri n gt 20 displaystyle n gt 20 nbsp u drugomu pri n gt 30 displaystyle n gt 30 nbsp Pri perevirci prostih gipotez kriterij ne zalezhit vid rozpodilu tobto ne zalezhit vid tipu testovanogo rozpodilu Gipotezu vidhilyayut pri velikih znachennyah statistiki Prikladred Sprobuyemo pereviriti gipotezu sho komp yuteri lamayutsya chastishe v pevnij promizhok v roci nizh reshtu chasu Shob pereviriti ce potribno zibrati dati koli komp yuteri lamayutsya i pobuduvati empirichnu funkciyu rozpodilu Todi nulova gipoteza polyagaye v tomu sho nevdachi ye rivnomirno rozpodilenimi Statistika Kujpera ne zminyuyetsya yaksho mi zminyuyemo pochatok roku i dlya nogo ne potribno grupuvati nespravnosti za misyacyami chi shos takogo shtibu 1 6 She odin priklad testovoyi statistiki z takoyu zh vlastivistyu statistika Uotsona 2 6 yaka pov yazana z testom Kramera fon Mizesa Odnak yaksho zboyi stayutsya v osnovnomu u vihidni bagato testiv rivnomirnogo rozpodilu taki yak K S i Kujpera b ne zdatni cogo viyaviti oskilki vihidni traplyayutsya protyagom roku Cya nemozhlivist vidrizniti grebince podibni rozpodili vid neperervnogo rivnomirnogo rozpodilu ye narizhnoyu problemoyu statististik variacij K S testu Test Kujpera zastosovanij do chasovih podij z modulem odin tizhden zdatnij viyaviti taku zakonomirnist Zastosovuyuchi do promodulyuvani v chasi podij K S test mozhe dati rizni rezultati v zalezhnosti vid fazuvannya danih U takomu prikladi K S test mozhe viyavlyati nerivnomirnist vibirki danih yaksho pochinati tizhden v subotu ale ne v zmozi viyaviti nerivnomirnist yaksho vvazhati pochatkom tizhnya seredu Div takozhred Test Kolmogorova SmirnovaDzherelared a b v Kuiper N H 1960 Tests concerning random points on a circle Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen Series A 63 38 47 angl a b Pearson E S Hartley H O 1972 Biometrika Tables for Statisticians Volume 2 CUP ISBN 0 521 06937 8 page 118 Pearson E S Hartley H O 1972 Biometrika Tables for Statisticians Volume 2 CUP ISBN 0 521 06937 8 Table 54 Stephens M A EDF statistics for goodness of fit and some comparisons J American Statistic Association 1974 V 69 N 347 P 730 737 angl Lemeshko B Yu Gorbunova A A O primenenii i moshnosti neparametricheskih kriteriev soglasiya Kupera Vatsona i Zhanga Izmeritelnaya tehnika 2013 5 S 3 9 ros a b Watson G S 1961 Goodness Of Fit Tests on a Circle Biometrika en 48 1 2 109 114 JSTOR 2333135 Otrimano z https uk wikipedia org wiki Test Kujpera