Критерій узгодженості Пірсона — один з найвідоміших критеріїв , тому його часто і називають просто «критерій хі-квадрат». Використовується для перевірки гіпотези про закон розподілу.
Ґрунтується на групованих даних. Область значень передбачуваного розподілу ділять на деяке число інтервалів.
Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей потрапляння в інтервали групування й емпіричних частот.
Нехай X=(X1,…, Xn) — вибірка з розподілу . Перевіряється проста гіпотеза проти складної альтернативи .
Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом .
Позначимо для j=1,…,k через число елементів вибірки, що потрапили в інтервал :
,
і через — теоретичну ймовірність попадання в інтервал випадкової величини з розподілом .
З необхідністю, .
Як правило, довжини інтервалів вибирають так, щоб .
Нехай (1).
Зауваження
Якщо розподіл вибірки має такі ж, як в , імовірності попадання в кожний з інтервалів , то по даній функції ці розподіли розрізнити неможливо.
Тому насправді критерій, який ми побудуємо по функції з (1), вирішує зовсім інше завдання. А саме, нехай заданий набір імовірностей такий, що . Критерій призначений для перевірки складної гіпотези H2'={розподіл Х1 має властивість: Р(Х1 ∈ Аj)=pj для всіх j=1,…,k} проти складної альтернативи H2'={H1' невірна}, тобто H2'={хоча б для одного з інтервалів ймовірність P(X1 ∈ Аj) відізняється від pj}
Правило критерію
Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область.
Правило. Якщо отримана статистика перевищує квантиль розподілу заданого рівня значимості з або з ступенями вільності, де k — число спостережень або число інтервалів (для випадку інтервального варіаційного ряду), а p — число оцінюваних параметрів закону розподілу, то гіпотеза відкидається. А якщо ні, то гіпотеза приймається на заданому рівні значимості . |
Теорема Пірсона
Якщо вірна гіпотеза H1', то при фіксованому k й при :
де, нагадаємо, є -розподіл зі ступенем вільності.
Зауваження
Насправді критерій застосовують і для розв'язку первісного завдання про перевірку гіпотези . Необхідно тільки пам'ятати, що цей критерій недостатній для альтернатив з тими ж імовірностями попадання в інтервали розбиття, що й в . Тому беруть велику кількість інтервалів розбиття — чим більше, тим краще, щоб «зменшити» число альтернатив, нерозрізнених з передбачуваним розподілом.
Критерій Пірсона для перевірки параметричної гіпотези
Критерій часто застосовують для перевірки гіпотези про вид розподілу, тобто про приналежність розподілу вибірки деякому параметричному сімейству. Є вибірка з невідомого розподілу .
Перевіряється складна гіпотеза: ,
де — невідомий параметр (скалярний або векторний), l- його розмірність.
Нехай розбите на k>lінтервалів , і — число елементів вибірки, що потрапили в. Але ймовірність тепер залежить від невідомого параметра .
Функція відхилення (1) також залежить від невідомого параметра, і використовувати її в критерії Пірсона не можна — ми не можемо обчислити її значення: (2.)
Нехай - значення параметра , що доставляє мінімум функції при даній вибірці X .
Підставивши замість дійсних імовірностей pjїх оцінки , одержимо функцію відхилення:.
Див. також
Джерела
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Гнеденко Б. В. Курс теории вероятностей. — 6-е изд. — Москва : Наука, 1988. — 446 с.(рос.)
- Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)
- Кендалл М., Стюарт А. Статистические выводы и связи. — М.: Наука, Физматлит. — 1973. — 899 с. (рос.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Kriterij uzgodzhenosti Pirsona odin z najvidomishih kriteriyiv x 2 displaystyle chi 2 tomu jogo chasto i nazivayut prosto kriterij hi kvadrat Vikoristovuyetsya dlya perevirki gipotezi pro zakon rozpodilu Gruntuyetsya na grupovanih danih Oblast znachen peredbachuvanogo rozpodilu ϝ 1 displaystyle digamma 1 dilyat na deyake chislo intervaliv Pislya chogo buduyut funkciyu vidhilennya r po riznicyah teoretichnih imovirnostej potraplyannya v intervali grupuvannya j empirichnih chastot Nehaj X X1 Xn vibirka z rozpodilu ϝ displaystyle digamma Pereviryayetsya prosta gipoteza H 1 ϝ ϝ 1 displaystyle H 1 digamma digamma 1 proti skladnoyi alternativi H 2 ϝ ϝ 1 displaystyle H 2 digamma neq digamma 1 Nehaj A1 Ak intervali grupuvannya v oblasti znachen vipadkovoyi velichini z rozpodilom ϝ 1 displaystyle digamma 1 Poznachimo dlya j 1 k cherez n j displaystyle nu j chislo elementiv vibirki sho potrapili v interval A j displaystyle A j n j X i A j i 1 n I X i A j displaystyle nu j X i in A j sum i 1 n I X i in A j i cherez p j gt 0 displaystyle p j gt 0 teoretichnu jmovirnist P H 1 X 1 A j displaystyle P H1 X 1 in A j popadannya v interval A j displaystyle A j vipadkovoyi velichini z rozpodilom ϝ 1 displaystyle digamma 1 Z neobhidnistyu p 1 p k 1 displaystyle p 1 p k 1 Yak pravilo dovzhini intervaliv vibirayut tak shob p 1 p k 1 k displaystyle p 1 p k frac 1 k Nehaj r X j 1 k n j n p j 2 n p j displaystyle rho X sum j 1 k frac nu j np j 2 np j 1 ZauvazhennyaYaksho rozpodil vibirki ϝ 2 ϝ 1 displaystyle digamma 2 neq digamma 1 maye taki zh yak v ϝ 1 displaystyle digamma 1 imovirnosti p j displaystyle p j popadannya v kozhnij z intervaliv A l displaystyle A l to po danij funkciyi r displaystyle rho ci rozpodili rozrizniti nemozhlivo Tomu naspravdi kriterij yakij mi pobuduyemo po funkciyi r displaystyle rho z 1 virishuye zovsim inshe zavdannya A same nehaj zadanij nabir imovirnostej p 1 p k displaystyle p 1 p k takij sho p 1 p k 1 displaystyle p 1 p k 1 Kriterij x 2 displaystyle chi 2 priznachenij dlya perevirki skladnoyi gipotezi H2 rozpodil H1 maye vlastivist R H1 Aj pj dlya vsih j 1 k proti skladnoyi alternativi H2 H1 nevirna tobto H2 hocha b dlya odnogo z intervaliv jmovirnist P X1 Aj vidiznyayetsya vid pj Pravilo kriteriyuPered tim yak sformulyuvati pravilo prijnyattya abo vidkidannya gipotezi neobhidno vrahuvati sho kriterij Pirsona maye pravobichnu kritichnu oblast Pravilo Yaksho otrimana statistika perevishuye kvantil rozpodilu x 2 displaystyle chi 2 zadanogo rivnya znachimosti a displaystyle alpha z k 1 displaystyle k 1 abo z k p 1 displaystyle k p 1 stupenyami vilnosti de k chislo sposterezhen abo chislo intervaliv dlya vipadku intervalnogo variacijnogo ryadu a p chislo ocinyuvanih parametriv zakonu rozpodilu to gipoteza H 0 displaystyle H 0 vidkidayetsya A yaksho ni to gipoteza prijmayetsya na zadanomu rivni znachimosti a displaystyle alpha Teorema PirsonaYaksho virna gipoteza H1 to pri fiksovanomu k j pri n displaystyle n to infty r X j 1 k n j n p j 2 n p j H k 1 displaystyle rho X sum j 1 k frac nu j np j 2 np j Rightarrow H k 1 de nagadayemo H k 1 displaystyle H k 1 ye x 2 displaystyle chi 2 rozpodil zi k 1 displaystyle k 1 stupenem vilnosti ZauvazhennyaNaspravdi kriterij x 2 displaystyle chi 2 zastosovuyut i dlya rozv yazku pervisnogo zavdannya pro perevirku gipotezi H 1 ϝ ϝ 1 displaystyle H 1 digamma digamma 1 Neobhidno tilki pam yatati sho cej kriterij nedostatnij dlya alternativ z timi zh imovirnostyami popadannya v intervali rozbittya sho j v ϝ 1 displaystyle digamma 1 Tomu berut veliku kilkist intervaliv rozbittya chim bilshe tim krashe shob zmenshiti chislo alternativ nerozriznenih z peredbachuvanim rozpodilom Kriterij Pirsona dlya perevirki parametrichnoyi gipoteziKriterij x 2 displaystyle chi 2 chasto zastosovuyut dlya perevirki gipotezi pro vid rozpodilu tobto pro prinalezhnist rozpodilu vibirki deyakomu parametrichnomu simejstvu Ye vibirka X X 1 X n displaystyle X X 1 X n z nevidomogo rozpodiluϝ displaystyle digamma Pereviryayetsya skladna gipoteza H 1 ϝ ϝ 8 displaystyle H 1 digamma in digamma theta de 8 ϵ 8 R l displaystyle theta epsilon Theta subseteq mathbb R l nevidomij parametr skalyarnij abo vektornij l jogo rozmirnist Nehaj R displaystyle mathbb R rozbite na k gt lintervaliv A 1 A k displaystyle A 1 cup cup A k i n j displaystyle nu j chislo elementiv vibirki sho potrapili vA j displaystyle A j Ale jmovirnist p j P H 1 X 1 A j p j 8 displaystyle p j P H1 X 1 in A j p j theta teper zalezhit vid nevidomogo parametra Funkciya vidhilennya 1 takozh zalezhit vid nevidomogo parametra i vikoristovuvati yiyi v kriteriyi Pirsona ne mozhna mi ne mozhemo obchisliti yiyi znachennya r X 8 j 1 k n j n p j 8 2 n p j 8 displaystyle rho X theta sum j 1 k frac nu j np j theta 2 np j theta 2 Nehaj 8 8 X displaystyle hat theta hat theta X znachennya parametra 8 displaystyle theta sho dostavlyaye minimum funkciyi r X 8 displaystyle rho X theta pri danij vibirci X Pidstavivshi zamist dijsnih imovirnostej pjyih ocinki p j 8 displaystyle p j hat theta oderzhimo funkciyu vidhilennya r X 8 j 1 k n j n p j 8 2 n p j 8 displaystyle rho X hat theta sum j 1 k frac nu j np j hat theta 2 np j hat theta Div takozhKriterij uzgodzhenosti KolmogorovaDzherelaKartashov M V Imovirnist procesi statistika Kiyiv VPC Kiyivskij universitet 2007 504 s Gnedenko B V Kurs teorii veroyatnostej 6 e izd Moskva Nauka 1988 446 s ros Gihman I I Skorohod A V Yadrenko M V Teoriya veroyatnostej i matematicheskaya statistika Kiyiv Visha shkola 1988 436 s ros Kendall M Styuart A Statisticheskie vyvody i svyazi M Nauka Fizmatlit 1973 899 s ros