Перевірка статистичних гіпотез — клас базових задач в математичній статистиці, що полягають у перевірці статистичних гіпотез на основі даних спостереження за процесом, який моделюється за допомогою множини випадкових величин. Перевірка статистичних гіпотез є методом статистичного висновування.
Альтернативний метод перевірки статистичних гіпотез полягає у визначенні множини статистичних моделей, по одній для кожної гіпотези кандидата, після чого використовуються техніки відбору моделі, аби вибрати ту, яка підходить найбільше. Найбільш загальні техніки відбору моделей основані на інформаційному критерії Акаіке або коефіцієнті Баєса.
Протилежністю такого аналізу вибірки може бути розвідувальний аналіз вибірки, який може не мати наперед визначених гіпотез.
Статистичні гіпотези не слід плутати із науковими гіпотезами. Наукові гіпотези прагнуть дати пояснення природним явищам, в той час як статистичні гіпотези зазвичай використовують для встановлення факту існування зв'язку (або його відсутність) між вибірками даних. Таким прикладом є методи медичного лікування, де статистична гіпотеза використовується як спроба ілюстрації, з мірою статистичної значимості, чи ліки діють краще за плацебо. Наукова гіпотеза потім шукатиме пояснення результатів, незалежно від результатів перевірки статистичної гіпотези.
Статистичні гіпотези
Визначення
Нехай у (статистичному) експерименті спостерігається реалізація деякої випадкової величини , розподіл якої є невідомим повністю чи частково. Тоді будь-яке твердження, що стосується , називається статистичною гіпотезою. Гіпотези розрізняються за видом припущень, що містяться в них:
- Статистичну гіпотезу, що однозначно визначає розподіл , тобто, , де якийсь конкретний закон, називають простою.
- Статистична гіпотеза, що стверджує, що розподіл належить до деякої сім'ї розподілів, тобто , де — сім'я розподілів, називається складною.
На практиці зазвичай потрібно перевірити якусь конкретну і, як правило, просту гіпотезу . Таку гіпотезу прийнято називати нульовою. При цьому паралельно розглядається гіпотеза, що суперечить їй , що називається конкуруючою або [en].
Висунута гіпотеза потребує перевірки, яка здійснюється статистичними методами, тому гіпотезу називають статистичною. Для перевірки гіпотези використовують критерії, що дозволяють прийняти або спростувати гіпотезу.
В більшості випадків статистичні критерії засновані на випадковій вибірці фіксованого об'єму з розподілу . У послідовному аналізі вибірка формується в ході самого експерименту і тому її об'єм є випадковою величиною.
Приклад
Нехай дано незалежну вибірку з нормального розподілу, де — невідомий параметр. Тоді , де — фіксована стала, є простою гіпотезою, а альтернативна до неї — складною.
Визначення термінів
Наступні визначення термінів в основному взяті із тлумачень в книзі Леманна і Романо:
- Статистична гіпотеза
- Твердження щодо параметрів, які описують сукупність (не вибірку).
- Статистика
- Значення розраховане із вибірки, що часто підсумовують вибірку з метою порівняння.
- Проста гіпотеза
- Будь-яка гіпотеза яка повністю визначає розподіл сукупності.
- Складна гіпотеза
- Будь-яка гіпотеза, яка не визначає розподіл сукупності повністю.
- Нульова гіпотеза (H0)
- Гіпотеза, що суперечить теоретичному припущенню, яке необхідно довести.
- Успішні дані
- Дані, які дозволяють досліднику відкинути нульову гіпотезу.
- [en] (H1)
- Гіпотеза (як правило складна) пов'язана із теорію, яку бажають підтвердити.
- Статистична перевірка (випробування, тест)
- Процедура, входами якої є вибірки, а результатом гіпотеза.
- Область прийняття
- Множина значень тестової статистики для яких не виходить відкинути нульову гіпотезу.
- Область відкидання / Критична область
- Множина значень тестової статистики, для яких нульова гіпотеза відкидається.
- [en]
- Порогове значення, яке розмежовує область прийняття і відкидання для тестової статистики.
- Потужність випробування (1 − β)
- Імовірність для випробування, що визначає правильність відкидання нульової гіпотези. Доповнення до хибнонегативної частоти, β. Потужність називається чутливістю в області біостатистики. («Ця перевірка є перевіркою на чутливість, оскільки результат є негативним, можна із упевненістю зробити висновок, що пацієнт не має цього стану.») Див. Чутливість і специфічність і Помилки першого і другого роду за більш вичерпними визначеннями.
- [en] випробування
- Для простої гіпотези це імовірність неправильного відкидання нульової гіпотези при випробуванні. Хибнопозитивна частота. Для складних гіпотез це супремум імовірності відкидання нульової гіпотези по всім випадках, які покриває нульова гіпотеза. В біостатистиці доповнення до хибнопозитивної частоти називається специфічністю. («Це є специфічною перевіркою, оскільки при позитивному результаті ми можемо з упевненістю зробити висновок, що пацієнт має цей стан.») Див. Чутливість і специфічність і Помилки першого і другого роду за більш вичерпними визначеннями.
- Рівень значимості тесту (α)
- Це верхня межа накладається на розмір випробування. Це значення, яке обирає статист перед тим як вивчити дані або обрати будь-який спосіб перевірки, який застосувати. Це максимальний показник помилкового відхилення H0, який дослідник готовий допустити. Перевірка H0 на рівні значимості α означає перевірку H0, при якій розмір випробування не перевищує α. В більшості випадків, використовують випробування розмір якого дорівнює рівню значимості.
- p-значення
- Ймовірність, припущення, що нульова гіпотеза є вірною, спостереження результату близького до такого екстремуму що відповідає статистиці тесту.
- Статистична значимість тесту
- попередник перевірки статистичних гіпотез. Результат експерименту вважався статистично значущим, якщо вибірка була достатньо несумісною із (нульовою) гіпотезою. Це по різному розглядали у загальному сенсі, прагматична евристика для встановлення значущості експериментальних результатів, конвенція, яка встановлювала порогове значення статистичного доведення або метод для отримання висновків із даних. Метод перевірки статистичних гіпотез додав цьому математичної суворості і філософську послідовність поняттю, зробивши альтернативну гіпотезу однозначною. Цей термін тепер використовується здебільшого для описання сучасної версії, яка тепер є частиною перевірки статистичних гіпотез.
Етапи перевірки статистичних гіпотез
- Формулювання основної гіпотези і [en] . Гіпотези повинні бути чітко формалізовані в математичних термінах.
- Задання достовірності , що називається рівнем значущості і що відповідає помилкам першого роду, на якому надалі і буде зроблений висновок про правдивість гіпотези.
- Розрахунок статистики критерію такий, що:
- її величина залежить від початкової вибірки ;
- за її значенням можна зробити висновки про істинність гіпотези ;
- сама статистика повинна підкорятися якомусь невідомому закону розподілу, так як сама є випадковою в силу випадковості .
- Побудова критичної області. З області значень виділяємо підмножину таких значень, за якими можна судити про суттєвість розбіжностей з припущенням. Її розмір вибирається таким чином, щоб виконувалась рівність . Ця множина і називається критичною областю.
- Висновок про істинність гіпотези. Спостережувані значення вибірки підставляються в статистику і за попаданням (або непопаданням) у критичну область виноситься ухвала про відкидання (або ухвалення) висунутої гіпотези .
Види критичної області
- Двобічна критична область визначається двома інтервалами , де знаходять з умов .
- Лівобічна критична область визначається інтервалом , де знаходять з умови .
- Правобічна критична область визначається інтервалом , де знаходять з умови .
Приклади
Співвідношення статей народжуваних людей
Одне із найперших застосувань статистичної перевірки гіпотез присвячувалося дослідженню питання: чи є однаково імовірним [en] (як нульової гіпотези), яке вивчав [en] в 1700-х роках, а згодом П'єр-Симон Лаплас (в 1770-х).
Арбутнот дослідив записи про народження дітей в Лондоні від 1629 до 1710 (всього за 82 роки), і застосував [en], просту [en]. В кожному із досліджених років, кількість народжених хлопчиків, перевищувала кількість народжених дівчаток. Розглядаючи рівноймовірним народження більшої кількості чоловіків або більшої кількості жінок, імовірність спостережуваного результату складала 0.582, або близько 1 до 4,8360,0000,0000,0000,0000,0000; в сучасних термінах, це є p-значенням. Що є неймовірно малим, після чого Арбутнот зробив висновок, що це не є випадковістю, а божим провидінням: «Звідки випливає, що цим процесом керує Провидіння, а не Випадок (англ. From whence it follows, that it is Art, not Chance, that governs)». Кажучи більш сучасними термінами, він відкинув нульову гіпотезу щодо рівності шансів народження хлопчика чи дівчинки із рівнем значимості p = 1/282.
Лаплас дослідив статистику майже половини мільйона народжень. Статистика показала більшу кількість народжуваних хлопчиків ніж дівчаток. Розрахувавши p-значення, він зробив висновок, що ця перевага у кількості є об'єктивним явищем, а не випадковістю.
Леді дегустує чай
В одному із відомих прикладів перевірки статистичної гіпотези під назвою Леді дегустує чай доктор біології [en], яка працювала як і Рональд Фішер у [en], стверджувала, що вона здатна визначити, як було приготовано чай з молоком, а саме, спочатку налили у філіжанку чай або молоко. Фішер запропонував налити їй на пробу вісім філіжанок чаю у випадковому порядку, по чотири із кожним варіантом. Було поставлене питання, з якою імовірністю випадковим чином її відповідь буде вдалою. Нульова гіпотеза передбачала, що леді не має здатності відрізнити чай. Тест полягав у простому підрахунку кількість вдалих спроб із вибраних 4 чашок чаю. Критичним інтервалом був єдиний випадок із 4 вдалих вгадувань із 4 можливих, що базувався на традиційному критерії імовірності (< 5 %). Випадок із 4 вгадуваннями відповідає 1 із 70 можливих комбінацій (p ≈ 1,4 %). Фішер стверджував, що ніякої альтернативної гіпотези не потрібно. Леді вірно визначила кожну чашку, що вважалося статистично значимим результатом.
Судочинство
Процедуру статистичної перевірки можна порівняти із законами правосуддя; обвинувачений вважається невинним, доки його чи її вина не доведена. Прокурор намагається довести вину обвинуваченого. І лише тоді, коли доказів для обвинувачення буде достатньо, обвинувачений буде засуджений.
На початку процедури, існує дві гіпотези: стверджує, що «обвинувачений є невинним», і — «обвинувачений є винним». Перша гіпотеза — , називається нульовою гіпотезою, і вона визнається на початковому етапі. Друга, , називається альтернативною гіпотезою. Це та альтернативна гіпотеза, яку ми намагаємося довести або заперечити.
Гіпотеза про невинуватість буде відкинута лише тоді, коли помилка стане малоймовірною, оскільки небажано засуджувати невинного обвинувачуваного. Така помилка називається помилкою першого роду (тобто, засудження невинної особи), контролюють, аби ця помилка була невеликою. Наслідком такої асиметричної поведінки є більше поширення помилок другого роду (виправдання особи, яка вчинила злочин).
H0 вірна Дійсно не винний | H1 вірна Дійсно винний | |
---|---|---|
Прийняття нульової гіпотези Виправдання | Вірне рішення | Невірне рішення Помилка II роду |
Відкидання нульової гіпотези Засудження | Невірне рішення Помилка I роду | Вірне рішення |
Процес судочинства можна розглядати як один з двох або обидва процеси прийняття рішення: винний чи не винний, або докази проти непевності («за межею певного розумного сумніву»). З одного боку, оцінюється обвинувачений; з іншого боку оцінюється ефективність обвинувачення (вага винесених доказів). Перевірку статистичної гіпотези можна сприймати як присуд гіпотезі, або присуд доказам.
Філософські боби
Наступний приклад описувався філософом, який описував сімейство наукових методів до того, як перевірка гіпотез була формалізована і популяризована.
Замало бобів у цій жменьці є білими.
Більшість бобів із цієї торбинки є білими.
Тому: ймовірно, ці боби були взяті із іншої торбинки.
Це гіпотетичний висновок.
Боби у торбинці є генеральною сукупністю. Жменька бобів є вибіркою (зразком). Нульовою гіпотезою є припущення, що вибірка була взята із певної сукупності. Критерієм відхилення нульової гіпотези є «очевидна» різниця зовнішнього вигляду (неформальна відмінність у середньому). Цікавим є висновок із того, що розглядаючи реальну сукупність і реальну вибірку, було отримано висновок про уявну торбинку. Філософ скоріше міркував про логіку, а не ймовірність. Аби бути справжньою статистичною перевіркою гіпотези, цей приклад вимагає виконання формальностей із розрахунку ймовірності і порівняння отриманої імовірності із стандартною.
Просте узагальнення цього прикладу передбачає дослідження торбинки із перемішаними бобами і жменьки, яка містить або лише малу кількість, або дуже багато білих бобів. При узагальненні розглядають два екстремуми. Це вимагає більше розрахунків і більше порівнянь, аби дати формальну відповідь, але основна суть філософії залишається незмінною; якщо склад жменьки сильно відрізняється від складу торбинки, тоді, ймовірно, цю вибірку було отримано із іншої торбинки. Початковий оригінальний приклад називають односторонньою перевіркою, в той час як його узагальнення називається двосторонньою перевіркою.
Твердження також спирається на припущення, що вибірка була випадковою. Якщо хтось навмисно вишукував і вибирав із торбинки білі боби, тоді це б могло пояснити, чому у жменьці так багато білих бобів, а також пояснює чому кількість білих бобів у торбинці була вичерпана (хоча, також передбачається, що мішок повинен бути набагато більшим за одну жменю).
Див. також
Джерела
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)
- Capinski, Marek, Kopp, Peter E. Measure, Integral and Probability. — Springer Verlag 2004. —
- Williams D. Probability with Martingales/ — Cambridge University Press, 1991/ —
Примітки
- Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model () § 20.2.
- Burnham, K. P.; Anderson, D. R. (2002). Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach (вид. 2nd). Springer-Verlag. ISBN ..
- Lehmann, E. L.; Romano, Joseph P. (2005). Testing Statistical Hypotheses (вид. 3E). New York: Springer. ISBN .
- John Arbuthnot (1710). An argument for Divine Providence, taken from the constant regularity observed in the births of both sexes (PDF). Philosophical Transactions of the Royal Society of London. 27 (325–336): 186—190. doi:10.1098/rstl.1710.0011.
- Brian, Éric; Jaisson, Marie (2007). Physico-Theology and Mathematics (1710–1794). The Descent of Human Sex Ratio at Birth. Springer Science & Business Media. с. 1–25. ISBN .
- Conover, W.J. (1999), Chapter 3.4: The Sign Test, Practical Nonparametric Statistics (вид. Third), Wiley, с. 157—176, ISBN
- Sprent, P. (1989), Applied Nonparametric Statistical Methods (вид. Second), Chapman & Hall, ISBN [[Special:BookSources/978-0-412-44980-2 From whence it follows, that it is Art, not Chance, that governs.|978-0-412-44980-2 From whence it follows, that it is Art, not Chance, that governs.]]
{{}}
: Перевірте значення|isbn=
: недійсний символ () - Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty Before 1900. Harvard University Press. с. 225–226. ISBN .
- Laplace, P. (1778). (PDF). Mémoires de l'Académie Royale des Sciences de Paris. 9: 227—332. Архів оригіналу (PDF) за 27 квітня 2015. Процитовано 21 лютого 2019.
- Laplace, P. (1778). Mémoire sur les probabilités (XIX, XX). Oeuvres complètes de Laplace. Т. 9. с. 429—438.
{{}}
: Проігноровано|journal=
() - Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty before 1900. Cambridge, Mass: Belknap Press of Harvard University Press. с. 134. ISBN .
- Fisher, Sir Ronald A. (1956) [1935]. Mathematics of a Lady Tasting Tea. У James Roy Newman (ред.). The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. ISBN . Originally from Fisher's book Design of Experiments.
- Box, Joan Fisher (1978). R.A. Fisher, The Life of a Scientist. New York: Wiley. с. 134. ISBN .
- C. S. Peirce (August 1878). Illustrations of the Logic of Science VI: Deduction, Induction, and Hypothesis. Popular Science Monthly. 13. Процитовано 30 березня 2012.
В іншому мовному розділі є повніша стаття Statistical hypothesis testing(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою з англійської.
|
Це незавершена стаття зі статистики. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Perevirka statistichnih gipotez klas bazovih zadach v matematichnij statistici sho polyagayut u perevirci statistichnih gipotez na osnovi danih sposterezhennya za procesom yakij modelyuyetsya za dopomogoyu mnozhini vipadkovih velichin Perevirka statistichnih gipotez ye metodom statistichnogo visnovuvannya Alternativnij metod perevirki statistichnih gipotez polyagaye u viznachenni mnozhini statistichnih modelej po odnij dlya kozhnoyi gipotezi kandidata pislya chogo vikoristovuyutsya tehniki vidboru modeli abi vibrati tu yaka pidhodit najbilshe Najbilsh zagalni tehniki vidboru modelej osnovani na informacijnomu kriteriyi Akaike abo koeficiyenti Bayesa Protilezhnistyu takogo analizu vibirki mozhe buti rozviduvalnij analiz vibirki yakij mozhe ne mati napered viznachenih gipotez Statistichni gipotezi ne slid plutati iz naukovimi gipotezami Naukovi gipotezi pragnut dati poyasnennya prirodnim yavisham v toj chas yak statistichni gipotezi zazvichaj vikoristovuyut dlya vstanovlennya faktu isnuvannya zv yazku abo jogo vidsutnist mizh vibirkami danih Takim prikladom ye metodi medichnogo likuvannya de statistichna gipoteza vikoristovuyetsya yak sproba ilyustraciyi z miroyu statistichnoyi znachimosti chi liki diyut krashe za placebo Naukova gipoteza potim shukatime poyasnennya rezultativ nezalezhno vid rezultativ perevirki statistichnoyi gipotezi Statistichni gipoteziViznachennya Nehaj u statistichnomu eksperimenti sposterigayetsya realizaciya X 1 X 2 X n displaystyle X 1 X 2 dots X n deyakoyi vipadkovoyi velichini X displaystyle X rozpodil P displaystyle mathbb P yakoyi ye nevidomim povnistyu chi chastkovo Todi bud yake tverdzhennya sho stosuyetsya P displaystyle mathbb P nazivayetsya statistichnoyu gipotezoyu Gipotezi rozriznyayutsya za vidom pripushen sho mistyatsya v nih Statistichnu gipotezu sho odnoznachno viznachaye rozpodil P displaystyle mathbb P tobto H P P 0 displaystyle H colon mathbb P mathbb P 0 de P 0 displaystyle mathbb P 0 yakijs konkretnij zakon nazivayut prostoyu Statistichna gipoteza sho stverdzhuye sho rozpodil P displaystyle mathbb P nalezhit do deyakoyi sim yi rozpodiliv tobto H P P displaystyle H colon mathbb P in mathcal P de P displaystyle mathcal P sim ya rozpodiliv nazivayetsya skladnoyu Na praktici zazvichaj potribno pereviriti yakus konkretnu i yak pravilo prostu gipotezu H 0 displaystyle H 0 Taku gipotezu prijnyato nazivati nulovoyu Pri comu paralelno rozglyadayetsya gipoteza sho superechit yij H 1 displaystyle H 1 sho nazivayetsya konkuruyuchoyu abo en Visunuta gipoteza potrebuye perevirki yaka zdijsnyuyetsya statistichnimi metodami tomu gipotezu nazivayut statistichnoyu Dlya perevirki gipotezi vikoristovuyut kriteriyi sho dozvolyayut prijnyati abo sprostuvati gipotezu V bilshosti vipadkiv statistichni kriteriyi zasnovani na vipadkovij vibirci X 1 X 2 X n displaystyle X 1 X 2 dots X n fiksovanogo ob yemu n 1 displaystyle n geqslant 1 z rozpodilu P displaystyle mathbb P U poslidovnomu analizi vibirka formuyetsya v hodi samogo eksperimentu i tomu yiyi ob yem ye vipadkovoyu velichinoyu Priklad Nehaj dano nezalezhnu vibirku X 1 X n N m 1 displaystyle X 1 ldots X n sim mathcal N mu 1 z normalnogo rozpodilu de m displaystyle mu nevidomij parametr Todi H 0 m m 0 displaystyle H 0 colon mu mu 0 de m 0 displaystyle mu 0 fiksovana stala ye prostoyu gipotezoyu a alternativna do neyi H 1 m m 0 displaystyle H 1 colon mu neq mu 0 skladnoyu Viznachennya terminivNastupni viznachennya terminiv v osnovnomu vzyati iz tlumachen v knizi Lemanna i Romano Statistichna gipoteza Tverdzhennya shodo parametriv yaki opisuyut sukupnist ne vibirku Statistika Znachennya rozrahovane iz vibirki sho chasto pidsumovuyut vibirku z metoyu porivnyannya Prosta gipoteza Bud yaka gipoteza yaka povnistyu viznachaye rozpodil sukupnosti Skladna gipoteza Bud yaka gipoteza yaka ne viznachaye rozpodil sukupnosti povnistyu Nulova gipoteza H0 Gipoteza sho superechit teoretichnomu pripushennyu yake neobhidno dovesti Uspishni dani Dani yaki dozvolyayut doslidniku vidkinuti nulovu gipotezu en H1 Gipoteza yak pravilo skladna pov yazana iz teoriyu yaku bazhayut pidtverditi Statistichna perevirka viprobuvannya test Procedura vhodami yakoyi ye vibirki a rezultatom gipoteza Oblast prijnyattya Mnozhina znachen testovoyi statistiki dlya yakih ne vihodit vidkinuti nulovu gipotezu Oblast vidkidannya Kritichna oblast Mnozhina znachen testovoyi statistiki dlya yakih nulova gipoteza vidkidayetsya en Porogove znachennya yake rozmezhovuye oblast prijnyattya i vidkidannya dlya testovoyi statistiki Potuzhnist viprobuvannya 1 b Imovirnist dlya viprobuvannya sho viznachaye pravilnist vidkidannya nulovoyi gipotezi Dopovnennya do hibnonegativnoyi chastoti b Potuzhnist nazivayetsya chutlivistyu v oblasti biostatistiki Cya perevirka ye perevirkoyu na chutlivist oskilki rezultat ye negativnim mozhna iz upevnenistyu zrobiti visnovok sho paciyent ne maye cogo stanu Div Chutlivist i specifichnist i Pomilki pershogo i drugogo rodu za bilsh vicherpnimi viznachennyami en viprobuvannya Dlya prostoyi gipotezi ce imovirnist nepravilnogo vidkidannya nulovoyi gipotezi pri viprobuvanni Hibnopozitivna chastota Dlya skladnih gipotez ce supremum imovirnosti vidkidannya nulovoyi gipotezi po vsim vipadkah yaki pokrivaye nulova gipoteza V biostatistici dopovnennya do hibnopozitivnoyi chastoti nazivayetsya specifichnistyu Ce ye specifichnoyu perevirkoyu oskilki pri pozitivnomu rezultati mi mozhemo z upevnenistyu zrobiti visnovok sho paciyent maye cej stan Div Chutlivist i specifichnist i Pomilki pershogo i drugogo rodu za bilsh vicherpnimi viznachennyami Riven znachimosti testu a Ce verhnya mezha nakladayetsya na rozmir viprobuvannya Ce znachennya yake obiraye statist pered tim yak vivchiti dani abo obrati bud yakij sposib perevirki yakij zastosuvati Ce maksimalnij pokaznik pomilkovogo vidhilennya H0 yakij doslidnik gotovij dopustiti Perevirka H0 na rivni znachimosti a oznachaye perevirku H0 pri yakij rozmir viprobuvannya ne perevishuye a V bilshosti vipadkiv vikoristovuyut viprobuvannya rozmir yakogo dorivnyuye rivnyu znachimosti p znachennya Jmovirnist pripushennya sho nulova gipoteza ye virnoyu sposterezhennya rezultatu blizkogo do takogo ekstremumu sho vidpovidaye statistici testu Statistichna znachimist testu poperednik perevirki statistichnih gipotez Rezultat eksperimentu vvazhavsya statistichno znachushim yaksho vibirka bula dostatno nesumisnoyu iz nulovoyu gipotezoyu Ce po riznomu rozglyadali u zagalnomu sensi pragmatichna evristika dlya vstanovlennya znachushosti eksperimentalnih rezultativ konvenciya yaka vstanovlyuvala porogove znachennya statistichnogo dovedennya abo metod dlya otrimannya visnovkiv iz danih Metod perevirki statistichnih gipotez dodav comu matematichnoyi suvorosti i filosofsku poslidovnist ponyattyu zrobivshi alternativnu gipotezu odnoznachnoyu Cej termin teper vikoristovuyetsya zdebilshogo dlya opisannya suchasnoyi versiyi yaka teper ye chastinoyu perevirki statistichnih gipotez Etapi perevirki statistichnih gipotezFormulyuvannya osnovnoyi gipotezi H 0 displaystyle H 0 i en H 1 displaystyle H 1 Gipotezi povinni buti chitko formalizovani v matematichnih terminah Zadannya dostovirnosti a displaystyle alpha sho nazivayetsya rivnem znachushosti i sho vidpovidaye pomilkam pershogo rodu na yakomu nadali i bude zroblenij visnovok pro pravdivist gipotezi Rozrahunok statistiki ϕ displaystyle phi kriteriyu takij sho yiyi velichina zalezhit vid pochatkovoyi vibirki X X 1 X n ϕ ϕ X 1 X n displaystyle mathbf X X 1 ldots X n phi phi X 1 ldots X n za yiyi znachennyam mozhna zrobiti visnovki pro istinnist gipotezi H 0 displaystyle H 0 sama statistika ϕ displaystyle phi povinna pidkoryatisya yakomus nevidomomu zakonu rozpodilu tak yak sama ϕ displaystyle phi ye vipadkovoyu v silu vipadkovosti X displaystyle mathbf X Pobudova kritichnoyi oblasti Z oblasti znachen ϕ displaystyle phi vidilyayemo pidmnozhinu C displaystyle mathbb C takih znachen za yakimi mozhna suditi pro suttyevist rozbizhnostej z pripushennyam Yiyi rozmir vibirayetsya takim chinom shob vikonuvalas rivnist P ϕ C a displaystyle P phi in mathbb C alpha Cya mnozhina C displaystyle mathbb C i nazivayetsya kritichnoyu oblastyu Visnovok pro istinnist gipotezi Sposterezhuvani znachennya vibirki pidstavlyayutsya v statistiku ϕ displaystyle phi i za popadannyam abo nepopadannyam u kritichnu oblast C displaystyle mathbb C vinositsya uhvala pro vidkidannya abo uhvalennya visunutoyi gipotezi H 0 displaystyle H 0 Vidi kritichnoyi oblastiDvobichna kritichna oblast viznachayetsya dvoma intervalami x a 2 x 1 a 2 displaystyle infty x alpha 2 cup x 1 alpha 2 infty de x a 2 x 1 a 2 displaystyle x alpha 2 x 1 alpha 2 znahodyat z umov P ϕ lt x a 2 a 2 P ϕ lt x 1 a 2 1 a 2 displaystyle P phi lt x alpha 2 frac alpha 2 quad P phi lt x 1 alpha 2 1 frac alpha 2 Livobichna kritichna oblast viznachayetsya intervalom x a displaystyle infty x alpha de x a displaystyle x alpha znahodyat z umovi P ϕ lt x a a displaystyle P phi lt x alpha alpha Pravobichna kritichna oblast viznachayetsya intervalom x 1 a displaystyle x 1 alpha infty de x 1 a displaystyle x 1 alpha znahodyat z umovi P ϕ lt x 1 a 1 a displaystyle P phi lt x 1 alpha 1 alpha PrikladiSpivvidnoshennya statej narodzhuvanih lyudej Odne iz najpershih zastosuvan statistichnoyi perevirki gipotez prisvyachuvalosya doslidzhennyu pitannya chi ye odnakovo imovirnim en yak nulovoyi gipotezi yake vivchav en v 1700 h rokah a zgodom P yer Simon Laplas v 1770 h Arbutnot doslidiv zapisi pro narodzhennya ditej v Londoni vid 1629 do 1710 vsogo za 82 roki i zastosuvav en prostu en V kozhnomu iz doslidzhenih rokiv kilkist narodzhenih hlopchikiv perevishuvala kilkist narodzhenih divchatok Rozglyadayuchi rivnojmovirnim narodzhennya bilshoyi kilkosti cholovikiv abo bilshoyi kilkosti zhinok imovirnist sposterezhuvanogo rezultatu skladala 0 582 abo blizko 1 do 4 8360 0000 0000 0000 0000 0000 v suchasnih terminah ce ye p znachennyam Sho ye nejmovirno malim pislya chogo Arbutnot zrobiv visnovok sho ce ne ye vipadkovistyu a bozhim providinnyam Zvidki viplivaye sho cim procesom keruye Providinnya a ne Vipadok angl From whence it follows that it is Art not Chance that governs Kazhuchi bilsh suchasnimi terminami vin vidkinuv nulovu gipotezu shodo rivnosti shansiv narodzhennya hlopchika chi divchinki iz rivnem znachimosti p 1 282 Laplas doslidiv statistiku majzhe polovini miljona narodzhen Statistika pokazala bilshu kilkist narodzhuvanih hlopchikiv nizh divchatok Rozrahuvavshi p znachennya vin zrobiv visnovok sho cya perevaga u kilkosti ye ob yektivnim yavishem a ne vipadkovistyu Ledi degustuye chaj V odnomu iz vidomih prikladiv perevirki statistichnoyi gipotezi pid nazvoyu Ledi degustuye chaj doktor biologiyi en yaka pracyuvala yak i Ronald Fisher u en stverdzhuvala sho vona zdatna viznachiti yak bulo prigotovano chaj z molokom a same spochatku nalili u filizhanku chaj abo moloko Fisher zaproponuvav naliti yij na probu visim filizhanok chayu u vipadkovomu poryadku po chotiri iz kozhnim variantom Bulo postavlene pitannya z yakoyu imovirnistyu vipadkovim chinom yiyi vidpovid bude vdaloyu Nulova gipoteza peredbachala sho ledi ne maye zdatnosti vidrizniti chaj Test polyagav u prostomu pidrahunku kilkist vdalih sprob iz vibranih 4 chashok chayu Kritichnim intervalom buv yedinij vipadok iz 4 vdalih vgaduvan iz 4 mozhlivih sho bazuvavsya na tradicijnomu kriteriyi imovirnosti lt 5 Vipadok iz 4 vgaduvannyami vidpovidaye 1 iz 70 mozhlivih kombinacij p 1 4 Fisher stverdzhuvav sho niyakoyi alternativnoyi gipotezi ne potribno Ledi virno viznachila kozhnu chashku sho vvazhalosya statistichno znachimim rezultatom Sudochinstvo Proceduru statistichnoyi perevirki mozhna porivnyati iz zakonami pravosuddya obvinuvachenij vvazhayetsya nevinnim doki jogo chi yiyi vina ne dovedena Prokuror namagayetsya dovesti vinu obvinuvachenogo I lishe todi koli dokaziv dlya obvinuvachennya bude dostatno obvinuvachenij bude zasudzhenij Na pochatku proceduri isnuye dvi gipotezi H 0 displaystyle H 0 stverdzhuye sho obvinuvachenij ye nevinnim i H 1 displaystyle H 1 obvinuvachenij ye vinnim Persha gipoteza H 0 displaystyle H 0 nazivayetsya nulovoyu gipotezoyu i vona viznayetsya na pochatkovomu etapi Druga H 1 displaystyle H 1 nazivayetsya alternativnoyu gipotezoyu Ce ta alternativna gipoteza yaku mi namagayemosya dovesti abo zaperechiti Gipoteza pro nevinuvatist bude vidkinuta lishe todi koli pomilka stane malojmovirnoyu oskilki nebazhano zasudzhuvati nevinnogo obvinuvachuvanogo Taka pomilka nazivayetsya pomilkoyu pershogo rodu tobto zasudzhennya nevinnoyi osobi kontrolyuyut abi cya pomilka bula nevelikoyu Naslidkom takoyi asimetrichnoyi povedinki ye bilshe poshirennya pomilok drugogo rodu vipravdannya osobi yaka vchinila zlochin H0 virna Dijsno ne vinnij H1 virna Dijsno vinnij Prijnyattya nulovoyi gipotezi Vipravdannya Virne rishennya Nevirne rishennya Pomilka II rodu Vidkidannya nulovoyi gipotezi Zasudzhennya Nevirne rishennya Pomilka I rodu Virne rishennya Proces sudochinstva mozhna rozglyadati yak odin z dvoh abo obidva procesi prijnyattya rishennya vinnij chi ne vinnij abo dokazi proti nepevnosti za mezheyu pevnogo rozumnogo sumnivu Z odnogo boku ocinyuyetsya obvinuvachenij z inshogo boku ocinyuyetsya efektivnist obvinuvachennya vaga vinesenih dokaziv Perevirku statistichnoyi gipotezi mozhna sprijmati yak prisud gipotezi abo prisud dokazam Filosofski bobi Nastupnij priklad opisuvavsya filosofom yakij opisuvav simejstvo naukovih metodiv do togo yak perevirka gipotez bula formalizovana i populyarizovana Zamalo bobiv u cij zhmenci ye bilimi Bilshist bobiv iz ciyeyi torbinki ye bilimi Tomu jmovirno ci bobi buli vzyati iz inshoyi torbinki Ce gipotetichnij visnovok Bobi u torbinci ye generalnoyu sukupnistyu Zhmenka bobiv ye vibirkoyu zrazkom Nulovoyu gipotezoyu ye pripushennya sho vibirka bula vzyata iz pevnoyi sukupnosti Kriteriyem vidhilennya nulovoyi gipotezi ye ochevidna riznicya zovnishnogo viglyadu neformalna vidminnist u serednomu Cikavim ye visnovok iz togo sho rozglyadayuchi realnu sukupnist i realnu vibirku bulo otrimano visnovok pro uyavnu torbinku Filosof skorishe mirkuvav pro logiku a ne jmovirnist Abi buti spravzhnoyu statistichnoyu perevirkoyu gipotezi cej priklad vimagaye vikonannya formalnostej iz rozrahunku jmovirnosti i porivnyannya otrimanoyi imovirnosti iz standartnoyu Proste uzagalnennya cogo prikladu peredbachaye doslidzhennya torbinki iz peremishanimi bobami i zhmenki yaka mistit abo lishe malu kilkist abo duzhe bagato bilih bobiv Pri uzagalnenni rozglyadayut dva ekstremumi Ce vimagaye bilshe rozrahunkiv i bilshe porivnyan abi dati formalnu vidpovid ale osnovna sut filosofiyi zalishayetsya nezminnoyu yaksho sklad zhmenki silno vidriznyayetsya vid skladu torbinki todi jmovirno cyu vibirku bulo otrimano iz inshoyi torbinki Pochatkovij originalnij priklad nazivayut odnostoronnoyu perevirkoyu v toj chas yak jogo uzagalnennya nazivayetsya dvostoronnoyu perevirkoyu Tverdzhennya takozh spirayetsya na pripushennya sho vibirka bula vipadkovoyu Yaksho htos navmisno vishukuvav i vibirav iz torbinki bili bobi todi ce b moglo poyasniti chomu u zhmenci tak bagato bilih bobiv a takozh poyasnyuye chomu kilkist bilih bobiv u torbinci bula vicherpana hocha takozh peredbachayetsya sho mishok povinen buti nabagato bilshim za odnu zhmenyu Div takozhPohibki pershogo i drugogo rodu Statistichnij kriterij Statistichna znachushist Falsifikacionizm Statistichnij butstrep Permutacijnij testDzherelaKartashov M V Imovirnist procesi statistika Kiyiv VPC Kiyivskij universitet 2007 504 s Gihman I I Skorohod A V Yadrenko M V Teoriya veroyatnostej i matematicheskaya statistika Kiyiv Visha shkola 1988 436 s ros Capinski Marek Kopp Peter E Measure Integral and Probability Springer Verlag 2004 ISBN 9781852337810 Williams D Probability with Martingales Cambridge University Press 1991 ISBN 0 521 40605 6PrimitkiStuart A Ord K Arnold S 1999 Kendall s Advanced Theory of Statistics Volume 2A Classical Inference amp the Linear Model 20 2 Burnham K P Anderson D R 2002 Model Selection and Multimodel Inference A Practical Information Theoretic Approach vid 2nd Springer Verlag ISBN 978 0 387 95364 9 Lehmann E L Romano Joseph P 2005 Testing Statistical Hypotheses vid 3E New York Springer ISBN 978 0 387 98864 1 John Arbuthnot 1710 An argument for Divine Providence taken from the constant regularity observed in the births of both sexes PDF Philosophical Transactions of the Royal Society of London 27 325 336 186 190 doi 10 1098 rstl 1710 0011 Brian Eric Jaisson Marie 2007 Physico Theology and Mathematics 1710 1794 The Descent of Human Sex Ratio at Birth Springer Science amp Business Media s 1 25 ISBN 978 1 4020 6036 6 Conover W J 1999 Chapter 3 4 The Sign Test Practical Nonparametric Statistics vid Third Wiley s 157 176 ISBN 978 0 471 16068 7 Sprent P 1989 Applied Nonparametric Statistical Methods vid Second Chapman amp Hall ISBN Special BookSources 978 0 412 44980 2 From whence it follows that it is Art not Chance that governs 978 0 412 44980 2 From whence it follows that it is Art not Chance that governs a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Citation title Shablon Citation citation a Perevirte znachennya isbn nedijsnij simvol dovidka Stigler Stephen M 1986 The History of Statistics The Measurement of Uncertainty Before 1900 Harvard University Press s 225 226 ISBN 978 0 67440341 3 Laplace P 1778 PDF Memoires de l Academie Royale des Sciences de Paris 9 227 332 Arhiv originalu PDF za 27 kvitnya 2015 Procitovano 21 lyutogo 2019 Laplace P 1778 Memoire sur les probabilites XIX XX Oeuvres completes de Laplace T 9 s 429 438 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite book title Shablon Cite book cite book a Proignorovano journal dovidka Stigler Stephen M 1986 The History of Statistics The Measurement of Uncertainty before 1900 Cambridge Mass Belknap Press of Harvard University Press s 134 ISBN 978 0 674 40340 6 Fisher Sir Ronald A 1956 1935 Mathematics of a Lady Tasting Tea U James Roy Newman red The World of Mathematics volume 3 Design of Experiments Courier Dover Publications ISBN 978 0 486 41151 4 Originally from Fisher s book Design of Experiments Box Joan Fisher 1978 R A Fisher The Life of a Scientist New York Wiley s 134 ISBN 978 0 471 09300 8 C S Peirce August 1878 Illustrations of the Logic of Science VI Deduction Induction and Hypothesis Popular Science Monthly 13 Procitovano 30 bereznya 2012 V inshomu movnomu rozdili ye povnisha stattya Statistical hypothesis testing angl Vi mozhete dopomogti rozshirivshi potochnu stattyu za dopomogoyu perekladu z anglijskoyi Divitis avtoperekladenu versiyu statti z movi anglijska Perekladach povinen rozumiti sho vidpovidalnist za kincevij vmist statti u Vikipediyi nese same avtor redaguvan Onlajn pereklad nadayetsya lishe yak korisnij instrument pereglyadu vmistu zrozumiloyu movoyu Ne vikoristovujte nevichitanij i nevidkorigovanij mashinnij pereklad u stattyah ukrayinskoyi Vikipediyi Mashinnij pereklad Google ye korisnoyu vidpravnoyu tochkoyu dlya perekladu ale perekladacham neobhidno vipravlyati pomilki ta pidtverdzhuvati tochnist perekladu a ne prosto skopiyuvati mashinnij pereklad do ukrayinskoyi Vikipediyi Ne perekladajte tekst yakij vidayetsya nedostovirnim abo neyakisnim Yaksho mozhlivo perevirte tekst za posilannyami podanimi v inshomovnij statti Dokladni rekomendaciyi div Vikipediya Pereklad Ce nezavershena stattya zi statistiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi