Ця стаття містить правописні, лексичні, граматичні, стилістичні або інші мовні помилки, які треба виправити. |
При перевірці статистичних гіпотез p-значення (англ. p-value) або значення імовірності або асимптотична значимість[] — за умови прийняття нульової гіпотези у статистичному тесті — є імовірністю отримати такі або ще більші відхилення за умови, що у генеральній сукупності насправді немає відмінностей. А отримані відхилення було зумовлено випадковими чинниками.
Використання p-значень при перевірці статистичних гіпотез є загальним для багатьох областей дослідження таких як фізика, економіка, фінанси, політологія, психологія, біологія, кримінологія, і соціологія. Їх неправильне використання було причиною багатьох суперечливих ситуацій.
Основні поняття
В статистиці, кожна гіпотеза щодо невідомого розподілу випадкової величини називається статистичною гіпотезою. Якщо ми стверджуємо про одну гіпотезу і нашою метою є статистична перевірка чи є ця гіпотеза не хибною, але не маємо наміру, одночасно з тим, досліджувати іншу гіпотезу, тоді така перевірка називається перевіркою значимості. Статистична гіпотеза, яка стосується лише числових значень невідомих параметрів певного розподілу називається параметричною гіпотезою. Методи перевірки статистичних гіпотез називаються статистичними тестами. Тести, що перевіряють параметричні гіпотези називаються параметричними тестами.
p-значення застосовується у контексті перевірки нульової гіпотези для надання кількісної оцінки поняттю статистичної значущості доведення. Зауважте що статистична значущість результату не означає те, що результат так само має наукову значимість. Доведення нульової гіпотези це метод доведення до абсурду — аргументування, що прийняте у статистиці. По суті, твердження вважається правильним, якщо його протилежне твердження є неймовірним.
Таким чином, єдиною гіпотезою яку необхідно визначити при такій перевірці є протилежна гіпотеза, що називається нульовою гіпотезою (тобто гіпотеза, яка вважається не правдивою). Результат вважатиметься статистично значимим якщо нульову гіпотезу можна перевірено спростувати. Тобто іншими словами, при методі доведення до абсурду, для статистично значимого результату нульова гіпотеза матиме дуже малу ймовірність того, що вона є правдивою. Спростування нульової гіпотези означає, що правильна гіпотеза полягає в логічному доповнені до нульової гіпотези. Однак, якщо існує хоча б одна альтернатива нульовій гіпотезі, її спростування не може точно означати яка з інших альтернативних гіпотез є правдивою.
Якщо є випадковою величиною, що представляє собою дані спостереження і — статистична гіпотеза, що розглядається, тоді нотація статистичної значимості можна інтуїтивно визначити за допомогою умовної імовірності , яка задає ймовірність спостереження за умови, що гіпотеза припускається правдивою. Однак, якщо є неперервною випадковою величиною і спостерігається її реалізація , У такому застосуванні, інтуїтивне визначення є не адекватним і його необхідно змінити так, щоб воно відповідало неперервним випадковим величинам.
Визначення та інтерпретація
p-значення визначають як імовірність, за умови нульової гіпотези, тут позначеної як (але досить часто її позначають як , що є протилежним до , що іноді використовують для позначення альтернативної гіпотези), отримати результат рівний або більш екстремальний ніж той, що фактично спостерігався. В залежності від того як це розглядати, «більш екстремальний ніж той, що фактично спостерігався», може означати (подія із правого хвоста) або (подія із лівого хвоста) або «менший» із та (подія із обох хвостів). Таким чином, p-значення визначається як
- для випадку події із правого хвоста,
- для випадку події із лівого хвоста,
- для обох хвостів.
Чим меншим є p-значення, тим вищою буде значимість, оскільки це говорить досліднику про те, що досліджувана гіпотеза не може адекватно пояснити спостереження. Нульова гіпотеза відкидається якщо будь-яка із цих імовірностей менша або дорівнює малій величині, що за відомо визначена як порогове значення , яка називається рівнем статистичної значущості. На відміну від p-значення, рівень не отримують із даних спостереження і він не залежить від даної гіпотези; значення визначає дослідник перед вивченням статистичних даних. Надавати значення параметру не обов'язково. Як правило, типовими можливим значенням для можуть бути 0.05, 0.01, 0.005, або 0.001.
Оскільки значення , що відповідає події із лівого чи правого хвоста є випадковою величиною, це дозволяє розглядати p-значення як функцію від і як випадкову величину саму по собі. Відповідно до нульової гіпотези, p-значення визначено рівномірно в інтервалі , із припущення, що є неперервною. Таким чином, p-значення не є фіксованим. Це означає, що p-значенню не можна інтерпретувати як підрахунок частоти, оскільки імовірність повинна бути фіксована для здійснення підрахунку частоти. Іншими словами, якщо один і той самий тест повторити незалежним чином висуваючи ту саму загальну нульову гіпотезу, він призведе до іншого p-значення для кожного повтору. Тим не менш, ці різні p-значення можна об'єднати за допомогою [en].
Приклад
Цей розділ не містить . (червень 2021) |
Уявімо, що ми тестуємо нульову гіпотезу про відсутність зв'язку між двома знаками у таблиці спряженості 2×2 за допомогою критерію Хі-квадрат. Тут, р-значення є ймовірністю отримати таку або ще симетричнішу (рівномірнішу) табличку. Таблиця є симетричною, коли ми припускаємо відсутність залежності між знаками. Тому, що більшим є р-значення, то більшою є імовірність прийняти , звісно, за умови що р-значення > (див. вище). Тому, р-значення є ймовірністю того, що всі відхилення від симетричності у табличці було зумовлено сторонніми чинниками, а не залежністю знаків. А це і є саме тим, що стверджує нульова гіпотеза — що залежності між знаками не існує, вони не впливають на значення один одного, а усі відмінності у таблиці є результатом стороннього впливу.
Критика
Деякі статистики рекомендують доповнювати або зовсім замінювати р-значення іншими статистичними методами. Такими як довірчі інтервали, коефіцієнти правдоподібності, баєсова статистика та моделювання з використанням теорії ухвалювання рішень. Ці підходи безпосередньо стосуються розміру ефекту і більше фокусуються на оцінці, ніж на тестуванні.
Критику р-значення є також пояснено в статті [en] 1994 року з іронічною назвою «Земля кругла (p < .05)» (англ. The Earth Is Round (p < .05))
Один з авторів статистичного пакету мови програмування R умисно не ввів р-значення до функції lmer()
для розрахунку лінійних змішаних моделей.
Див. також
Посилання
Вікісховище має мультимедійні дані за темою: P-значення |
- Free online p-values calculators [ 26 жовтня 2018 у Wayback Machine.] for various specific tests (chi-square, Fisher's F-test, etc.).
- Understanding p-values [ 26 жовтня 2018 у Wayback Machine.], including a Java applet that illustrates how the numerical values of p-values can give quite misleading impressions about the truth or falsity of the hypothesis under test.
- StatQuest: P Values, clearly explained на YouTube
- StatQuest: P-value pitfalls and power calculations на YouTube
Примітки
- Nahm, Francis Sahngun (2017-10). . The Korean Journal of Pain. Т. 30, № 4. с. 241—242. doi:10.3344/kjp.2017.30.4.241. ISSN 2005-9159. PMC 5665734. PMID 29123617. Архів оригіналу за 21 листопада 2020. Процитовано 22 травня 2021.
- Bhattacharya, Bhaskar; Habtzghi, DeSale (2002). . The American Statistician. American Statistical Association. 56 (3): 202—6. doi:10.1198/000313002146. Архів оригіналу за 8 березня 2021. Процитовано 19 лютого 2016.
- Wetzels, R.; Matzke, D.; Lee, M. D.; Rouder, J. N.; Iverson, G. J.; Wagenmakers, E. -J. (2011). Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests. Perspectives on Psychological Science. 6 (3): 291—298. doi:10.1177/1745691611406923.
- Babbie, E. (2007). The practice of social research 11th ed. Thomson Wadsworth: Belmont, California.
- Fisz, Marek (1963). Significance Testing. Probability theory and mathematical statistics (вид. 3). New York: John Wiley and Sons, Inc. с. 425.
- (PDF) (English) . Brooks/Cole. 2005. Архів оригіналу (PDF) за 26 червня 2021. Процитовано 26.06.2021.
{{}}
:|first=
з пропущеним|last=
() - Cohen, Jacob (1994). The earth is round (p < .05). American Psychologist (англ.). Т. 49, № 12. с. 997—1003. doi:10.1037/0003-066X.49.12.997. ISSN 1935-990X. Процитовано 22 травня 2021.
- Luke, Steven G. (1 серпня 2017). Evaluating significance in linear mixed-effects models in R. Behavior Research Methods (англ.). Т. 49, № 4. с. 1494—1502. doi:10.3758/s13428-016-0809-y. ISSN 1554-3528. Процитовано 22 травня 2021.
В іншому мовному розділі є повніша стаття p-value(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою з англійської.
|
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya mistit pravopisni leksichni gramatichni stilistichni abo inshi movni pomilki yaki treba vipraviti Vi mozhete dopomogti vdoskonaliti cyu stattyu pogodivshi yiyi iz chinnimi movnimi standartami Pri perevirci statistichnih gipotez p znachennya angl p value abo znachennya imovirnosti abo asimptotichna znachimist dzherelo za umovi prijnyattya nulovoyi gipotezi u statistichnomu testi ye imovirnistyu otrimati taki abo she bilshi vidhilennya za umovi sho u generalnij sukupnosti naspravdi nemaye vidminnostej A otrimani vidhilennya bulo zumovleno vipadkovimi chinnikami Vikoristannya p znachen pri perevirci statistichnih gipotez ye zagalnim dlya bagatoh oblastej doslidzhennya takih yak fizika ekonomika finansi politologiya psihologiya biologiya kriminologiya i sociologiya Yih nepravilne vikoristannya bulo prichinoyu bagatoh superechlivih situacij Osnovni ponyattyaV statistici kozhna gipoteza shodo nevidomogo rozpodilu F displaystyle F vipadkovoyi velichini X displaystyle X nazivayetsya statistichnoyu gipotezoyu Yaksho mi stverdzhuyemo pro odnu gipotezu i nashoyu metoyu ye statistichna perevirka chi ye cya gipoteza ne hibnoyu ale ne mayemo namiru odnochasno z tim doslidzhuvati inshu gipotezu todi taka perevirka nazivayetsya perevirkoyu znachimosti Statistichna gipoteza yaka stosuyetsya lishe chislovih znachen nevidomih parametriv pevnogo rozpodilu nazivayetsya parametrichnoyu gipotezoyu Metodi perevirki statistichnih gipotez nazivayutsya statistichnimi testami Testi sho pereviryayut parametrichni gipotezi nazivayutsya parametrichnimi testami p znachennya zastosovuyetsya u konteksti perevirki nulovoyi gipotezi dlya nadannya kilkisnoyi ocinki ponyattyu statistichnoyi znachushosti dovedennya Zauvazhte sho statistichna znachushist rezultatu ne oznachaye te sho rezultat tak samo maye naukovu znachimist Dovedennya nulovoyi gipotezi ce metod dovedennya do absurdu argumentuvannya sho prijnyate u statistici Po suti tverdzhennya vvazhayetsya pravilnim yaksho jogo protilezhne tverdzhennya ye nejmovirnim Takim chinom yedinoyu gipotezoyu yaku neobhidno viznachiti pri takij perevirci ye protilezhna gipoteza sho nazivayetsya nulovoyu gipotezoyu tobto gipoteza yaka vvazhayetsya ne pravdivoyu Rezultat vvazhatimetsya statistichno znachimim yaksho nulovu gipotezu mozhna perevireno sprostuvati Tobto inshimi slovami pri metodi dovedennya do absurdu dlya statistichno znachimogo rezultatu nulova gipoteza matime duzhe malu jmovirnist togo sho vona ye pravdivoyu Sprostuvannya nulovoyi gipotezi oznachaye sho pravilna gipoteza polyagaye v logichnomu dopovneni do nulovoyi gipotezi Odnak yaksho isnuye hocha b odna alternativa nulovij gipotezi yiyi sprostuvannya ne mozhe tochno oznachati yaka z inshih alternativnih gipotez ye pravdivoyu Yaksho X displaystyle X ye vipadkovoyu velichinoyu sho predstavlyaye soboyu dani sposterezhennya i H displaystyle H statistichna gipoteza sho rozglyadayetsya todi notaciya statistichnoyi znachimosti mozhna intuyitivno viznachiti za dopomogoyu umovnoyi imovirnosti Pr X H displaystyle Pr X H yaka zadaye jmovirnist sposterezhennya za umovi sho gipoteza pripuskayetsya pravdivoyu Odnak yaksho X displaystyle X ye neperervnoyu vipadkovoyu velichinoyu i sposterigayetsya yiyi realizaciya x displaystyle x Pr X x H 0 displaystyle Pr X x H 0 U takomu zastosuvanni intuyitivne viznachennya ye ne adekvatnim i jogo neobhidno zminiti tak shob vono vidpovidalo neperervnim vipadkovim velichinam Viznachennya ta interpretaciyaPriklad rozrahunku p znachennya Vertikalnij koordinatnij shkali vidpovidaye gustini imovirnosti kozhnogo rezultatu rozrahovanogo vidpovidno do nulovoyi gipotezi p znachennya ce plosha pid krivoyu sho znahoditsya za tochkoyu danih sposterezhennya p znachennya viznachayut yak imovirnist za umovi nulovoyi gipotezi tut poznachenoyi yak H displaystyle H ale dosit chasto yiyi poznachayut yak H 0 displaystyle H 0 sho ye protilezhnim do H a displaystyle H a sho inodi vikoristovuyut dlya poznachennya alternativnoyi gipotezi otrimati rezultat rivnij abo bilsh ekstremalnij nizh toj sho faktichno sposterigavsya V zalezhnosti vid togo yak ce rozglyadati bilsh ekstremalnij nizh toj sho faktichno sposterigavsya mozhe oznachati X x displaystyle X geq x podiya iz pravogo hvosta abo X x displaystyle X leq x podiya iz livogo hvosta abo menshij iz X x displaystyle X leq x ta X x displaystyle X geq x podiya iz oboh hvostiv Takim chinom p znachennya viznachayetsya yak Pr X x H displaystyle Pr X geq x H dlya vipadku podiyi iz pravogo hvosta Pr X x H displaystyle Pr X leq x H dlya vipadku podiyi iz livogo hvosta 2 min Pr X x H Pr X x H displaystyle 2 min Pr X leq x H Pr X geq x H dlya oboh hvostiv Chim menshim ye p znachennya tim vishoyu bude znachimist oskilki ce govorit doslidniku pro te sho doslidzhuvana gipoteza ne mozhe adekvatno poyasniti sposterezhennya Nulova gipoteza H displaystyle H vidkidayetsya yaksho bud yaka iz cih imovirnostej mensha abo dorivnyuye malij velichini sho za vidomo viznachena yak porogove znachennya a displaystyle alpha yaka nazivayetsya rivnem statistichnoyi znachushosti Na vidminu vid p znachennya a displaystyle alpha riven ne otrimuyut iz danih sposterezhennya i vin ne zalezhit vid danoyi gipotezi znachennya a displaystyle alpha viznachaye doslidnik pered vivchennyam statistichnih danih Nadavati znachennya parametru a displaystyle alpha ne obov yazkovo Yak pravilo tipovimi mozhlivim znachennyam dlya a displaystyle alpha mozhut buti 0 05 0 01 0 005 abo 0 001 Oskilki znachennya x displaystyle x sho vidpovidaye podiyi iz livogo chi pravogo hvosta ye vipadkovoyu velichinoyu ce dozvolyaye rozglyadati p znachennya yak funkciyu vid x displaystyle x i yak vipadkovu velichinu samu po sobi Vidpovidno do nulovoyi gipotezi p znachennya viznacheno rivnomirno v intervali 0 1 displaystyle 0 1 iz pripushennya sho x displaystyle x ye neperervnoyu Takim chinom p znachennya ne ye fiksovanim Ce oznachaye sho p znachennyu ne mozhna interpretuvati yak pidrahunok chastoti oskilki imovirnist povinna buti fiksovana dlya zdijsnennya pidrahunku chastoti Inshimi slovami yaksho odin i toj samij test povtoriti nezalezhnim chinom visuvayuchi tu samu zagalnu nulovu gipotezu vin prizvede do inshogo p znachennya dlya kozhnogo povtoru Tim ne mensh ci rizni p znachennya mozhna ob yednati za dopomogoyu en PrikladCej rozdil ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cej rozdil dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno cherven 2021 Uyavimo sho mi testuyemo nulovu gipotezu H 0 displaystyle H 0 pro vidsutnist zv yazku mizh dvoma znakami u tablici spryazhenosti 2 2 za dopomogoyu kriteriyu Hi kvadrat Tut r znachennya ye jmovirnistyu otrimati taku abo she simetrichnishu rivnomirnishu tablichku Tablicya ye simetrichnoyu koli mi pripuskayemo vidsutnist zalezhnosti mizh znakami Tomu sho bilshim ye r znachennya to bilshoyu ye imovirnist prijnyati H 0 displaystyle H 0 zvisno za umovi sho r znachennya gt a displaystyle alpha div vishe Tomu r znachennya ye jmovirnistyu togo sho vsi vidhilennya vid simetrichnosti u tablichci bulo zumovleno storonnimi chinnikami a ne zalezhnistyu znakiv A ce i ye same tim sho stverdzhuye nulova gipoteza sho zalezhnosti mizh znakami ne isnuye voni ne vplivayut na znachennya odin odnogo a usi vidminnosti u tablici ye rezultatom storonnogo vplivu KritikaDeyaki statistiki rekomenduyut dopovnyuvati abo zovsim zaminyuvati r znachennya inshimi statistichnimi metodami Takimi yak dovirchi intervali koeficiyenti pravdopodibnosti bayesova statistika ta modelyuvannya z vikoristannyam teoriyi uhvalyuvannya rishen Ci pidhodi bezposeredno stosuyutsya rozmiru efektu i bilshe fokusuyutsya na ocinci nizh na testuvanni Kritiku r znachennya ye takozh poyasneno v statti en 1994 roku z ironichnoyu nazvoyu Zemlya krugla p lt 05 angl The Earth Is Round p lt 05 Odin z avtoriv statistichnogo paketu movi programuvannya R umisno ne vviv r znachennya do funkciyi lmer dlya rozrahunku linijnih zmishanih modelej Div takozhStatistichna znachushistPosilannyaVikishovishe maye multimedijni dani za temoyu P znachennya Free online p values calculators 26 zhovtnya 2018 u Wayback Machine for various specific tests chi square Fisher s F test etc Understanding p values 26 zhovtnya 2018 u Wayback Machine including a Java applet that illustrates how the numerical values of p values can give quite misleading impressions about the truth or falsity of the hypothesis under test StatQuest P Values clearly explained na YouTube StatQuest P value pitfalls and power calculations na YouTubePrimitkiNahm Francis Sahngun 2017 10 The Korean Journal of Pain T 30 4 s 241 242 doi 10 3344 kjp 2017 30 4 241 ISSN 2005 9159 PMC 5665734 PMID 29123617 Arhiv originalu za 21 listopada 2020 Procitovano 22 travnya 2021 Bhattacharya Bhaskar Habtzghi DeSale 2002 The American Statistician American Statistical Association 56 3 202 6 doi 10 1198 000313002146 Arhiv originalu za 8 bereznya 2021 Procitovano 19 lyutogo 2016 Wetzels R Matzke D Lee M D Rouder J N Iverson G J Wagenmakers E J 2011 Statistical Evidence in Experimental Psychology An Empirical Comparison Using 855 t Tests Perspectives on Psychological Science 6 3 291 298 doi 10 1177 1745691611406923 Babbie E 2007 The practice of social research 11th ed Thomson Wadsworth Belmont California Fisz Marek 1963 Significance Testing Probability theory and mathematical statistics vid 3 New York John Wiley and Sons Inc s 425 PDF English Brooks Cole 2005 Arhiv originalu PDF za 26 chervnya 2021 Procitovano 26 06 2021 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a first z propushenim last dovidka Cohen Jacob 1994 The earth is round p lt 05 American Psychologist angl T 49 12 s 997 1003 doi 10 1037 0003 066X 49 12 997 ISSN 1935 990X Procitovano 22 travnya 2021 Luke Steven G 1 serpnya 2017 Evaluating significance in linear mixed effects models in R Behavior Research Methods angl T 49 4 s 1494 1502 doi 10 3758 s13428 016 0809 y ISSN 1554 3528 Procitovano 22 travnya 2021 V inshomu movnomu rozdili ye povnisha stattya p value angl Vi mozhete dopomogti rozshirivshi potochnu stattyu za dopomogoyu perekladu z anglijskoyi Divitis avtoperekladenu versiyu statti z movi anglijska Perekladach povinen rozumiti sho vidpovidalnist za kincevij vmist statti u Vikipediyi nese same avtor redaguvan Onlajn pereklad nadayetsya lishe yak korisnij instrument pereglyadu vmistu zrozumiloyu movoyu Ne vikoristovujte nevichitanij i nevidkorigovanij mashinnij pereklad u stattyah ukrayinskoyi Vikipediyi Mashinnij pereklad Google ye korisnoyu vidpravnoyu tochkoyu dlya perekladu ale perekladacham neobhidno vipravlyati pomilki ta pidtverdzhuvati tochnist perekladu a ne prosto skopiyuvati mashinnij pereklad do ukrayinskoyi Vikipediyi Ne perekladajte tekst yakij vidayetsya nedostovirnim abo neyakisnim Yaksho mozhlivo perevirte tekst za posilannyami podanimi v inshomovnij statti Dokladni rekomendaciyi div Vikipediya Pereklad