Просіювання даних (також риболовля серед даних, підгонка даних, р-хакінг) є зловживання аналізом даних з метою пошуку закономірностей, які можуть бути представлені як статистично значущі, таким чином, значно збільшуючи ризик помилковопозитивних результатів. Це робиться шляхом проведення багатьох статистичних тестів на даних і звітності із публікацією лише тих результатів, що мають статистичну значущість.
Процес просіювання даних включає перевірку кількох гіпотез з використанням одного набору даних шляхом вичерпного пошуку - або у комбінаціях змінних, які можуть показати кореляцію, або у групах спостережень, які показують різницю середніх значеннь, або в їх розбитті на підгрупи за якимись іншими змінними.
Звичайні тести статистичної значущості базуються на ймовірності виникнення певного результату при однократному експерименті, і обов'язково враховують певний ризик помилок певного типу (помилкові відхилення нульової гіпотези). Цей рівень ризику називається значущістю. Коли проводиться велика кількість тестів, деякі дають хибні результати цього типу. Отже, 5 % випадково обраних гіпотез можуть бути (помилково) статистично значущими на рівні 5 % значущості, 1% можуть (помилково) стати статистично значущими на рівні значущості 1% тощо, і т.д.. Коли перевіряється достатня кількість гіпотез, можна бути впевненим, що деякі з них будуть статистично значущими (навіть якщо це вводить в оману), оскільки майже кожен набір даних із будь-яким ступенем випадковості може містити деякі помилкові кореляції. Якщо це не враховується, результати множинних порівнянь можуть легко ввести в оману дослідників, які використовують методи аналізу даних.
Просіювання даних є прикладом ігнорування проблеми множинного порівняння. Одна з форм - це відсутність у статтях інформації про кількість проведених порівнянь підгруп.
Відбір висновків з даних
Звичайна процедура частотної статистичної перевірки гіпотез полягає в розробці науково-дослідницької гіпотези, такої як «люди з вищих соціальних класів живуть довше», зборі відповідних даних, а потім проведення статистичного тесту значущості, щоб побачити, наскільки велика ймовірність отримання цих даних при однократному дослідженні. Останній крок називається перевіркою нульової гіпотези.
Ключовим моментом у належному статистичному аналізі є перевірка гіпотези за допомогою доказів (даних), які не використовувались при побудові гіпотези. Це критично важливо, оскільки кожен набір даних містить деякі закономірності, повністю обумовлені випадковістю. Якщо гіпотеза не перевіряється на іншому наборі даних, з тієї самої статистичної сукупності, неможливо оцінити ймовірність того, що така закономірность утворена тільки випадковістю. Див. гіпотези тестування, запропоновані даними .
Ось простий приклад. Кидання монети п’ять разів із результатом 2 орла та 3 решки може призвести до припущення, що монета віддає перевагу решці 3/5 на 2/5. Якщо цю гіпотезу перевірити на існуючому наборі даних, вона підтверджується, але таке підтвердження безглузде. Правильною процедурою було б заздалегідь сформувати гіпотезу про те, яка існує ймовірність випадіння решки, а потім кидати монету декілька разів, щоб перевірити, відхиляється гіпотеза чи ні. Якщо спостерігаються три решки і два орла, може бути сформована ще одна гіпотеза, що ймовірність решки становить 3/5, але вона може бути перевірена лише новим киданням монет. Важливо усвідомити, що статистична значущість при неправильній процедурі є абсолютно помилковою - тести значущості не захищають від просіювання даних.
Гіпотеза, висунута на основі нерепрезентативних даних
Припустимо, що дослідження випадкової вибірки людей включає рівно двох людей з днем народження 7 серпня: Марійки та Івана. Хтось, хто займається просіюванням даних, може спробувати знайти додаткову схожість між Марійкою та Іваном. Беребираючи сотні або тисячі можливих подібностей між ними, кожна з яких має низьку ймовірність бути справжньою, майже напевно можна знайти незвичну подібність. Можливо, Іван та Марійка - єдині двоє людей у дослідженні, які три роки були неповнолітніми у коледжі. Тоді упередженою, внаслідок просіювання даних, гіпотезою може бути: "Люди, народжені 7 серпня, мають набагато більший шанс бути неповнолітніми більше ніж два роки в коледжі".
Самі дані, вирвані з контексту, можуть розглядатися як такі, що сильно підтверджують такий зв'язок, оскільки ніхто з різним днем народження не провів свої три роки неповноліття в коледжі. Однак якщо (як і імовірно) це хибна гіпотеза, цей результат, швидше за все, не буде відтворюваним; при будь-якій спробі перевірити, чи мають інші люди, народжені 7 серпня, подібну ознаку, швидше за все, майже одразу будуть отримані суперечливі результати.
Упередженість
Упередженість - це систематична помилка в аналізі. Наприклад, лікарі призначали хворим на ВІЛ з високим серцево-судинним ризиком певне лікування ВІЛ - абакавір та пацієнтам з меншим ризиком - інші препарати. Це перешкоджає простій оцінці абакавіру порівняно з іншими методами лікування. Аналіз, без корегування цього упередження, несправедливо дійшов висновку про небезпеку абакавіру, оскільки пацієнти, які його приймали мали більший ризик, тому більшість із них мали серцеві напади. Ця проблема може бути дуже серйозною, наприклад, під час спостережного дослідження .
Пропуски даних, невизначені додаткові фактори та втрата даних спостереження після втручання також можуть призвести до упередженості. Вибираючи статті зі значущим значенням p, не беруться до уваги дослідження з негативними результатами - що є упередженням публікації . Це також відоме як "упередження шафи з файлами", оскільки менш значущі результати p- значення залишаються у картотеці та ніколи не публікуються.
Багаторазове моделювання
Інший аспект впливу знання даних на результати статистичних тестів можна побачити при, при аналізі даних методом лінійної регресії. Вирішальним кроком у цьому процесі є рішення, які коваріати включати у рівняння, яке пояснює одну або кілька інших змінних. Існують як статистичні (поетапна регресія ), так і сенсові міркування, які змушують авторів віддавати перевагу одним із своїх моделей над іншими, і це є ліберальним використанням статистичних тестів. Однак відкинути одну або кілька змінних з рівняння на основі даних означає, що не можна достовірно застосовувати стандартні статистичні процедури до збережених змінних у рівнянні так, як ніби нічого не сталося. Природно, збережені змінні повинні були пройти якусь попередню перевірку (можливо, неточну й інтуїтивну), яку відкинуті перемінні не пройшли. У 1966 р. Селвін і Стюарт порівняли змінні, збережені в моделі, з рибами, які не пройшли крізь сітку - в тому сенсі, що їх ефекти повинні бути більшими, ніж ефекти тих, що проскочили крізь сітку. Це не тільки змінює результати усіх наступних тестів на остаточній пояснювальній моделі, це може внести упередженість та змінити середню квадратичну помилку в оцінці.
Приклади в метеорології та епідеміології
У метеорології гіпотези часто формулюються з використанням даних до теперішнього часу і перевіряються на основі майбутніх метеорологічних даних, що гарантує, що навіть підсвідомо майбутні дані не можуть вплинути на формулювання гіпотези. Звичайно, така дисципліна вимагає очікування появи нових даних, щоб показати прогнозовану силу сформульованої теорії проти нульової гіпотези . Цей процес гарантує, що ніхто не може звинуватити дослідника у ручній підгонці прогностичної моделі до наявних даних, оскільки майбутня погода ще не відома.
В якості іншого прикладу, припустимо, що спостерігачі відзначають, що у певному місті, можливо існує , але не має твердої гіпотези, чому це так. Однак вони мають доступ до великої кількості демографічних даних про місто та околиці, що містять виміри сотень або тисяч різних змінних, переважно некорельованих. Навіть якщо всі ці змінні не залежать від рівня захворюваності на рак, велика ймовірність, що принаймні одна змінна суттєво корелює із частотою раку в цій місцевості. Хоча це може слугувати на користь гіпотези, для підтвердження необхідне подальше тестування з використанням тих самих змінних, але з даними з іншої місцевості. Зауважте, що р- значення 0,01 свідчить про те, що у 1 % випадків результат, принаймні, такий екстремальний, буде отриманий випадково; якщо перевіряються сотні або тисячі гіпотез (із взаємно відносно некорельованими незалежними змінними), то, швидше за все, можна отримати р- значення менше 0,01 для багатьох нульових гіпотез.
Засоби захисту
Шукати закономірності в даних є правомірним. Застосування статистичного аналізу до тих самих даних, з яких випливає закономірність, є неправильним. Одним із способів побудови гіпотез, уникаючи просіювання даних, є проведення рандомізованих вибіркових тестів . Дослідник збирає набір даних, а потім випадковим чином розподіляє його на дві підмножини A і B. Тільки одна підмножина - скажімо, підмножина A - досліджується для створення гіпотез. Після того, як гіпотеза сформульована, вона повинна бути перевірена на підмножині B, яка не була використана для побудови гіпотези. Тільки тоді, коли дані з підмножини В також підтримують цю гіпотезу, є розумним вважати, що гіпотеза може бути справедливою. (Це простий тип перехресної перевірки, який часто називають навчальним тестом або валідацією з розділеною половиною. )
Інший засіб для захисту під просіювання даних - це записати кількість усіх тестів значущості, проведених під час дослідження, і просто розділити рівень значущості («альфа») на це число; такою є корекція Бонферроні . Однак це дуже консервативний спосіб. Загальновідомий альфа-коефіцієнт 0,05, поділений таким чином на 1000, щоб врахувати 1000 тестів значимості, дає дуже сувору альфу 0,00005. Методами, особливо корисними для дисперсійного аналізу та для побудови довірчих інтервалів для регресій, що включають базові функції, є а якщо дослідник має на увазі лише попарні порівняння, . Використання Бенджаміні та Хохберга є більш складним підходом, який став популярним методом контролю множинних порівнянь.
Можна чітко розділити аналіз даних на підтверджуваний та дослідницький. Висновки, що базуються на статистиці підходять лише для першого з них.
Зрештою, статистична значущість тесту та статистична довірчисть знахідки є спільними властивостями даних і методу, що використовується для дослідження цих даних. Таким чином, якщо хтось каже, що певна подія має ймовірність 20 % ± 2 %, у 19 випадків із 20, це означає, що ймовірність події, оцінена саме тим методом, який використовувався, знаходиться між 18 % та 22 % з імовірністю 0,95. Жодна заява про статистичну значущість не може бути проголошена без належного врахування методу, що використовується для оцінки даних.
Академічні журнали дедалі частіше переходять до практики передзаявленого звіту, який має на меті протидіяти дуже серйозним проблемам, таким як просіювання даних та [en] (англ. Hypothesizing After the Results are Known, висування гіпотез після того, як результати стали відомими), які зробили дослідження з тестування гіпотез дуже ненадійними: наприклад, журнал Nature Human Behaviour перейшов на передзаявлений звіт, оскільки він “переносить [акценти] з результатів дослідження на питання, якими керується дослідження, та методи, що використовуються для відповіді на них”. European Journal of Personality визначає цей формат таким чином: «У передзаявленому звіті автори створюють пропозицію дослідження, яка включає теоретичні та емпіричні передумови, дослідницькі питання / гіпотези та пілотні дані (якщо такі є). Після надходження до редакції ця пропозиція буде розглянута до початку збору даних, і якщо вона буде прийнята, стаття, отримана в після цієї рецензованої процедури, буде опублікована незалежно від результатів дослідження ".
Загальнодоступність методів та результатів дослідження за принципом відкритої науки ще більше ускладнює використання прийому просіювання даних.
Список літератури
- Davey Smith, G.; Ebrahim, S. (2002). Data dredging, bias, or confounding. BMJ. 325 (7378): 1437—1438. doi:10.1136/bmj.325.7378.1437. PMC 1124898. PMID 12493654.
- Young, S. S.; Karr, A. (2011). (PDF). Significance. 8 (3): 116—120. doi:10.1111/j.1740-9713.2011.00506.x. Архів оригіналу (PDF) за 5 грудня 2020. Процитовано 17 листопада 2020.
- Selvin, H.C.; Stuart, A. (1966). Data-Dredging Procedures in Survey Analysis. The American Statistician. 20 (3): 20—23. doi:10.1080/00031305.1966.10480401. JSTOR 2681493.
- Berk, R.; Brown, L.; Zhao, L. (2009). . J Quant Criminol. 26 (2): 217—236. doi:10.1007/s10940-009-9077-7. Архів оригіналу за 20 вересня 2020. Процитовано 17 листопада 2020.
- Promoting reproducibility with registered reports. Nature Human Behaviour. 1 (1): 0034. 10 січня 2017. doi:10.1038/s41562-016-0034.
- . ejp-blog.com. Архів оригіналу за 24 липня 2020. Процитовано 17 листопада 2020.
- Vyse, Stuart (2017). . . 41 (5): 25—27. Архів оригіналу за 5 серпня 2018. Процитовано 5 серпня 2018.
Додаткова література
- (30 серпня 2005). Why Most Published Research Findings Are False. . San Francisco: Public Library of Science. 2 (8): e124. doi:10.1371/journal.pmed.0020124. ISSN 1549-1277. PMC 1182327. PMID 16060722.
{{}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом () - Head, Megan L.; Holman, Luke; Lanfear, Rob; Kahn, Andrew T.; Jennions, Michael D. (13 березня 2015). The Extent and Consequences of P-Hacking in Science. PLOS Biology. 13 (3): e1002106. doi:10.1371/journal.pbio.1002106. PMC 4359000. PMID 25768323.
{{}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом () - Insel, Thomas (14 листопада 2014). . NIMH Director's Blog (англ.). Архів оригіналу за 11 листопада 2020. Процитовано 17 листопада 2020.
- Smith, Gary (2016). Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics. Gerald Duckworth & Co. ISBN .
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Prosiyuvannya danih takozh ribolovlya sered danih pidgonka danih r haking ye zlovzhivannya analizom danih z metoyu poshuku zakonomirnostej yaki mozhut buti predstavleni yak statistichno znachushi takim chinom znachno zbilshuyuchi rizik pomilkovopozitivnih rezultativ Ce robitsya shlyahom provedennya bagatoh statistichnih testiv na danih i zvitnosti iz publikaciyeyu lishe tih rezultativ sho mayut statistichnu znachushist Priklad rezultatu prosiyuvannya danih sho pokazuye korelyaciyu mizh kilkistyu liter u peremozhnomu slovi Nacionalnogo zmagannya z gramatiki ta kilkistyu lyudej u Spoluchenih Shtatah ubitimi otrujnimi pavukami Proces prosiyuvannya danih vklyuchaye perevirku kilkoh gipotez z vikoristannyam odnogo naboru danih shlyahom vicherpnogo poshuku abo u kombinaciyah zminnih yaki mozhut pokazati korelyaciyu abo u grupah sposterezhen yaki pokazuyut riznicyu serednih znachenn abo v yih rozbitti na pidgrupi za yakimis inshimi zminnimi Zvichajni testi statistichnoyi znachushosti bazuyutsya na jmovirnosti viniknennya pevnogo rezultatu pri odnokratnomu eksperimenti i obov yazkovo vrahovuyut pevnij rizik pomilok pevnogo tipu pomilkovi vidhilennya nulovoyi gipotezi Cej riven riziku nazivayetsya znachushistyu Koli provoditsya velika kilkist testiv deyaki dayut hibni rezultati cogo tipu Otzhe 5 vipadkovo obranih gipotez mozhut buti pomilkovo statistichno znachushimi na rivni 5 znachushosti 1 mozhut pomilkovo stati statistichno znachushimi na rivni znachushosti 1 tosho i t d Koli pereviryayetsya dostatnya kilkist gipotez mozhna buti vpevnenim sho deyaki z nih budut statistichno znachushimi navit yaksho ce vvodit v omanu oskilki majzhe kozhen nabir danih iz bud yakim stupenem vipadkovosti mozhe mistiti deyaki pomilkovi korelyaciyi Yaksho ce ne vrahovuyetsya rezultati mnozhinnih porivnyan mozhut legko vvesti v omanu doslidnikiv yaki vikoristovuyut metodi analizu danih Prosiyuvannya danih ye prikladom ignoruvannya problemi mnozhinnogo porivnyannya Odna z form ce vidsutnist u stattyah informaciyi pro kilkist provedenih porivnyan pidgrup Vidbir visnovkiv z danihZvichajna procedura chastotnoyi statistichnoyi perevirki gipotez polyagaye v rozrobci naukovo doslidnickoyi gipotezi takoyi yak lyudi z vishih socialnih klasiv zhivut dovshe zbori vidpovidnih danih a potim provedennya statistichnogo testu znachushosti shob pobachiti naskilki velika jmovirnist otrimannya cih danih pri odnokratnomu doslidzhenni Ostannij krok nazivayetsya perevirkoyu nulovoyi gipotezi Klyuchovim momentom u nalezhnomu statistichnomu analizi ye perevirka gipotezi za dopomogoyu dokaziv danih yaki ne vikoristovuvalis pri pobudovi gipotezi Ce kritichno vazhlivo oskilki kozhen nabir danih mistit deyaki zakonomirnosti povnistyu obumovleni vipadkovistyu Yaksho gipoteza ne pereviryayetsya na inshomu nabori danih z tiyeyi samoyi statistichnoyi sukupnosti nemozhlivo ociniti jmovirnist togo sho taka zakonomirnost utvorena tilki vipadkovistyu Div gipotezi testuvannya zaproponovani danimi Os prostij priklad Kidannya moneti p yat raziv iz rezultatom 2 orla ta 3 reshki mozhe prizvesti do pripushennya sho moneta viddaye perevagu reshci 3 5 na 2 5 Yaksho cyu gipotezu pereviriti na isnuyuchomu nabori danih vona pidtverdzhuyetsya ale take pidtverdzhennya bezgluzde Pravilnoyu proceduroyu bulo b zazdalegid sformuvati gipotezu pro te yaka isnuye jmovirnist vipadinnya reshki a potim kidati monetu dekilka raziv shob pereviriti vidhilyayetsya gipoteza chi ni Yaksho sposterigayutsya tri reshki i dva orla mozhe buti sformovana she odna gipoteza sho jmovirnist reshki stanovit 3 5 ale vona mozhe buti perevirena lishe novim kidannyam monet Vazhlivo usvidomiti sho statistichna znachushist pri nepravilnij proceduri ye absolyutno pomilkovoyu testi znachushosti ne zahishayut vid prosiyuvannya danih Gipoteza visunuta na osnovi nereprezentativnih danihPripustimo sho doslidzhennya vipadkovoyi vibirki lyudej vklyuchaye rivno dvoh lyudej z dnem narodzhennya 7 serpnya Marijki ta Ivana Htos hto zajmayetsya prosiyuvannyam danih mozhe sprobuvati znajti dodatkovu shozhist mizh Marijkoyu ta Ivanom Berebirayuchi sotni abo tisyachi mozhlivih podibnostej mizh nimi kozhna z yakih maye nizku jmovirnist buti spravzhnoyu majzhe napevno mozhna znajti nezvichnu podibnist Mozhlivo Ivan ta Marijka yedini dvoye lyudej u doslidzhenni yaki tri roki buli nepovnolitnimi u koledzhi Todi uperedzhenoyu vnaslidok prosiyuvannya danih gipotezoyu mozhe buti Lyudi narodzheni 7 serpnya mayut nabagato bilshij shans buti nepovnolitnimi bilshe nizh dva roki v koledzhi Sami dani virvani z kontekstu mozhut rozglyadatisya yak taki sho silno pidtverdzhuyut takij zv yazok oskilki nihto z riznim dnem narodzhennya ne proviv svoyi tri roki nepovnolittya v koledzhi Odnak yaksho yak i imovirno ce hibna gipoteza cej rezultat shvidshe za vse ne bude vidtvoryuvanim pri bud yakij sprobi pereviriti chi mayut inshi lyudi narodzheni 7 serpnya podibnu oznaku shvidshe za vse majzhe odrazu budut otrimani superechlivi rezultati UperedzhenistUperedzhenist ce sistematichna pomilka v analizi Napriklad likari priznachali hvorim na VIL z visokim sercevo sudinnim rizikom pevne likuvannya VIL abakavir ta paciyentam z menshim rizikom inshi preparati Ce pereshkodzhaye prostij ocinci abakaviru porivnyano z inshimi metodami likuvannya Analiz bez koreguvannya cogo uperedzhennya nespravedlivo dijshov visnovku pro nebezpeku abakaviru oskilki paciyenti yaki jogo prijmali mali bilshij rizik tomu bilshist iz nih mali sercevi napadi Cya problema mozhe buti duzhe serjoznoyu napriklad pid chas sposterezhnogo doslidzhennya Propuski danih neviznacheni dodatkovi faktori ta vtrata danih sposterezhennya pislya vtruchannya takozh mozhut prizvesti do uperedzhenosti Vibirayuchi statti zi znachushim znachennyam p ne berutsya do uvagi doslidzhennya z negativnimi rezultatami sho ye uperedzhennyam publikaciyi Ce takozh vidome yak uperedzhennya shafi z fajlami oskilki mensh znachushi rezultati p znachennya zalishayutsya u kartoteci ta nikoli ne publikuyutsya Bagatorazove modelyuvannyaInshij aspekt vplivu znannya danih na rezultati statistichnih testiv mozhna pobachiti pri pri analizi danih metodom linijnoyi regresiyi Virishalnim krokom u comu procesi ye rishennya yaki kovariati vklyuchati u rivnyannya yake poyasnyuye odnu abo kilka inshih zminnih Isnuyut yak statistichni poetapna regresiya tak i sensovi mirkuvannya yaki zmushuyut avtoriv viddavati perevagu odnim iz svoyih modelej nad inshimi i ce ye liberalnim vikoristannyam statistichnih testiv Odnak vidkinuti odnu abo kilka zminnih z rivnyannya na osnovi danih oznachaye sho ne mozhna dostovirno zastosovuvati standartni statistichni proceduri do zberezhenih zminnih u rivnyanni tak yak nibi nichogo ne stalosya Prirodno zberezheni zminni povinni buli projti yakus poperednyu perevirku mozhlivo netochnu j intuyitivnu yaku vidkinuti pereminni ne projshli U 1966 r Selvin i Styuart porivnyali zminni zberezheni v modeli z ribami yaki ne projshli kriz sitku v tomu sensi sho yih efekti povinni buti bilshimi nizh efekti tih sho proskochili kriz sitku Ce ne tilki zminyuye rezultati usih nastupnih testiv na ostatochnij poyasnyuvalnij modeli ce mozhe vnesti uperedzhenist ta zminiti serednyu kvadratichnu pomilku v ocinci Prikladi v meteorologiyi ta epidemiologiyiU meteorologiyi gipotezi chasto formulyuyutsya z vikoristannyam danih do teperishnogo chasu i pereviryayutsya na osnovi majbutnih meteorologichnih danih sho garantuye sho navit pidsvidomo majbutni dani ne mozhut vplinuti na formulyuvannya gipotezi Zvichajno taka disciplina vimagaye ochikuvannya poyavi novih danih shob pokazati prognozovanu silu sformulovanoyi teoriyi proti nulovoyi gipotezi Cej proces garantuye sho nihto ne mozhe zvinuvatiti doslidnika u ruchnij pidgonci prognostichnoyi modeli do nayavnih danih oskilki majbutnya pogoda she ne vidoma V yakosti inshogo prikladu pripustimo sho sposterigachi vidznachayut sho u pevnomu misti mozhlivo isnuye ale ne maye tverdoyi gipotezi chomu ce tak Odnak voni mayut dostup do velikoyi kilkosti demografichnih danih pro misto ta okolici sho mistyat vimiri soten abo tisyach riznih zminnih perevazhno nekorelovanih Navit yaksho vsi ci zminni ne zalezhat vid rivnya zahvoryuvanosti na rak velika jmovirnist sho prinajmni odna zminna suttyevo korelyuye iz chastotoyu raku v cij miscevosti Hocha ce mozhe sluguvati na korist gipotezi dlya pidtverdzhennya neobhidne podalshe testuvannya z vikoristannyam tih samih zminnih ale z danimi z inshoyi miscevosti Zauvazhte sho r znachennya 0 01 svidchit pro te sho u 1 vipadkiv rezultat prinajmni takij ekstremalnij bude otrimanij vipadkovo yaksho pereviryayutsya sotni abo tisyachi gipotez iz vzayemno vidnosno nekorelovanimi nezalezhnimi zminnimi to shvidshe za vse mozhna otrimati r znachennya menshe 0 01 dlya bagatoh nulovih gipotez Zasobi zahistuShukati zakonomirnosti v danih ye pravomirnim Zastosuvannya statistichnogo analizu do tih samih danih z yakih viplivaye zakonomirnist ye nepravilnim Odnim iz sposobiv pobudovi gipotez unikayuchi prosiyuvannya danih ye provedennya randomizovanih vibirkovih testiv Doslidnik zbiraye nabir danih a potim vipadkovim chinom rozpodilyaye jogo na dvi pidmnozhini A i B Tilki odna pidmnozhina skazhimo pidmnozhina A doslidzhuyetsya dlya stvorennya gipotez Pislya togo yak gipoteza sformulovana vona povinna buti perevirena na pidmnozhini B yaka ne bula vikoristana dlya pobudovi gipotezi Tilki todi koli dani z pidmnozhini V takozh pidtrimuyut cyu gipotezu ye rozumnim vvazhati sho gipoteza mozhe buti spravedlivoyu Ce prostij tip perehresnoyi perevirki yakij chasto nazivayut navchalnim testom abo validaciyeyu z rozdilenoyu polovinoyu Inshij zasib dlya zahistu pid prosiyuvannya danih ce zapisati kilkist usih testiv znachushosti provedenih pid chas doslidzhennya i prosto rozdiliti riven znachushosti alfa na ce chislo takoyu ye korekciya Bonferroni Odnak ce duzhe konservativnij sposib Zagalnovidomij alfa koeficiyent 0 05 podilenij takim chinom na 1000 shob vrahuvati 1000 testiv znachimosti daye duzhe suvoru alfu 0 00005 Metodami osoblivo korisnimi dlya dispersijnogo analizu ta dlya pobudovi dovirchih intervaliv dlya regresij sho vklyuchayut bazovi funkciyi ye a yaksho doslidnik maye na uvazi lishe poparni porivnyannya Vikoristannya Bendzhamini ta Hohberga ye bilsh skladnim pidhodom yakij stav populyarnim metodom kontrolyu mnozhinnih porivnyan Mozhna chitko rozdiliti analiz danih na pidtverdzhuvanij ta doslidnickij Visnovki sho bazuyutsya na statistici pidhodyat lishe dlya pershogo z nih Zreshtoyu statistichna znachushist testu ta statistichna dovirchist znahidki ye spilnimi vlastivostyami danih i metodu sho vikoristovuyetsya dlya doslidzhennya cih danih Takim chinom yaksho htos kazhe sho pevna podiya maye jmovirnist 20 2 u 19 vipadkiv iz 20 ce oznachaye sho jmovirnist podiyi ocinena same tim metodom yakij vikoristovuvavsya znahoditsya mizh 18 ta 22 z imovirnistyu 0 95 Zhodna zayava pro statistichnu znachushist ne mozhe buti progoloshena bez nalezhnogo vrahuvannya metodu sho vikoristovuyetsya dlya ocinki danih Akademichni zhurnali dedali chastishe perehodyat do praktiki peredzayavlenogo zvitu yakij maye na meti protidiyati duzhe serjoznim problemam takim yak prosiyuvannya danih ta en angl Hypothesizing After the Results are Known visuvannya gipotez pislya togo yak rezultati stali vidomimi yaki zrobili doslidzhennya z testuvannya gipotez duzhe nenadijnimi napriklad zhurnal Nature Human Behaviour perejshov na peredzayavlenij zvit oskilki vin perenosit akcenti z rezultativ doslidzhennya na pitannya yakimi keruyetsya doslidzhennya ta metodi sho vikoristovuyutsya dlya vidpovidi na nih European Journal of Personality viznachaye cej format takim chinom U peredzayavlenomu zviti avtori stvoryuyut propoziciyu doslidzhennya yaka vklyuchaye teoretichni ta empirichni peredumovi doslidnicki pitannya gipotezi ta pilotni dani yaksho taki ye Pislya nadhodzhennya do redakciyi cya propoziciya bude rozglyanuta do pochatku zboru danih i yaksho vona bude prijnyata stattya otrimana v pislya ciyeyi recenzovanoyi proceduri bude opublikovana nezalezhno vid rezultativ doslidzhennya Zagalnodostupnist metodiv ta rezultativ doslidzhennya za principom vidkritoyi nauki she bilshe uskladnyuye vikoristannya prijomu prosiyuvannya danih Spisok literaturiDavey Smith G Ebrahim S 2002 Data dredging bias or confounding BMJ 325 7378 1437 1438 doi 10 1136 bmj 325 7378 1437 PMC 1124898 PMID 12493654 Young S S Karr A 2011 PDF Significance 8 3 116 120 doi 10 1111 j 1740 9713 2011 00506 x Arhiv originalu PDF za 5 grudnya 2020 Procitovano 17 listopada 2020 Selvin H C Stuart A 1966 Data Dredging Procedures in Survey Analysis The American Statistician 20 3 20 23 doi 10 1080 00031305 1966 10480401 JSTOR 2681493 Berk R Brown L Zhao L 2009 J Quant Criminol 26 2 217 236 doi 10 1007 s10940 009 9077 7 Arhiv originalu za 20 veresnya 2020 Procitovano 17 listopada 2020 Promoting reproducibility with registered reports Nature Human Behaviour 1 1 0034 10 sichnya 2017 doi 10 1038 s41562 016 0034 ejp blog com Arhiv originalu za 24 lipnya 2020 Procitovano 17 listopada 2020 Vyse Stuart 2017 41 5 25 27 Arhiv originalu za 5 serpnya 2018 Procitovano 5 serpnya 2018 Dodatkova literatura 30 serpnya 2005 Why Most Published Research Findings Are False San Francisco Public Library of Science 2 8 e124 doi 10 1371 journal pmed 0020124 ISSN 1549 1277 PMC 1182327 PMID 16060722 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite journal title Shablon Cite journal cite journal a Obslugovuvannya CS1 Storinki iz nepoznachenim DOI z bezkoshtovnim dostupom posilannya Head Megan L Holman Luke Lanfear Rob Kahn Andrew T Jennions Michael D 13 bereznya 2015 The Extent and Consequences of P Hacking in Science PLOS Biology 13 3 e1002106 doi 10 1371 journal pbio 1002106 PMC 4359000 PMID 25768323 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite journal title Shablon Cite journal cite journal a Obslugovuvannya CS1 Storinki iz nepoznachenim DOI z bezkoshtovnim dostupom posilannya Insel Thomas 14 listopada 2014 NIMH Director s Blog angl Arhiv originalu za 11 listopada 2020 Procitovano 17 listopada 2020 Smith Gary 2016 Standard Deviations Flawed Assumptions Tortured Data and Other Ways to Lie with Statistics Gerald Duckworth amp Co ISBN 9780715649749