Хибна (уявна) кореляція (англ. spurious relationship) — це взаємозалежність (узгодженість або відповідність) між двома змінними, в основі якої лежить випадковість, а не причиново-наслідковий зв'язок.
Термін викликає непорозуміння, оскільки йдеться власне про уявну причинність. Проте існує не лише уявна, але й фактична кореляція (про розмежування цих понять див.: Кореляція та причиново-наслідковий зв'язок). У будь-якому випадку кореляція — це статистичне поняття, яке не передбачає причинно-наслідкового зв'язку.
Хибна кореляція розглядається у філософії як статистичний відповідник логічній хибі (Cum hoc ergo propter hoc).
Вона виникає, наприклад, під впливом прихованих змінних. Явище уявної кореляції було відоме ще з початку дослідження статистики, а сам термін «spurious correlation» був введений у 1954 році Гербертом А. Саймоном.
Приклад хибної кореляції
Відомим прикладом хибної кореляції є залежність між людською народжуваністю та кількістю пар лелек у різних регіонах Європи. Хоча між цими двома величинами існує відповідність (тобто чим більше лелек гніздиться біля оселі, тим більше дітей з'являється на світ), проте немає певного причинно-наслідкового зв'язку (хибний висновок, що дітей приносить лелека). Кореляція між новонародженими та парами птахів пояснюється через той факт, що зазвичай лелеки селяться в сільській місцевості, де переважають багатодітні сім'ї. Цей приклад хибної кореляції навів Єжи Нейман (1952). Позначивши кількість жінок змінною , народжених дітей , лелек , можна розрахувати значення величин за формулами: і . Далі слід намалювати незалежно розподілені вибірки випадкових змінних і співвіднести показники і , після чого отримуємо хибну кореляцію через спільний знаменник.
В історії траплялись випадки, коли хибні кореляції використовувались зловмисницьки. Наприклад, відомо, що статистик , який отримував фінансування від тютюнових компаній, використовував явище хибної кореляції для висміювання зв'язку між цигарками та хворобами. 22 березня 1965 року Хафф дав свідчення на слуханнях Конгресу США з маркування та реклами цигарок, у яких він звинуватив головного лікаря в допущенні у медичному звіті багатьох «помилок» та «хиб». Свої нападки Хафф доповнював кумедними ремарками та висміював помилкові кореляції, і однією з них була згадана вище кореляція між кількістю лелек та дітей. Його слова мали ефект, на який Хафф розраховував. Сенатор Нойбергер, який модерував слухання, був приголомшений зауваженнями Хаффа:
Ви дійсно думаєте, що між палінням та хворобою існує такий же самий випадковий зв'язок, як і зв'язок стосовно лелек…?
Хибна (уявна) регресія
Хибна (уявна) регресія — це окремий випадок регресії, в якому можна визначити статистично значущий зв'язок між змінною та , який не можна логічно обґрунтувати. Такі явища зумовлені спільною тенденцією у релевантних змінних. Ознакою уявної регресії є високий коефіцієнт детермінації і майже нульовий коефіцієнт Дарбіна — Уотсона (висока позитивна автокореляція першого порядку). Крім того, докази хибної регресії надає тест Дікі-Фуллера, визначаючи часовий ряд як нестаціонарний.
Див. також
Примітки
- R. Matthews: Storks deliver babies (p= 0.008). In: Teaching Statistics. 22(2), 2000, S. 36–38, doi:10.1111/1467-9639.00013.
- Statistical Rules of Thumb, Second Edition. Wiley Series in Probability and Statistics. John Wiley & Sons, Inc. 18 серпня 2008. ISBN .
- «Statement of Mr. Darrell Huff», U.S. Congressional Hearings on Cigarette Labeling and Advertising, March 22, 1965, Bates 1004800682–0694
Джерела
Загальна література
- Гюнтер Бамберг, Франц Баур, Міхаель Крапп: Statistik. 13. видання. Oldenbourg Wissenschaftsverlag, 2007, .
- Удо Келле: Die Integration qualitativer und quantitativer Methoden in der empirischen Sozialforschung: theoretische Grundlagen und methodologische Konzepte.VS Verlag, 2007, , С. 203.
- Proctor, Robert N. (2012). Golden Holocaust: Origins of the Cigarette Catastrophe and the Case for Abolition. Berkeley: University of California Press.
Оригінальні роботи
- Герберт А. Саймон:Spurious correlation: a causal interpretation. In: Journal of the American Statistical Association. Vol. 49, 1954, S. 467—479, doi:10.1080/01621459.1954.10483515 JSTOR 2281124.
- Клайв У. Дж. Грейнджер, Пол Ньюболд: Spurious regressions in econometrics. In: Journal of Econometrics. Nr. 2, 1974, S. 111—120, doi:10.1016/0304-4076(74)90034-7.
Посилання
- Econometrics at the University of Illinois: Econ 508 — Fall 2007. e-Tutorial 10: Monte Carlo Simulation and Nonlinear Regression
- Відео MaiLab «Кореляція vs. причинність»
- Приклади кореляцій
- spurious-correlations
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Hibna uyavna korelyaciya angl spurious relationship ce vzayemozalezhnist uzgodzhenist abo vidpovidnist mizh dvoma zminnimi v osnovi yakoyi lezhit vipadkovist a ne prichinovo naslidkovij zv yazok Spivvidnoshennya kilkosti lelek ta lyudskoyi narodzhuvanosti priklad hibnoyi korelyaciyi Termin viklikaye neporozuminnya oskilki jdetsya vlasne pro uyavnu prichinnist Prote isnuye ne lishe uyavna ale j faktichna korelyaciya pro rozmezhuvannya cih ponyat div Korelyaciya ta prichinovo naslidkovij zv yazok U bud yakomu vipadku korelyaciya ce statistichne ponyattya yake ne peredbachaye prichinno naslidkovogo zv yazku Hibna korelyaciya rozglyadayetsya u filosofiyi yak statistichnij vidpovidnik logichnij hibi Cum hoc ergo propter hoc Vona vinikaye napriklad pid vplivom prihovanih zminnih Yavishe uyavnoyi korelyaciyi bulo vidome she z pochatku doslidzhennya statistiki a sam termin spurious correlation buv vvedenij u 1954 roci Gerbertom A Sajmonom Priklad hibnoyi korelyaciyiVidomim prikladom hibnoyi korelyaciyi ye zalezhnist mizh lyudskoyu narodzhuvanistyu ta kilkistyu par lelek u riznih regionah Yevropi Hocha mizh cimi dvoma velichinami isnuye vidpovidnist tobto chim bilshe lelek gnizditsya bilya oseli tim bilshe ditej z yavlyayetsya na svit prote nemaye pevnogo prichinno naslidkovogo zv yazku hibnij visnovok sho ditej prinosit leleka Korelyaciya mizh novonarodzhenimi ta parami ptahiv poyasnyuyetsya cherez toj fakt sho zazvichaj leleki selyatsya v silskij miscevosti de perevazhayut bagatoditni sim yi Cej priklad hibnoyi korelyaciyi naviv Yezhi Nejman 1952 Poznachivshi kilkist zhinok zminnoyu X displaystyle X narodzhenih ditej Y displaystyle Y lelek Z displaystyle Z mozhna rozrahuvati znachennya velichin za formulami r1 Y X displaystyle r 1 Y X i r2 Z X displaystyle r 2 Z X Dali slid namalyuvati nezalezhno rozpodileni vibirki vipadkovih zminnih i spivvidnesti pokazniki r1 displaystyle r 1 i r2 displaystyle r 2 pislya chogo otrimuyemo hibnu korelyaciyu cherez spilnij znamennik V istoriyi traplyalis vipadki koli hibni korelyaciyi vikoristovuvalis zlovmisnicki Napriklad vidomo sho statistik yakij otrimuvav finansuvannya vid tyutyunovih kompanij vikoristovuvav yavishe hibnoyi korelyaciyi dlya vismiyuvannya zv yazku mizh cigarkami ta hvorobami 22 bereznya 1965 roku Haff dav svidchennya na sluhannyah Kongresu SShA z markuvannya ta reklami cigarok u yakih vin zvinuvativ golovnogo likarya v dopushenni u medichnomu zviti bagatoh pomilok ta hib Svoyi napadki Haff dopovnyuvav kumednimi remarkami ta vismiyuvav pomilkovi korelyaciyi i odniyeyu z nih bula zgadana vishe korelyaciya mizh kilkistyu lelek ta ditej Jogo slova mali efekt na yakij Haff rozrahovuvav Senator Nojberger yakij moderuvav sluhannya buv prigolomshenij zauvazhennyami Haffa Vi dijsno dumayete sho mizh palinnyam ta hvoroboyu isnuye takij zhe samij vipadkovij zv yazok yak i zv yazok stosovno lelek Hibna uyavna regresiyaHibna uyavna regresiya ce okremij vipadok regresiyi v yakomu mozhna viznachiti statistichno znachushij zv yazok mizh zminnoyu Yt displaystyle Y t ta Xt displaystyle X t yakij ne mozhna logichno obgruntuvati Taki yavisha zumovleni spilnoyu tendenciyeyu u relevantnih zminnih Oznakoyu uyavnoyi regresiyi ye visokij koeficiyent determinaciyi R2 displaystyle R 2 i majzhe nulovij koeficiyent Darbina Uotsona visoka pozitivna avtokorelyaciya pershogo poryadku Krim togo dokazi hibnoyi regresiyi nadaye test Diki Fullera viznachayuchi chasovij ryad yak nestacionarnij Liniya regresiyi mizh dvoma nezalezhnimi AR 1 procesami z korenem z odinici vklyuchayuchi t displaystyle t statistiku Div takozhVeliki daniPrimitkiR Matthews Storks deliver babies p 0 008 In Teaching Statistics 22 2 2000 S 36 38 doi 10 1111 1467 9639 00013 Statistical Rules of Thumb Second Edition Wiley Series in Probability and Statistics John Wiley amp Sons Inc 18 serpnya 2008 ISBN 978 0 470 37796 3 Statement of Mr Darrell Huff U S Congressional Hearings on Cigarette Labeling and Advertising March 22 1965 Bates 1004800682 0694DzherelaZagalna literatura Gyunter Bamberg Franc Baur Mihael Krapp Statistik 13 vidannya Oldenbourg Wissenschaftsverlag 2007 ISBN 978 3 486 58188 1 Udo Kelle Die Integration qualitativer und quantitativer Methoden in der empirischen Sozialforschung theoretische Grundlagen und methodologische Konzepte VS Verlag 2007 ISBN 978 3 531 15312 4 S 203 Proctor Robert N 2012 Golden Holocaust Origins of the Cigarette Catastrophe and the Case for Abolition Berkeley University of California Press ISBN 9780520270169Originalni roboti Gerbert A Sajmon Spurious correlation a causal interpretation In Journal of the American Statistical Association Vol 49 1954 S 467 479 doi 10 1080 01621459 1954 10483515 JSTOR 2281124 Klajv U Dzh Grejndzher Pol Nyubold Spurious regressions in econometrics In Journal of Econometrics Nr 2 1974 S 111 120 doi 10 1016 0304 4076 74 90034 7 PosilannyaEconometrics at the University of Illinois Econ 508 Fall 2007 e Tutorial 10 Monte Carlo Simulation and Nonlinear Regression Video MaiLab Korelyaciya vs prichinnist Prikladi korelyacij spurious correlations