У статистиці коефіцієнт кореляції рангу Кендала, як правило, називають -коефіцієнт (тау-коефіцієнт) Кендла. Він використовується у статистиці для вимірювання зв'язку між двома величинами. -тест — це непараметричний тест статистичних гіпотез залежності на основі -коефіцієнта. Зокрема, він є мірою рангової кореляції, тобто подібності упорядкування даних, коли вони упорядкуванні за своєю величиною. Цей коефіцієнт названий на честь , який розробив теорію, в якій використовував цей коефіцієнт, в 1938 році, хоча Густав Фехнер запропонував аналогічну міру в контексті часових рядів ще в 1897 році.
Означення
Нехай — набір спостережень спільних випадкових величин X і Y відповідно, так що всі значення (xк) і (yк) не є однаковими для будь-якого k=1..n. Будь-яка пара спостережень і називається узгодженою, якщо узгоджені ряди для обох елементів: тобто, якщо та або якщо та . Вони називаються неузгодженими (або дисонуючими), якщо та або якщо та . Якщо або , то пара не є ні узгодженою ні неузгодженою.
— коефіцієнт Кендалла визначається наступним чином:
Де — кількість узгоджених пар, — кількість неузгоджених пар.
- Властивості
- Знаменник — це загальна кількість пар, отже коефіцієнт знаходить в діапазоні .
- Якщо узгодженість між двома величинами X та Y є ідеальною (тобто ранги двох величин збігаються), то коефіцієнт має значення 1.
- Якщо розбіжність між двома величинами X та Y є ідеальною (тобто вони мають обернені порядки зростання), то коефіцієнт дорівнює −1.
- Якщо X та Y незалежні, то математичне сподівання дорівнює нулю.
- Використовуючи signum-функцію формулу можна записати у вигляді .
Перевірка гіпотези
Коефіцієнт рангу Кендала часто використовується для статистичної оцінки в перевірці статистичних гіпотез для визначення чи можуть дві змінні розглядатись як статистично залежні. Цей тест є непараметричний, так як він не залежить від будь-яких припущень про розподіл X або Y або розподіл (x, y). При нульовій гіпотезі незалежності X і Y, вибірковий розподіл τ має очікуване значення -нуль. Точний розподіл не може бути охарактеризований з точки зору спільних розподілів, але може вираховуватись для малих вибірок; для більших вибірок, поширеним є використання наближення для нормального розподілу з математичним сподіванням рівним нулю і дисперсією випадкової величини.
Облік зв'язків
Пара {(xi, yi), (xj, yj)}, як кажуть, зв'язані, якщо xi = xi або yi=yj; зв'язні пари не є ні узгодженими ні неузгодженими. Якщо пов'язанні пари виникають в даних, коефіцієнт може бути змінений декількома способами, щоб тримати його в діапазоні [-1, 1]:
- -a
Статистична величина -a перевіряє міру узгодженості таблиці всіх пар (xi, yi),. Обидві змінні повинні бути порядковим.
- -b
Статистична величина -b, на відміну від -a, вносить зміни в зв'язки. Значення -b знаходяться в діапазоні від −1 до +1. Нульове значення свідчить про відсутність узгодженості. -b коефіцієнт визначається таким чином:
Де:
= кількість узгоджених пар
= кількість неузгоджених пар
= кількість зв'язків величин в i-тій групі зв'язків першої величини
= зв'язків величин в j-тій групі зв'язків другої величини
- -c
-c відрізняється від -b тим, що більш підходить для прямокутних ніж для квадратних таблиць.
Приклад
- Коли дві величини є статистично незалежними, то розподіл не можна легко описати виходячи з відомих розподілів. Проте, для наступна величина — — наближено розподілена у вигляді нормального розподілу, якщо зміні є статистично незалежними:
- Таким чином, щоб перевірити чи є дві змінні залежними, обчислюють та знаходять кумулятивну ймовірність для стандартного нормального розподілу на -||.
має той самий розподіл, що й розподіл і приблизно дорівнює стандартному нормальному розподілу, коли величини статистично незалежні:
Де
Посилання
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U statistici koeficiyent korelyaciyi rangu Kendala yak pravilo nazivayut t displaystyle tau koeficiyent tau koeficiyent Kendla Vin vikoristovuyetsya u statistici dlya vimiryuvannya zv yazku mizh dvoma velichinami t displaystyle tau test ce neparametrichnij test statistichnih gipotez zalezhnosti na osnovi t displaystyle tau koeficiyenta Zokrema vin ye miroyu rangovoyi korelyaciyi tobto podibnosti uporyadkuvannya danih koli voni uporyadkuvanni za svoyeyu velichinoyu Cej koeficiyent nazvanij na chest yakij rozrobiv teoriyu v yakij vikoristovuvav cej koeficiyent v 1938 roci hocha Gustav Fehner zaproponuvav analogichnu miru v konteksti chasovih ryadiv she v 1897 roci OznachennyaUsi tochki v sirih pryamokutnikah ye uzgodzhenimi a vsi tochki v bilih pryamokutnikah ye neuzgodzhenimi z tochkoyu X1 Y1 displaystyle X 1 Y 1 Zagalom na grafiku ye n 30 displaystyle n 30 tochok yaki utvoryuyut 302 435 displaystyle binom 30 2 435 mozhlivih par 395 z cih par ye uzgodzhenimi 40 par neuzgodzhenimi sho daye koeficiyent korelyaciyi rangu Kendala 0 816 Nehaj x1 y1 x2 y2 xn yn displaystyle x 1 y 1 x 2 y 2 dots x n y n nabir sposterezhen spilnih vipadkovih velichin X i Y vidpovidno tak sho vsi znachennya xk i yk ne ye odnakovimi dlya bud yakogo k 1 n Bud yaka para sposterezhen xi yi displaystyle x i y i i xj yj displaystyle x j y j nazivayetsya uzgodzhenoyu yaksho uzgodzheni ryadi dlya oboh elementiv tobto yaksho xi gt xj displaystyle x i gt x j ta yi gt yj displaystyle y i gt y j abo yaksho xi lt xj displaystyle x i lt x j ta yi lt yj displaystyle y i lt y j Voni nazivayutsya neuzgodzhenimi abo disonuyuchimi yaksho xi gt xj displaystyle x i gt x j ta yi lt yj displaystyle y i lt y j abo yaksho xi lt xj displaystyle x i lt x j ta yi gt yj displaystyle y i gt y j Yaksho xi xj displaystyle x i x j abo yi yj displaystyle y i y j to para ne ye ni uzgodzhenoyu ni neuzgodzhenoyu t displaystyle tau koeficiyent Kendalla viznachayetsya nastupnim chinom t s1 s212n n 1 displaystyle tau frac s 1 s 2 frac 1 2 n n 1 De s1 displaystyle s 1 kilkist uzgodzhenih par s2 displaystyle s 2 kilkist neuzgodzhenih par VlastivostiZnamennik ce zagalna kilkist par otzhe koeficiyent znahodit v diapazoni 1 t 1 displaystyle 1 leqslant tau leqslant 1 Yaksho uzgodzhenist mizh dvoma velichinami X ta Y ye idealnoyu tobto rangi dvoh velichin zbigayutsya to koeficiyent maye znachennya 1 Yaksho rozbizhnist mizh dvoma velichinami X ta Y ye idealnoyu tobto voni mayut oberneni poryadki zrostannya to koeficiyent dorivnyuye 1 Yaksho X ta Y nezalezhni to matematichne spodivannya t displaystyle tau dorivnyuye nulyu Vikoristovuyuchi signum funkciyu formulu mozhna zapisati u viglyadi t 2n n 1 i lt jsgn xi xj sgn yi yj displaystyle tau frac 2 n n 1 sum i lt j operatorname sgn x i x j operatorname sgn y i y j Perevirka gipoteziKoeficiyent rangu Kendala chasto vikoristovuyetsya dlya statistichnoyi ocinki v perevirci statistichnih gipotez dlya viznachennya chi mozhut dvi zminni rozglyadatis yak statistichno zalezhni Cej test ye neparametrichnij tak yak vin ne zalezhit vid bud yakih pripushen pro rozpodil X abo Y abo rozpodil x y Pri nulovij gipotezi nezalezhnosti X i Y vibirkovij rozpodil t maye ochikuvane znachennya nul Tochnij rozpodil ne mozhe buti oharakterizovanij z tochki zoru spilnih rozpodiliv ale mozhe virahovuvatis dlya malih vibirok dlya bilshih vibirok poshirenim ye vikoristannya nablizhennya dlya normalnogo rozpodilu z matematichnim spodivannyam rivnim nulyu i dispersiyeyu vipadkovoyi velichini Oblik zv yazkivPara xi yi xj yj yak kazhut zv yazani yaksho xi xi abo yi yj zv yazni pari ne ye ni uzgodzhenimi ni neuzgodzhenimi Yaksho pov yazanni pari vinikayut v danih koeficiyent mozhe buti zminenij dekilkoma sposobami shob trimati jogo v diapazoni 1 1 t displaystyle tau a Statistichna velichina t displaystyle tau a pereviryaye miru uzgodzhenosti tablici vsih par xi yi Obidvi zminni povinni buti poryadkovim t displaystyle tau b Statistichna velichina t displaystyle tau b na vidminu vid t displaystyle tau a vnosit zmini v zv yazki Znachennya t displaystyle tau b znahodyatsya v diapazoni vid 1 do 1 Nulove znachennya svidchit pro vidsutnist uzgodzhenosti t displaystyle tau b koeficiyent viznachayetsya takim chinom tB nc nd n0 n1 n0 n2 displaystyle tau B frac n c n d sqrt n 0 n 1 n 0 n 2 De n0 n n 1 2n1 iti ti 1 2n2 juj uj 1 2 displaystyle begin aligned n 0 amp n n 1 2 n 1 amp sum i t i t i 1 2 n 2 amp sum j u j u j 1 2 end aligned nc displaystyle n c kilkist uzgodzhenih par nd displaystyle n d kilkist neuzgodzhenih par ti displaystyle t i kilkist zv yazkiv velichin v i tij grupi zv yazkiv pershoyi velichini uj displaystyle u j zv yazkiv velichin v j tij grupi zv yazkiv drugoyi velichini t displaystyle tau c t displaystyle tau c vidriznyayetsya vid t displaystyle tau b tim sho bilsh pidhodit dlya pryamokutnih nizh dlya kvadratnih tablic PrikladKoli dvi velichini ye statistichno nezalezhnimi to rozpodil t displaystyle tau ne mozhna legko opisati vihodyachi z vidomih rozpodiliv Prote dlya tA displaystyle tau A nastupna velichina ZA displaystyle mathrm Z A nablizheno rozpodilena u viglyadi normalnogo rozpodilu yaksho zmini ye statistichno nezalezhnimi zA 3 nc nd n n 1 2n 5 2 displaystyle z A frac 3 n c n d sqrt n n 1 2n 5 2 Takim chinom shob pereviriti chi ye dvi zminni zalezhnimi obchislyuyut ZA displaystyle mathrm Z A ta znahodyat kumulyativnu jmovirnist dlya standartnogo normalnogo rozpodilu na ZA displaystyle mathrm Z A ZB displaystyle mathrm Z B maye toj samij rozpodil sho j tB displaystyle tau B rozpodil i priblizno dorivnyuye standartnomu normalnomu rozpodilu koli velichini statistichno nezalezhni ZB nc ndv displaystyle mathbb Z B frac n c n d sqrt v De v v0 vt vu 18 v1 v2v0 n n 1 2n 5 vt iti ti 1 2ti 5 vu juj uj 1 2uj 5 v1 iti ti 1 juj uj 1 2n n 1 v2 iti ti 1 ti 2 juj uj 1 uj 2 9n n 1 n 2 displaystyle begin array ccl v amp amp v 0 v t v u 18 v 1 v 2 v 0 amp amp n n 1 2n 5 v t amp amp sum i t i t i 1 2t i 5 v u amp amp sum j u j u j 1 2u j 5 v 1 amp amp sum i t i t i 1 sum j u j u j 1 2n n 1 v 2 amp amp sum i t i t i 1 t i 2 sum j u j u j 1 u j 2 9n n 1 n 2 end array Posilannya