У статистиці кореляція рангу — це будь-яка із кількох статистик, які вимірюють порядкове-з'єднання — відносини між ранжируванням різних порядкових змінних або різних кореляцій однієї і тієї ж змінної, де «ранжируванням» називається наданням позначок «перший», «другий», «третій» і т. д. різним спостереженнями конкретної змінної. Коефіцієнт кореляції рангу вимірює ступінь подібності між двома ранжируваннями, і може бути використаний для оцінки статистичної значущості співвідношення між ними. Наприклад, двома загальними непараметричними методами важливості, які використовують кореляцію рангу є U-критерій Манна-Уітні і тест рангу Уілкоксона.
Контекст
Якщо, наприклад, одна змінна є одиницею, що позначає програми університетського баскетболу, а інша змінна позначає програму університетського футболу, можна було б оцінити співвідношення результатів соціального опитування: чи мають університети з вищою оцінкою баскетбольної програми тенденцію до володіння ще й високими оцінками футбольної програми? Коефіцієнт рангу кореляції може виміряти такі співвідношення, та міра значущості коефіцієнта рангу кореляції може показати, чи виміряне відношення є досить малим аби воно могло вважатися збігом.
Якщо є тільки одна змінна, що позначає футбольну програму коледжу, але яка є предметом для опитувань двох різних груп (скажімо, тренерів та авторів спортивних статей), тоді подібність результатів двох опитувань може визначатися за допомогою коефіцієнту кореляції рангу.
Як інший приклад, у таблиці спряженості з низькими, середнім і високим рівнем прибутку як змінної рядка та рівня освіти як змінної стовпця кореляція рангу допомагає виміряти співвідношення між прибутком та освітнім рівнем.
Коефіцієнти кореляції
Деякі з найбільш популярних статистичних даних кореляції рангу:
- ρ Спірмена
- τ Кендалла
- γ Гудмана та Крускала
- D Соммерса
Коефіцієнт кореляції рангу, що підвищується, означає зростання співвідношення між ранжируваннями. Коефіцієнт лежить в інтервалі [-1, 1] та приймає значення:
- 1, якщо співвідношення між двома ранжируваннями є досконалим; два результати однакові.
- 0, якщо ранжирування є абсолютно незалежними.
- -1, Якщо розбіжність між двома ранжируваннями є досконалою; один результат є протилежністю іншого.
Згідно з Діаконієм (1988), ранжування може розглядатися як перестановка множини об'єктів. Таким чином, ми можемо розглядати рейтинги, що знаходяться під спостереженням, як дані, отримані, коли зразкова вибірка є (ототожнюється з) симетричною групою. Тоді можна ввести метрику, перетворюючи симетричну групу в метричний простір. Різні метрики будуть відповідати різним кореляціям рангів.
Загальний коефіцієнт кореляції
Кендалл (1944) показав, що його (тау) і (ро) Спірмена є окремими випадками загального коефіцієнта кореляції.
Припустимо, що у нас є безліч об'єктів, які розглядаються у співвідношенні з двома властивостями, представленими і , що утворюють безлічі значень і . Для будь-якої пари значень, скажімо, -й та -го ми призначаємо -рахунок, що позначається та -рахунок, що позначається через . (Зверніть увагу, оскільки вони є порівняннями , і не існують для ). Лише однією вимогою для цих функцій є лише те, що вони повинні бути не симетричними, тож і . Тоді узагальнений коефіцієнт кореляції визначається як
тау Кендалла як окремий випадок
Якщо , є ранжуваннями значень згідно з якістю та якістю відповідно, то ми можемо визначити
Сума є подвоєною кількістю узгоджених пар, зменшеного числа неузгоджених пар (див коефіцієнт кореляції рангу Кендала). Сума є лише , кількістю виразів , як і . Таким чином, в даному випадку,
Спірмена як окремий випадок
Якщо , є категоріями -значень згідно з та якістю у відповідно, ми можемо просто визначити
Суми і є рівними, оскільки і належать проміжку від до , Тоді ми маємо:
отже
оскільки та обидві дорівнюють сумі перших натуральних чисел, а саме .
Ми також маємо
і тоді
є сумою квадратів перших натуральних чисел дорівнює . Таким чином, останнє рівняння зводиться до
Отже
і, таким чином, підставляючи ці результати у початкову формулу ми отримуємо
де , є різницею між ранжируваннями.
Ранг-бірядна кореляція
Жене Гласс (1965) зазначив, що бірядне ранжирування може бути отримано з Спірмена. «Можна вивести коефіцієнт, визначений на X, дихотомічної змінній, і Y, змінній ранжирування, яка оцінює Rho Спірмена між X і Y таким же чином, що бірядне г оцінює г Пірсона між двома нормальними змінними». Ранг бірядної кореляції був введена за дев'ять років до Едвард Куретона (1956) як метод визначення кореляції рангу, якщо ряди розподілені на два групи.
Формула простої різниці Кєрбі
Дейв Кербі (2014 рік) рекомендував застосовувати бірядний ранг як вступ студентів до вивчення кореляції рангу, оскільки загальна логіка може бути пояснена на початковому рівні. Бірядний ранг є співвідношенням, що використовується для визначення U-критерію Манна-Уітні, що зазвичай розглядається на ввідних лекціях статистики в університетах. Дані для цього тесту складається з двох груп; і для кожного члена групи, результат ранжирується для дослідження в цілому.
Кербі показав, що ця кореляція рангу може бути виражена в термінах двох понять: відсоток даних, які підтримують зазначену гіпотезу та відсоток даних, що її не підтримують. Формула простої різниці Кербі стверджує, що кореляція рангу може бути виражена як різниця між співвідношенням сприятливих подій (f) та несприятливих подій (u).
Приклад і розуміння
Щоб проілюструвати обчислення, припустимо, що тренер готує бігунів на довгі дистанції протягом одного місяця, використовуючи два методи. Група А складається з 5 бігунів, і групи B — з 4 бігунів. Зазначена гіпотеза полягає в тому, що метод А готує швидших бігунів. Змагання для оцінки результатів показує, що бігуни з групи А дійсно працюють швидше, з наступним ранжируванням: 1, 2, 3, 4 і 6. Найповільніші бігуни з групи B, таким чином, мають ранжування 5, 7, 8 і 9.
Аналіз проводиться за парами, які складаються з одного члена із кожної групи. Наприклад, найшвидший бігун у дослідженні є членом чотирьох пар: (1,5), (1,7), (1,8) і (1,9). Всі ці чотири пари підтверджують гіпотезу, тому що в кожній парі бігун з групи А швидший, ніж бігун з групи В. У результаті ми маємо 20 пар, 19 з яких підтверджують гіпотезу. Єдина пара, яка не підтримує гіпотезу складається з двох бігунів ранжуванням 5 і 6, тому що в цій парі бігун з групи Б пробіг швидше. Згідно з формулою простої різниці Кєрбі, 95 % даних, підтверджують гіпотезу (19 з 20 пар), і 5 % не підтримують (1 з 20 пар), тому ранг кореляції г = +0,95 — +0,05 = 0,90.
Максимальне значення для кореляції r = 1, що означає, що 100 % пар підтверджують гіпотезу. Кореляція г = 0 вказує на те, що половина пар підтверджують гіпотезу, а друга половина — ні. Іншими словами, вибірка групи не відрізняються ранжуванням, так що немає жодних доказів того, що вони походять з двох різних груп населення. Величина ефекту r = 0, може визначатися для того, щоб описати відсутність зв'язку між членами вибірки та їх ранжуванні.
Посилання
- Cureton, E. E. (1956). Rank-biserial correlation. Psychometrika 21, 287—290. DOI:10.1007/BF02289138
- Everitt, B. S. (2002), The Cambridge Dictionary of Statistics, Cambridge: Cambridge University Press, ISBN
- Diaconis, P. (1988), Group Representations in Probability and Statistics, Lecture Notes-Monograph Series, Hayward, CA: Institute of Mathematical Statistics, ISBN
- Glass, G. V. (1965). A ranking variable analogue of biserial correlation: implications for short-cut item analysis. Journal of Educational Measurement, 2(1), 91–95. DOI: 10.1111/j.1745-3984.1965.tb00396.x
- Kendall, M. G. (1970), Rank Correlation Methods, London: Griffin, ISBN
- Kerby, D. S. (2014). The simple difference formula: An approach to teaching nonparametric correlation. Comprehensive Psychology, volume 3, article 1. doi:10.2466/11.IT.3.1. link to article [ 31 грудня 2019 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U statistici korelyaciya rangu ce bud yaka iz kilkoh statistik yaki vimiryuyut poryadkove z yednannya vidnosini mizh ranzhiruvannyam riznih poryadkovih zminnih abo riznih korelyacij odniyeyi i tiyeyi zh zminnoyi de ranzhiruvannyam nazivayetsya nadannyam poznachok pershij drugij tretij i t d riznim sposterezhennyami konkretnoyi zminnoyi Koeficiyent korelyaciyi rangu vimiryuye stupin podibnosti mizh dvoma ranzhiruvannyami i mozhe buti vikoristanij dlya ocinki statistichnoyi znachushosti spivvidnoshennya mizh nimi Napriklad dvoma zagalnimi neparametrichnimi metodami vazhlivosti yaki vikoristovuyut korelyaciyu rangu ye U kriterij Manna Uitni i test rangu Uilkoksona KontekstYaksho napriklad odna zminna ye odiniceyu sho poznachaye programi universitetskogo basketbolu a insha zminna poznachaye programu universitetskogo futbolu mozhna bulo b ociniti spivvidnoshennya rezultativ socialnogo opituvannya chi mayut universiteti z vishoyu ocinkoyu basketbolnoyi programi tendenciyu do volodinnya she j visokimi ocinkami futbolnoyi programi Koeficiyent rangu korelyaciyi mozhe vimiryati taki spivvidnoshennya ta mira znachushosti koeficiyenta rangu korelyaciyi mozhe pokazati chi vimiryane vidnoshennya ye dosit malim abi vono moglo vvazhatisya zbigom Yaksho ye tilki odna zminna sho poznachaye futbolnu programu koledzhu ale yaka ye predmetom dlya opituvan dvoh riznih grup skazhimo treneriv ta avtoriv sportivnih statej todi podibnist rezultativ dvoh opituvan mozhe viznachatisya za dopomogoyu koeficiyentu korelyaciyi rangu Yak inshij priklad u tablici spryazhenosti z nizkimi serednim i visokim rivnem pributku yak zminnoyi ryadka ta rivnya osviti yak zminnoyi stovpcya korelyaciya rangu dopomagaye vimiryati spivvidnoshennya mizh pributkom ta osvitnim rivnem Koeficiyenti korelyaciyiDeyaki z najbilsh populyarnih statistichnih danih korelyaciyi rangu r Spirmena t Kendalla g Gudmana ta Kruskala D Sommersa Koeficiyent korelyaciyi rangu sho pidvishuyetsya oznachaye zrostannya spivvidnoshennya mizh ranzhiruvannyami Koeficiyent lezhit v intervali 1 1 ta prijmaye znachennya 1 yaksho spivvidnoshennya mizh dvoma ranzhiruvannyami ye doskonalim dva rezultati odnakovi 0 yaksho ranzhiruvannya ye absolyutno nezalezhnimi 1 Yaksho rozbizhnist mizh dvoma ranzhiruvannyami ye doskonaloyu odin rezultat ye protilezhnistyu inshogo Zgidno z Diakoniyem 1988 ranzhuvannya mozhe rozglyadatisya yak perestanovka mnozhini ob yektiv Takim chinom mi mozhemo rozglyadati rejtingi sho znahodyatsya pid sposterezhennyam yak dani otrimani koli zrazkova vibirka ye ototozhnyuyetsya z simetrichnoyu grupoyu Todi mozhna vvesti metriku peretvoryuyuchi simetrichnu grupu v metrichnij prostir Rizni metriki budut vidpovidati riznim korelyaciyam rangiv Zagalnij koeficiyent korelyaciyiKendall 1944 pokazav sho jogo t displaystyle tau tau i r displaystyle rho ro Spirmena ye okremimi vipadkami zagalnogo koeficiyenta korelyaciyi Pripustimo sho u nas ye bezlich n displaystyle n ob yektiv yaki rozglyadayutsya u spivvidnoshenni z dvoma vlastivostyami predstavlenimi x displaystyle x i y displaystyle y sho utvoryuyut bezlichi znachen xi i n displaystyle x i i leq n i yi i n displaystyle y i i leq n Dlya bud yakoyi pari znachen skazhimo i displaystyle i j ta j displaystyle j go mi priznachayemo x displaystyle x rahunok sho poznachayetsya aij displaystyle a ij ta y displaystyle y rahunok sho poznachayetsya cherez bij displaystyle b ij Zvernit uvagu oskilki voni ye porivnyannyami aij displaystyle a ij i bij displaystyle b ij ne isnuyut dlya i j displaystyle i j Lishe odniyeyu vimogoyu dlya cih funkcij ye lishe te sho voni povinni buti ne simetrichnimi tozh aij aji displaystyle a ij a ji i bij bji displaystyle b ij b ji Todi uzagalnenij koeficiyent korelyaciyi G displaystyle Gamma viznachayetsya yak G i j 1naijbij i j 1naij2 i j 1nbij2 displaystyle Gamma frac sum i j 1 n a ij b ij sqrt sum i j 1 n a ij 2 sum i j 1 n b ij 2 t displaystyle tau tau Kendalla yak okremij vipadok Yaksho ri displaystyle r i si displaystyle s i ye ranzhuvannyami i displaystyle i znachen zgidno z yakistyu x displaystyle x ta yakistyu y displaystyle y vidpovidno to mi mozhemo viznachiti aij sgn rj ri bij sgn sj si displaystyle a ij operatorname sgn r j r i quad b ij operatorname sgn s j s i Suma aijbij displaystyle sum a ij b ij ye podvoyenoyu kilkistyu uzgodzhenih par zmenshenogo chisla neuzgodzhenih par div koeficiyent korelyaciyi rangu Kendala Suma aij2 displaystyle sum a ij 2 ye lishe n n 1 displaystyle n n 1 kilkistyu viraziv aij displaystyle a ij yak i bij2 displaystyle sum b ij 2 Takim chinom v danomu vipadku G 2 number of concordant pairs number of discordant pairs n n 1 n n 1 Kendall s t displaystyle Gamma frac 2 text number of concordant pairs text number of discordant pairs sqrt n n 1 n n 1 text Kendall s tau r displaystyle rho Spirmena yak okremij vipadok Yaksho ri displaystyle r i si displaystyle s i ye kategoriyami i displaystyle i znachen zgidno z x displaystyle x ta yakistyu y displaystyle y u vidpovidno mi mozhemo prosto viznachiti aij rj ri displaystyle a ij r j r i bij sj si displaystyle b ij s j s i Sumi aij2 displaystyle sum a ij 2 i bij2 displaystyle sum b ij 2 ye rivnimi oskilki ri displaystyle r i i si displaystyle s i nalezhat promizhku vid 1 displaystyle 1 do n displaystyle n Todi mi mayemo G rj ri sj si rj ri 2 displaystyle Gamma frac sum r j r i s j s i sum r j r i 2 otzhe i j 1n rj ri sj si i 1n j 1nrisi i 1n j 1nrjsj i 1n j 1n risj rjsi displaystyle sum i j 1 n r j r i s j s i sum i 1 n sum j 1 n r i s i sum i 1 n sum j 1 n r j s j sum i 1 n sum j 1 n r i s j r j s i 2n i 1nrisi 2 i 1nri j 1nsj displaystyle 2n sum i 1 n r i s i 2 sum i 1 n r i sum j 1 n s j 2n i 1nrisi 12n2 n 1 2 displaystyle 2n sum i 1 n r i s i frac 1 2 n 2 n 1 2 oskilki ri displaystyle sum r i ta sj displaystyle sum s j obidvi dorivnyuyut sumi pershih n displaystyle n naturalnih chisel a same 12n n 1 displaystyle frac 1 2 n n 1 Mi takozh mayemo S i 1n ri si 2 2 ri2 2 risi displaystyle S sum i 1 n r i s i 2 2 sum r i 2 2 sum r i s i i todi rj ri sj si 2n ri2 12n2 n 1 2 nS displaystyle sum r j r i s j s i 2n sum r i 2 frac 1 2 n 2 n 1 2 nS ri2 displaystyle sum r i 2 ye sumoyu kvadrativ pershih n displaystyle n naturalnih chisel dorivnyuye 16n n 1 2n 1 displaystyle frac 1 6 n n 1 2n 1 Takim chinom ostannye rivnyannya zvoditsya do rj ri sj si 16n2 n2 1 nS displaystyle sum r j r i s j s i frac 1 6 n 2 n 2 1 nS Otzhe rj ri 2 2n ri2 2 rirj displaystyle sum r j r i 2 2n sum r i 2 2 sum r i r j 2n ri2 2 ri 2 16n2 n2 1 displaystyle 2n sum r i 2 2 sum r i 2 frac 1 6 n 2 n 2 1 i takim chinom pidstavlyayuchi ci rezultati u pochatkovu formulu mi otrimuyemo GR 1 6 di2n3 n displaystyle Gamma R 1 frac 6 sum d i 2 n 3 n de di xi yi displaystyle d i x i y i ye rizniceyu mizh ranzhiruvannyami sho ye koeficiyentom korelyaciyi rangu Spirmena r displaystyle rho Rang biryadna korelyaciyaZhene Glass 1965 zaznachiv sho biryadne ranzhiruvannya mozhe buti otrimano z r displaystyle rho Spirmena Mozhna vivesti koeficiyent viznachenij na X dihotomichnoyi zminnij i Y zminnij ranzhiruvannya yaka ocinyuye Rho Spirmena mizh X i Y takim zhe chinom sho biryadne g ocinyuye g Pirsona mizh dvoma normalnimi zminnimi Rang biryadnoyi korelyaciyi buv vvedena za dev yat rokiv do Edvard Kuretona 1956 yak metod viznachennya korelyaciyi rangu yaksho ryadi rozpodileni na dva grupi Formula prostoyi riznici Kyerbi Dejv Kerbi 2014 rik rekomenduvav zastosovuvati biryadnij rang yak vstup studentiv do vivchennya korelyaciyi rangu oskilki zagalna logika mozhe buti poyasnena na pochatkovomu rivni Biryadnij rang ye spivvidnoshennyam sho vikoristovuyetsya dlya viznachennya U kriteriyu Manna Uitni sho zazvichaj rozglyadayetsya na vvidnih lekciyah statistiki v universitetah Dani dlya cogo testu skladayetsya z dvoh grup i dlya kozhnogo chlena grupi rezultat ranzhiruyetsya dlya doslidzhennya v cilomu Kerbi pokazav sho cya korelyaciya rangu mozhe buti virazhena v terminah dvoh ponyat vidsotok danih yaki pidtrimuyut zaznachenu gipotezu ta vidsotok danih sho yiyi ne pidtrimuyut Formula prostoyi riznici Kerbi stverdzhuye sho korelyaciya rangu mozhe buti virazhena yak riznicya mizh spivvidnoshennyam spriyatlivih podij f ta nespriyatlivih podij u r f u displaystyle r f u Priklad i rozuminnya Shob proilyustruvati obchislennya pripustimo sho trener gotuye biguniv na dovgi distanciyi protyagom odnogo misyacya vikoristovuyuchi dva metodi Grupa A skladayetsya z 5 biguniv i grupi B z 4 biguniv Zaznachena gipoteza polyagaye v tomu sho metod A gotuye shvidshih biguniv Zmagannya dlya ocinki rezultativ pokazuye sho biguni z grupi A dijsno pracyuyut shvidshe z nastupnim ranzhiruvannyam 1 2 3 4 i 6 Najpovilnishi biguni z grupi B takim chinom mayut ranzhuvannya 5 7 8 i 9 Analiz provoditsya za parami yaki skladayutsya z odnogo chlena iz kozhnoyi grupi Napriklad najshvidshij bigun u doslidzhenni ye chlenom chotiroh par 1 5 1 7 1 8 i 1 9 Vsi ci chotiri pari pidtverdzhuyut gipotezu tomu sho v kozhnij pari bigun z grupi A shvidshij nizh bigun z grupi V U rezultati mi mayemo 20 par 19 z yakih pidtverdzhuyut gipotezu Yedina para yaka ne pidtrimuye gipotezu skladayetsya z dvoh biguniv ranzhuvannyam 5 i 6 tomu sho v cij pari bigun z grupi B probig shvidshe Zgidno z formuloyu prostoyi riznici Kyerbi 95 danih pidtverdzhuyut gipotezu 19 z 20 par i 5 ne pidtrimuyut 1 z 20 par tomu rang korelyaciyi g 0 95 0 05 0 90 Maksimalne znachennya dlya korelyaciyi r 1 sho oznachaye sho 100 par pidtverdzhuyut gipotezu Korelyaciya g 0 vkazuye na te sho polovina par pidtverdzhuyut gipotezu a druga polovina ni Inshimi slovami vibirka grupi ne vidriznyayutsya ranzhuvannyam tak sho nemaye zhodnih dokaziv togo sho voni pohodyat z dvoh riznih grup naselennya Velichina efektu r 0 mozhe viznachatisya dlya togo shob opisati vidsutnist zv yazku mizh chlenami vibirki ta yih ranzhuvanni PosilannyaCureton E E 1956 Rank biserial correlation Psychometrika 21 287 290 DOI 10 1007 BF02289138 Everitt B S 2002 The Cambridge Dictionary of Statistics Cambridge Cambridge University Press ISBN 0 521 81099 X Diaconis P 1988 Group Representations in Probability and Statistics Lecture Notes Monograph Series Hayward CA Institute of Mathematical Statistics ISBN 0 940600 14 5 Glass G V 1965 A ranking variable analogue of biserial correlation implications for short cut item analysis Journal of Educational Measurement 2 1 91 95 DOI 10 1111 j 1745 3984 1965 tb00396 x Kendall M G 1970 Rank Correlation Methods London Griffin ISBN 0 85264 199 0 Kerby D S 2014 The simple difference formula An approach to teaching nonparametric correlation Comprehensive Psychology volume 3 article 1 doi 10 2466 11 IT 3 1 link to article 31 grudnya 2019 u Wayback Machine