У теорії ймовірностей і статистиці, індекс дисперсії, [1] коефіцієнт дисперсії, відносна дисперсія або дисперсія-до-середнього відношення, як коефіцієнт варіації, нормована міра розсіяння: це міра використовується для кількісного визначення, чи є набір спостережуваних явищ згрупованим або розосередженим в порівнянні зі стандартною статистичною моделлю.
Він визначається як відношення дисперсії σ ²до середнього значення μ ,
Він також відомий як фактор Фано, хоча цей термін іноді зарезервований для віконних даних (середнє значення і дисперсія обчислюються над субпопуляцією), де індекс дисперсії використовується в окремому випадку, коли вікно нескінченно. Відносна дисперсія часто обчислюється через різні проміжки часу або по малих областях в просторі, які можна назвати «вікна», а отриману статистику називають фактором Фано.
Воно визначається тільки тоді коли середнє значення μ відмінне від нуля, і, як правило, використовується тільки для позитивних статистичних даних, таких як дані підрахунку або часу між подіями, або де передбачається, що вихідний розподіл буде експоненціальним розподілом або розподілом Пуассона.
Термінологія
У цьому контексті, спостерігається набір даних що може складатися з часу виникнення зумовлених подій, таких як землетруси в даному регіоні з даної величини, або з місць в географічному просторі рослин даного виду. Детальна інформація про такі події спочатку перетворюються в епізодах числа подій або явищ у кожній з безлічі рівного розміру за часом або просторових областей.
Вище зазначене визначає індекс дисперсії для підрахунку.[1] Інше визначення застосовується для індексу дисперсії для інтервалів,[2] де величини — оброблені довжини тимчасових інтервалів між подіями. Загальним використанням є те, що «індекс дисперсії» означає індекс дисперсії для підрахунку.
Інтерпретація
Деякі дистрибутиви, в першу чергу розподіл Пуассона, мають однакову дисперсію і середнє значення, тоді VMR = 1. геометричний розподіл і від'ємний біноміальний розподіл мають VMR> 1, в той час як біноміальний розподіл має VMR <1, а постійна випадкова величина має VMR = 0. З цього виходить наступна таблиця:
Розподіл | VMR | |
---|---|---|
Випадкова постійна величина | VMR = 0 | not dispersed |
Біноміальний розподіл | 0 < VMR < 1 | under-dispersed |
Розподіл Пуассона | VMR = 1 | |
Від'ємний біноміальний розподіл | VMR > 1 | over-dispersed |
Це можна вважати аналогом класифікації конічних перетинів ексцентриситетом; для деталей дивись кумулянти конкретних імовірнісних розподілів.
Коли коефіцієнт дисперсії менше 1, то набір даних є «менше дисперсії»: ця умова може ставитися до моделей виникнення, які є більш регулярними, ніж випадковістю, пов'язаних з процесом Пуассона. Наприклад, якщо точки рівномірно поширені в просторі, періодичні події будуть менше дисперсії.
Якщо показник дисперсії більше 1, набір даних, називається надмірно розосередженим: це може відповідати існуванню кластерів входжень. Концентровані дані надмірно розосереджені.
З точки зору інтервальних відліків, надмірній дисперсії відповідає більше інтервалів з низьким числом і більше інтервалів з високим числом, порівняно з розподілом Пуассона.
Актуальність індексу дисперсії є те, що він має значення одиниці, коли розподіл ймовірностей числа появ в інтервалі є розподілом Пуассона. Таким чином, міра може бути використана для оцінки того, що дані можуть бути змодельовані з використанням процесу Пуассона.
Зразок на основі оцінки індексу дисперсії може бути використаний для побудови формального тестування статистичної гіпотези для адекватності моделей, що слідують розподілу Пуассона.[3][4]
Відносна дисперсія є хорошою мірою ступеня випадковості даного явища. Цей метод також широко використовується в управлінні валютою.
Приклад
Для випадково диффундирующих частинок (броунівський рух), розподіл числа частинок усередині даного обсягу є пуассоновским, тобто VMR = 1. Тому, щоб оцінити, чи дана просторова структура (якщо у вас є спосіб виміряти його) обумовлена чисто дифузією або, якщо будь-яка взаємодія між частинками бере участь: ділять простір на ділянки, квадрати або одиниці вибірки (ОВ), порахувати кількість особин в кожному патчі або ОВ, і вичислити відносну дисперсію. Дисперсії значно вище ніж 1 позначають кластерний розподіл, де випадковості не достатньо, щоб задушити потенціал тяжіння між частинками.
Статистика
Перший хто обговорив використання тесту для виявлення відхилень від Пуассона або біноміального розподілу, здається, був Лексіс в 1877. Одне з випробувань яке він розвивав було співвідношення Лексіса.
Цей індекс був вперше викорастаний в ботаниці в 1936 році.
Якщо змінні будуть розподілені за Пуассоном, то індекс дисперсії поширюється у вигляді χ2 статистики з n — 1 ступенями при великих n та μ > 3.[5] Для багатьох цікавих випадків це наближення є точним і Фішер в 1950 році отримав точний тест для нього..
вивчив перші чотири моменти його розподілу .[6] Він виявив, що наближення до χ2 статистики має місце, якщо μ > 5.
Див. також
Подібні відношення
- Коефіцієнт варіації,
- ,
- Фактор Фано, (windowed VMR)
- (Співвідношення сигнал/шум), (в обробці сигналів)
Джерела
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Гнеденко Б. В. Курс теории вероятностей. — 6-е изд. — Москва : Наука, 1988. — 446 с.(рос.)
- Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)
- Cox, D. R.; Lewis, P. A. W. (1966). The Statistical Analysis of Series of Events. London: Methuen.
- Upton, G.; Cook, I. (2006). Oxford Dictionary of Statistics (вид. 2nd). Oxford University Press. ISBN .
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U teoriyi jmovirnostej i statistici indeks dispersiyi 1 koeficiyent dispersiyi vidnosna dispersiya abo dispersiya do serednogo vidnoshennya yak koeficiyent variaciyi normovana mira rozsiyannya ce mira vikoristovuyetsya dlya kilkisnogo viznachennya chi ye nabir sposterezhuvanih yavish zgrupovanim abo rozoseredzhenim v porivnyanni zi standartnoyu statistichnoyu modellyu Vin viznachayetsya yak vidnoshennya dispersiyi s do serednogo znachennya m D s2m displaystyle D sigma 2 over mu Vin takozh vidomij yak faktor Fano hocha cej termin inodi zarezervovanij dlya vikonnih danih serednye znachennya i dispersiya obchislyuyutsya nad subpopulyaciyeyu de indeks dispersiyi vikoristovuyetsya v okremomu vipadku koli vikno neskinchenno Vidnosna dispersiya chasto obchislyuyetsya cherez rizni promizhki chasu abo po malih oblastyah v prostori yaki mozhna nazvati vikna a otrimanu statistiku nazivayut faktorom Fano Vono viznachayetsya tilki todi koli serednye znachennya m vidminne vid nulya i yak pravilo vikoristovuyetsya tilki dlya pozitivnih statistichnih danih takih yak dani pidrahunku abo chasu mizh podiyami abo de peredbachayetsya sho vihidnij rozpodil bude eksponencialnim rozpodilom abo rozpodilom Puassona TerminologiyaU comu konteksti sposterigayetsya nabir danih sho mozhe skladatisya z chasu viniknennya zumovlenih podij takih yak zemletrusi v danomu regioni z danoyi velichini abo z misc v geografichnomu prostori roslin danogo vidu Detalna informaciya pro taki podiyi spochatku peretvoryuyutsya v epizodah chisla podij abo yavish u kozhnij z bezlichi rivnogo rozmiru za chasom abo prostorovih oblastej Vishe zaznachene viznachaye indeks dispersiyi dlya pidrahunku 1 Inshe viznachennya zastosovuyetsya dlya indeksu dispersiyi dlya intervaliv 2 de velichini obrobleni dovzhini timchasovih intervaliv mizh podiyami Zagalnim vikoristannyam ye te sho indeks dispersiyi oznachaye indeks dispersiyi dlya pidrahunku InterpretaciyaDeyaki distributivi v pershu chergu rozpodil Puassona mayut odnakovu dispersiyu i serednye znachennya todi VMR 1 geometrichnij rozpodil i vid yemnij binomialnij rozpodil mayut VMR gt 1 v toj chas yak binomialnij rozpodil maye VMR lt 1 a postijna vipadkova velichina maye VMR 0 Z cogo vihodit nastupna tablicya Rozpodil VMRVipadkova postijna velichina VMR 0 not dispersedBinomialnij rozpodil 0 lt VMR lt 1 under dispersedRozpodil Puassona VMR 1Vid yemnij binomialnij rozpodil VMR gt 1 over dispersed Ce mozhna vvazhati analogom klasifikaciyi konichnih peretiniv ekscentrisitetom dlya detalej divis kumulyanti konkretnih imovirnisnih rozpodiliv Koli koeficiyent dispersiyi menshe 1 to nabir danih ye menshe dispersiyi cya umova mozhe stavitisya do modelej viniknennya yaki ye bilsh regulyarnimi nizh vipadkovistyu pov yazanih z procesom Puassona Napriklad yaksho tochki rivnomirno poshireni v prostori periodichni podiyi budut menshe dispersiyi Yaksho pokaznik dispersiyi bilshe 1 nabir danih nazivayetsya nadmirno rozoseredzhenim ce mozhe vidpovidati isnuvannyu klasteriv vhodzhen Koncentrovani dani nadmirno rozoseredzheni Z tochki zoru intervalnih vidlikiv nadmirnij dispersiyi vidpovidaye bilshe intervaliv z nizkim chislom i bilshe intervaliv z visokim chislom porivnyano z rozpodilom Puassona Aktualnist indeksu dispersiyi ye te sho vin maye znachennya odinici koli rozpodil jmovirnostej chisla poyav v intervali ye rozpodilom Puassona Takim chinom mira mozhe buti vikoristana dlya ocinki togo sho dani mozhut buti zmodelovani z vikoristannyam procesu Puassona Zrazok na osnovi ocinki indeksu dispersiyi mozhe buti vikoristanij dlya pobudovi formalnogo testuvannya statistichnoyi gipotezi dlya adekvatnosti modelej sho sliduyut rozpodilu Puassona 3 4 Vidnosna dispersiya ye horoshoyu miroyu stupenya vipadkovosti danogo yavisha Cej metod takozh shiroko vikoristovuyetsya v upravlinni valyutoyu PrikladDlya vipadkovo diffundiruyushih chastinok brounivskij ruh rozpodil chisla chastinok useredini danogo obsyagu ye puassonovskim tobto VMR 1 Tomu shob ociniti chi dana prostorova struktura yaksho u vas ye sposib vimiryati jogo obumovlena chisto difuziyeyu abo yaksho bud yaka vzayemodiya mizh chastinkami bere uchast dilyat prostir na dilyanki kvadrati abo odinici vibirki OV porahuvati kilkist osobin v kozhnomu patchi abo OV i vichisliti vidnosnu dispersiyu Dispersiyi znachno vishe nizh 1 poznachayut klasternij rozpodil de vipadkovosti ne dostatno shob zadushiti potencial tyazhinnya mizh chastinkami StatistikaPershij hto obgovoriv vikoristannya testu dlya viyavlennya vidhilen vid Puassona abo binomialnogo rozpodilu zdayetsya buv Leksis v 1877 Odne z viprobuvan yake vin rozvivav bulo spivvidnoshennya Leksisa Cej indeks buv vpershe vikorastanij v botanici v 1936 roci Yaksho zminni budut rozpodileni za Puassonom to indeks dispersiyi poshiryuyetsya u viglyadi x2 statistiki z n 1 stupenyami pri velikih n ta m gt 3 5 Dlya bagatoh cikavih vipadkiv ce nablizhennya ye tochnim i Fisher v 1950 roci otrimav tochnij test dlya nogo vivchiv pershi chotiri momenti jogo rozpodilu 6 Vin viyaviv sho nablizhennya do x2 statistiki maye misce yaksho m gt 5 Div takozhSerednye garmonijnePodibni vidnoshennya Koeficiyent variaciyi s m displaystyle sigma mu mk sk displaystyle mu k sigma k Faktor Fano sW2 mW displaystyle sigma W 2 mu W windowed VMR Spivvidnoshennya signal shum m s displaystyle mu sigma v obrobci signaliv DzherelaKartashov M V Imovirnist procesi statistika Kiyiv VPC Kiyivskij universitet 2007 504 s Gnedenko B V Kurs teorii veroyatnostej 6 e izd Moskva Nauka 1988 446 s ros Gihman I I Skorohod A V Yadrenko M V Teoriya veroyatnostej i matematicheskaya statistika Kiyiv Visha shkola 1988 436 s ros Cox D R Lewis P A W 1966 The Statistical Analysis of Series of Events London Methuen Upton G Cook I 2006 Oxford Dictionary of Statistics vid 2nd Oxford University Press ISBN 978 0 19 954145 4