Диспе́рсія (англ. variance) — це міра розсіяння значень випадкової величини відносно середнього значення розподілу. Більші значення дисперсії свідчать про більші відхилення значень випадкової величини від центру розподілу.
У простому розумінні, дисперсія дозволяє виміряти наскільки далеко випадкові значення розподілені від їх середнього значення. Дисперсія відіграє важливу роль в статистиці, в якій вона використовується в таких напрямах як описова статистика, статистичне висновування, перевірка статистичних гіпотез, допасованість, і Метод Монте-Карло. Дисперсія дорівнює квадрату стандартного відхилення, що є другим центральним моментом розподілу, і коваріації випадкової величини із самою собою, тому зазвичай вона позначається як , , або .
Вступ
Приклади
Дисперсія випадкової величини — це один з параметрів розподілу ймовірностей — це середньоквадратичне відхилення від середнього значення. Інакше кажучи, це математичне сподівання квадрату відхилення цієї змінної від її очікуваного значення (її математичного сподівання). Отже дисперсія є вимірюванням величини розпорошеності значень цієї змінної, беручи до уваги всі її значення і їхні ймовірності або ваги.
Наприклад, якщо підкинути ідеальний гральний кубик, то очікування значення буде:
Очікуване середнє абсолютне відхилення таке:
Але очікуване квадратичне відхилення таке:
Якщо монету підкинути двічі, кількість аверсів становить: 0 з імовірністю 0.25, 1 з імовірністю 0.5 і 2 з імовірністю 0.25. Отже, очікування кількості аверсів таке:
і дисперсія така:
Означення
Дисперсією випадкової величини називається математичне сподівання квадрата відхилення цієї величини від її математичного сподівання (середнього значення). Дисперсія є центральним моментом другого порядку.
Нехай випадкова змінна може набувати значення відповідно з ймовірностями причому .
- Дисперсія дискретної випадкової величини має такий вигляд:
- ,
де
- і називається стандартним відхиленням величини від її середнього значення ;
- — це оператор дисперсії випадкової величини.
- Якщо випадкова величина задана густиною імовірності, тоді дисперсія виглядає так:
- ,
де
- , тобто це середнє значення величини ;
- — функція густини імовірності.
Теореми
- Дисперсія являє собою різницю математичного очікування квадрата випадкової величини і квадрата середнього значення цієї величини:
- .
- Теорема Чебишова: Ймовірність будь-якої випадкової величини , яка набуває значення в границях стандартних відхилень від середнього значення , не менше , тобто
- .
Властивості
Основні властивості
Дисперсія випадкової змінної є невід'ємною величиною, оскільки число піднесене в квадрат може бути додатнім або нулем:
Дисперсія сталої величини дорівнює нулю, тобто , де , а якщо дисперсія випадкової величини у наборі даних дорівнює 0, тоді всі входження цього набору мають однакове значення:
Дисперсія є інваріантною до змін коефіцієнту зсуву. Таким чином, додавання константи до значень випадкової величини не змінює дисперсії:
Якщо всі значення випадкової величини помножено на константу, дисперсія буде помножена на квадрат цієї константи. Тобто константу можна виносити в квадраті за знак дисперсії:
Дисперсія суми двох випадкових величин дорівнюватиме
де Cov(⋅, ⋅) — коваріація. У загальному випадку для суми випадкових величин :
Ці результати приводять до результату, що дисперсія для лінійної комбінації величин є наступною:
Якщо випадкові величини є такими, що
говорять, що вони є (некорельованими). Це випливає на пряму із виразу описаного раніше, яке говорить про те, що якщо випадкові величини є некорельованими, тоді дисперсії їх суми дорівнює сумі дисперсій. Символічно це виглядає наступним чином:
Оскільки (незалежні випадкові величини завжди є некорельованими), вищенаведене рівняння є дійсним зокрема для випадку, коли випадкові величини незалежні. Таким чином, незалежність є достатньою але не необхідною умовою, для того щоб дисперсія суми величин дорівнювала сумі дисперсій.
Сума некорельованих випадкових величин (формула Бієнайме)
Однією з переваг використання дисперсії перед іншими мірами варіабельності є те, що дисперсія суми (або різниці) некорельованих випадкових величин:
Цей вираз має назву — формула [en] і був відкритий в 1853. Її зазвичай формулюють із більш суворою вимогою, що випадкові величини повинні бути незалежними, але достатньою умовою є те, що величини є некорельованими. Таким чином, якщо всі змінні мають однакову дисперсію σ2, тоді, оскільки ділення на n є лінійним перетворенням, ця формула одразу дозволяє визначити, що дисперсії їх середніх значень становить:
Таким чином, дисперсія середнього зменшується із збільшенням n. Ця формула дисперсії середнього використовується у визначенні стандартної похибки для вибіркового середнього, що використовується у центральній граничній теоремі.
Аби довести початковий вираз, достатньо показати що
У загальному результаті за цим слідує індуктивний вивід. Починаючи із визначення,
Використавши лінійність оператора мат. сподівання і припущення про незалежність (або відсутність кореляції) величин X і Y, далі цей вираз спрощується наступним чином:
Сума корельованих змінних
У загальному випадку, якщо випадкові величини корельовані, тоді дисперсія їх суми дорівнює сумі їх коваріацій:
(Примітка: Друга рівність отримана із факту, що Cov(Xi,Xi) = D(Xi).)
В даній формулі Cov(⋅, ⋅) позначає коваріацію, що дорівнює нулю для незалежних випадкових величин (за умови якщо вона існує). Ця формула стверджує, що варіація суми величин дорівнює сумі всіх елементів матриці коваріації їх компонент. Другий вираз стверджує еквівалентне, що дисперсія суми величин дорівнює сумі діагональних елементів матриці коваріацій плюс доданій подвійній сумі елементів її верхньої трикутної половини (або елементів із нижнього трикутника матриці); це випливає з того, що матриця коваріацій є симетричною відносно її діагоналі. Ця формула використовується у теорії альфа Кронбаха із [en].
Якщо випадкові величини мають однакову дисперсію σ2 а середнє значення кореляції окремих величин дорівнює ρ, тоді дисперсія їх середніх значень дорівнюватиме
Ця формула визначає, що дисперсія середнього збільшується із збільшенням середнього значення кореляцій. Іншими словами, додавання корельованих спостережень не є настільки ефективним як додавання незалежних спостережень для зменшення стандартної похибки. Крім того, якщо випадкові величини мають одиничну дисперсію, наприклад, якщо їх зведено до стандартних параметрів, тоді цей вираз спрощується до наступного
Ця формула використовується у [en] із класичної теорії випробувань. Цей вираз збігається до ρ якщо n прямує до нескінченності, за умови що середня кореляція залишається сталою або збігається до якогось значення також. Таким чином для дисперсії середнього стандартизованих випадкових величин із однаковими кореляціями або збіжною середньою кореляцією маємо наступне:
Тому, дисперсія середнього значення для великої кількості стандартизованих величин приблизно дорівнює їх середній кореляції. Із цього стає очевидним, що вибіркове середнє корельованих величин в загальному випадку не збігається до середнього сукупності, навіть зважаючи на те, що закон великих чисел стверджує, що вибіркове середнє буде збіжним у випадку незалежних випадкових величин.
Матрична нотація для дисперсії лінійної комбінації величин
Визначимо величину у вигляді вектора стовпця із випадкових величин , і у вигляді вектора стовпця із скалярних значень . Таким чином, є лінійною комбінацією цих випадкових величин, де позначає операцію транспонування вектора . Також нехай є коваріаційною матрицею величини . Дисперсія для буде задаватися наступним чином:
Зважена сума величин
Властивість масштабованості і формула Бієнайме, разом із властивістю коваріації Cov(aX, bY) = ab Cov(X, Y) визначають наступне:
Це означає, що для зваженої суми випадкових величин, величина із найбільшою вагою матиме непропорційне великих вплив на загальну дисперсію. Наприклад, якщо X і Y є некорельованими величинами, а вага X в двічі більша за вагу величини Y, тоді вага дисперсії величини X буде в чотири рази більше за вагу дисперсії величини Y.
Цей вираз можна узагальнити для випадку зваженої суми багатьох величин:
Добуток незалежних величин
Якщо дві величини X і Y — незалежні, дисперсія їх добутку буде дорівнювати:
Еквівалентно, використавши основні властивості сподівання, можна отримати
Добуток статистично залежних величин
У загальному випадку для двох випадкових величин, що мають статистичну залежність, дисперсія їх добутку дорівнюватиме:
Декомпозиція
Загальна формула для декомпозиції дисперсії або [en] визначається наступним чином: Якщо і дві випадкові величини, і дисперсія величини існує, тоді
де — умовне математичне сподівання величини за умови , а — [en] величини за умови . (Більш інтуїтивно зрозумілим поясненням, є те що при певному значенні , за яким слідує матиме розподіл із середнім і дисперсією ). Оскільки є функцією величини , зовнішнє очікування дисперсії у виразі береться відносно Y. Вищенаведена формула визначає як знайти на основі розподілів цих двох величини, коли може змінюватися.
Зокрема, якщо — дискретна випадкова величина, що припускає із відповідними масами імовірностей , тоді у формулі загальної диспесії, перший терм в правій частині виразу буде наступним:
де . Аналогічним чином, другий терм в правій частині стане наступним:
де і . Таким чином, загальна дисперсія буде задаватися виразом
Подібна формула застосовується у дисперсійному аналізі, де вона відповідно є наступною
тут відноситься до середньо квадратичного. Відповідна формула у аналізі лінійної регресії наступна:
Цей вираз також можна отримати із адитивності дисперсій, оскільки загальна (спостережувана) оцінка є сумою передбачених оцінок і оцінок похибок, де останні є некорельованими.
Аналогічна декомпозиція є можливою для суми квадратичних відхилень (суми квадратів, ):
Формули для дисперсії
Формула що найчастіше використовується для отримання дисперсії теоретичних розподілів є наступною:
Цей вираз є корисним, коли є можливість отримати формули для математичного сподівання і для математичного сподівання в квадраті.
Ця формула часто використовується по відношенню і до вибіркової дисперсії. Хоча її можна застосувати для ручних розрахунків, її не рекомендують застосовувати для комп'ютерних розрахунків, оскільки такий розрахунок призводить до катастрофічної втрати точності коли два компоненти рівняння є близькими за величиною і до них застосовуються арифметичні операції з плавучою точкою. Докладніше це описане в статті [en].
Розрахунок із функції розподілу імовірностей
Дисперсію сукупності для не від'ємної випадкової велчини можливо отримати за допомогою кумулятивної функції розподілу F наступним чином:
Цей вираз можна використовувати для розрахунку дисперсії у випадках, коли можливо отримати зручний аналітичний вираз для функції розподілу, але не можливо отримати його для функції густини імовірності.
Момент
Другий момент випадкової величини прийматиме мінімальне значення, якщо його отримують в околі довкола першого моменту (тобто, середнього значення) випадкової величини, тобто . І навпаки, якщо неперервна функція задовольняє рівняння для віх випадкових величин X, то вона обов'язково матиме форму , де a > 0. Це також є вірним і для багатовимірного випадку.
Одиниці вимірювання
На відміну від абсолютного відхилення, дисперсія випадкової величини має одиниці вимірювання, що дорівнюють квадрату одиниць вимірювання самої випадкової величини. Наприклад, якщо величина вимірювалася у метрах, вона матиме дисперсію у метрах в квадраті. З цієї причини, для описання вибірок даних переважно використовують їх стандартне відхилення замість того, щоб використовувати дисперсію. У прикладі із киданням гральної кістки стандартне відхилення дорівнює √2.9 ≈ 1.7, що є дещо більше за значення середнього абсолютного відхилення — 1.5.
Стандартне відхилення і очікувана абсолютна дисперсія можуть рівнозначно використовуватися для оцінки «розмаху» розподілу. Стандартне відхилення більш придатне до алгебраїчних маніпуляцій ніж абсолютне відхилення, дисперсія і її узагальнення у вигляді коваріації, які частіше використовуються в теоретичній статистиці. Однак абсолютне відхилення як правило є більш придатним, оскільки ця оцінка є менш чутливою до викидів, що виникають в результаті похибки вимірювання та ін..
Приклади для розподілів
Нормальний розподіл
Нормальний розподіл із параметрами і це неперервний розподіл, функція густини імовірності якого задається як
В цьому розподілі, сподівання і дисперсія співвідносяться із наступним чином:
Ключова роль нормального розподілу у центральній граничній теоремі є причиною широкого використання дисперсії як такої у статистиці і теорії ймовірності.
Експоненційний розподіл
Експоненційний розподіл із параметром є неперервним розподілом, який існує у напів-нескінченному інтервалі . Його функція густини імовірності задається наступним чином:
він має математичне сподівання . Дисперсія дорівнює
Таким чином, для експоненційно розподіленої випадкової величини,
Розподіл Пуассона
Розподіл Пуассона із параметром — дискретний розподіл для . Його функція густини імовірності задається наступним чином:
а його сподівання . Дисперсія дорівнює
Таким чином для випадкової величини із розподілом Пуассона, .
Біноміальний розподіл
Біноміальний розподіл із параметрами і є дискретним розподілом для . Його функція густини імовірності задається наступним чином:
а його математичне сподівання . Дисперсія дорівнює
Як приклад, біноміальний розподіл із описує імовірність того, що із купки в монет з них випадуть гербом. Таким чином значення мат. сподівання, що відповідає кількості гербів, що випали, становить а дисперсія
Гральна кістка
Класичну шестигранну гральну кістку можна представити як дискретну випадкову величину, X, із можливими результуючими значеннями від 1 до 6, кожне з яких має імовірність трапитися таку, що дорівнює 1/6. Математичне сподівання величини X становить Таким чином, дисперсія X дорівнюватиме
Загальна формула дисперсії величини X, для n-граної кістки буде наступною:
Дисперсія сукупності і дисперсія вибірки
Спостереження реального світу, такі як вимірювання рівня вчорашнього дощу протягом дня зазвичай не можуть забезпечити повний набір всіх можливих спостережень, які можуть відбутися. Дисперсія, що розрахована із скінченної множини даних в загальному випадку не буде дорівнювати дисперсії, яку б можна було розрахувати із повної сукупності всіх можливих спостережень. Це означає, що можна лише оцінити середнє значення дисперсії, отримавши його на основі презентативного набору спостережень за допомогою рівняння оцінки. Оцінка є функцією, що приймає на вхід вибірку із n спостережень виконаних незалежним чином, що є підмножиною усієї сукупності потенційних спостережень. В цьому прикладі вибірка буде складатися із фактичних вимірювань випадіння дощу із усіх доступних датчиків дощу, в рамках деякого географічного регіону.
Найпростішими оцінками середнього значення сукупності і дисперсії сукупності є простий підрахунок середнього і дисперсії вибірки, вибіркове середнє і (некорегована) дисперсія вибірки — є репрезентативними оцінками (оскільки вони збігаються до правильного значення із збільшенням величини вибірки), але ці оцінки можуть бути покращені. Оцінювання дисперсії сукупності за допомогою дисперсії випадку в загальному випадку є близьким до оптимального, але його можна поліпшити двома способами. Самий простий, розраховувати вибіркову дисперсію як середнє значення [en] від (вибіркового) середнього, ділячи на число n. Однак, оцінку можна поліпшити використавши значення відмінні за n. Чотирма загальними значеннями знаменника можуть бути: n, n − 1, n + 1, і n − 1.5: n використовується для найпростішого випадку (дисперсія сукупності на основі вибірки), n − 1 зменшує зміщення оцінки, n + 1 мінімізує середньоквадратичну похибку для нормального розподілу, а n − 1.5 майже повністю усуває зміщення для незміщеної оцінки стандартного відхилення для нормального розподілу.
По-перше, якщо загальне середнє значення не відоме (і розраховується як середнє значення вибірки), тоді дисперсія вибірки буде зміщеною оцінкою: вона занижує оцінку дисперсії на коефіцієнт, що дорівнює (n − 1) / n; відповідно така поправка (ділення на n − 1 замість n) називається поправкою Бесселя. В результаті отримана оцінка є незміщеною, і тому має назву (корегованої) дисперсії вибірки або незміщеної дисперсії вибірки. Наприклад, якщо n = 1 дисперсія для одного спостереження відносно вибіркового середнього (що є тим самим спостереженням) очевидно дорівнює нулю, незалежно від дисперсії сукупності. Якщо середнє значення визначається якимось іншим способом, ніж на основі тієї ж вибірки, що використовується для оцінки дисперсії, тоді таке зміщення не відбувається і дисперсію можна безпечним чином оцінити для вибірки довкола (незалежно відомого) середнього.
По-друге, вибіркова дисперсія у загальному випадку не мінімізує середньоквадратичну похибку між вибірковою дисперсією і дисперсією сукупності. Поправка на зміщення як правило погіршує ситуацію: завжди можна обрати коефіцієнт поправки при якому оцінка поводитиме себе краще ніж корегована дисперсія вибірки, оскільки оптимальний коефіцієнт поправки залежить від (коефіцієнту ексцесу) сукупності, але вносить зміщення. Це завжди призводить до зменшення об'єктивної оцінки (при діленні на число більше ніж n − 1). Для нормального розподілу, використання дільника n + 1 (замість n − 1 або n) мінімізує квадратичну похибку. Що призводить до того, що оцінка є зміщеною.
Дисперсія сукупності
В загальному випадку, дисперсія сукупності для скінченної сукупності розміром N із значеннями xi буде дорівнювати наступному:
де середнє значення сукупності дорівнює:
- .
Дисперсію сукупності також можна розрахувати як:
Це отримано тому, що
Дисперсія сукупності відповідає дисперсії отриманого розподілу імовірностей. У такому розумінні, поняття сукупності можна узагальнити для випадку неперервної випадкової величини із нескінченно великою сукупністю.
Дисперсія вибірки
У багатьох практичних застосуваннях, справжня дисперсія сукупності не відома a priori і її необхідно розрахувати одним із способів. Маючи справу із надто великою сукупністю, практично не можливо підрахувати кожен об'єкт цієї сукупності, тому розрахунки проводяться на основі вибірки із сукупності. Дисперсія вибірки може також застосовуватися для оцінки дисперсії безперервного розподілу за вибіркою цього розподілу.
Візьмемо вибірку із n значень y1, …, yn із сукупності, де n < N, і оцінимо дисперсію на основі цієї вибірки. Розрахувавши дисперсію на пряму із вибірки ми отримаємо середнє значення квадратичних відхилень:
Тут, позначає вибіркове середнє:
Оскільки yi обрані випадковим чином, обидві величини і є випадковими величинами. Їх значення сподівання можливо розрахувати, якщо усереднити послідовність всіх значень вибірки {yi} розміром n із сукупності. Для це буде дорівнювати:
Звідси отримаємо оцінку дисперсії сукупності, що буде зміщена на коефіцієнт . З цієї причини, називається зміщеною дисперсією вибірки. Введення поправки, що усуває зміщення, дозволяє отримати незміщену дисперсію для вибірки:
Будь-яку оцінку спрощено називають вибірковою дисперсію, де різновид оцінки зазвичай розуміють з контексту. Таке ж доведення також застосовується і для неперервних розподілів ймовірностей.
Застосування дільника n − 1 називають Поправкою Бесселя, її також застосовують для вибіркової коваріації і (вибіркового стандартного відхилення) (квадратного кореня із дисперсії). Функція квадратного кореня є увігнутою функцією і тому вносить від'ємне зміщення (із нерівності Єнсена), що залежить від розподілу, і таким чином скореговане стандартне відхилення вибірки (в якому застосовується поправка Бесселя) залишається зміщеним. Незміщена оцінка стандартного відхилення є технічною задачею, хоча для нормального розподілу застосування поправки n − 1.5 майже повністю усуває зміщення.
Історія
Поняття дисперсія (точніше варіація — англ. variance) вперше запропонував Рональд Фішер в своїй статті 1918 р. під назвою [en]:
Велика кількість наявної статистики свідчить, що відхилення вимірювань людини від середнього значення, дуже близько відповідають нормальному закону розподілу похибок, і, таким чином, варіабельність можливо універсальним способом вимірювати за допомогою стандартного відхилення, що відповідає квадратному кореню із середньоквадратичної похибки. Коли існує два незалежних джерела варіабельності, що здатні утворювати інший рівномірний розподіл імовірностей із стандартними відхиленнями і , можна знайти що розподіл, за умови що ці два джерела варіабельності вносять одночасний вплив, має стандартне відхилення . Таким чином при аналізі таких варіацій бажано використовувати квадрат стандартного відхилення як міру варіабельності. Будемо використовувати для цієї міри окремий термін — дисперсія …
Момент інерції
Дисперсія розподілу імовірностей є аналогом моменту інерції в класичній механіці для відповідного розподілу маси здовж прямої, при обертанні довкола центра мас. За цією аналогією такі поняття як дисперсія мають супутню назву моменти розподілу імовірностей. Матриця коваріацій співвідноситься із (тензором моменту інерції) для розподілів багатьох величин. Момент інерції хмари з n точок із матрицею коваріацій визначається наступним чином:
Відмінність між моментом інерції в фізиці і статистиці стає очевидною для точок, що скупчені довкола прямої. Припустимо що точки, знаходяться близько до осі x і розподілені здовж неї. Матриця коваріацій матиме наступний вигляд
Оскільки, найбільша дисперсія збігається з напрямком x. Фізики розглядали б це як мале значення моменту здовж осі x і таким чином тензор моменту інерції дорівнює
Примітки
- Смирнов Н. В., Дунин-Барковский И. В. (1965). Курс теории вероятности и математической статистики. Москва: Наука.
- T. T. Soong (2004). Fundamentals of Probability and Statistics for Engineers (PDF). Wiley. ISBN . (PDF) оригіналу за 3 лютого 2021.
- Walpole Roland E., Myers Raymond H. Probability and Statistics for Engineers and Scientists. — 3-th. edition, Macmillan Publishing Company. — New York, 1985. — 639 p. — .
- (1977) «Probability Theory», Graduate Texts in Mathematics, Volume 45, 4th edition, Springer-Verlag, p. 12.
- (1853) «Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés», Comptes rendus de l'Académie des sciences Paris, 37, p. 309–317; digital copy available [1] [ 23 червня 2018 у Wayback Machine.]
- (1867) «Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés», Journal de Mathématiques Pures et Appliquées, Série 2, Tome 12, p. 158–167; digital copy available [2] [ 23 червня 2018 у Wayback Machine.][3] [ 13 липня 2019 у Wayback Machine.]
- Johnson, Richard; Wichern, Dean (2001). Applied Multivariate Statistical Analysis. Prentice Hall. с. 76. ISBN .
- , «On the exact variance of products», , December 1960, 708—713. DOI: 10.2307/2281592
- Kagan, A.; Shepp, L. A. (1998). Why the variance?. Statistics & Probability Letters. 38 (4): 329—333. doi:10.1016/S0167-7152(98)00041-8.
- Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.
- Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York
- (1918) The correlation between relatives on the supposition of Mendelian Inheritance [ 3 червня 2013 у Wayback Machine.]
Див. також
Джерела
- Гнєденко Б. В. Курс теорії ймовірностей. — Київ : ВПЦ Київський університет, 2010. — 464 с.
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)
Це незавершена стаття зі статистики. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Dispe rsiya angl variance ce mira rozsiyannya znachen vipadkovoyi velichini vidnosno serednogo znachennya rozpodilu Bilshi znachennya dispersiyi svidchat pro bilshi vidhilennya znachen vipadkovoyi velichini vid centru rozpodilu Priklad vibirok dvoh sukupnostej iz odnakovim serednim znachennyam ale riznoyu dispersiyeyu Chervonim poznacheno vibirku iz serednim 100 i dispersiyeyu 100 standartnim vidhilennyam 10 a sinim pokazano vibirku iz serednim 100 i dispersiyeyu 2500 SV 50 U Vikipediyi ye statti pro inshi znachennya cogo termina Dispersiya U prostomu rozuminni dispersiya dozvolyaye vimiryati naskilki daleko vipadkovi znachennya rozpodileni vid yih serednogo znachennya Dispersiya vidigraye vazhlivu rol v statistici v yakij vona vikoristovuyetsya v takih napryamah yak opisova statistika statistichne visnovuvannya perevirka statistichnih gipotez dopasovanist i Metod Monte Karlo Dispersiya dorivnyuye kvadratu standartnogo vidhilennya sho ye drugim centralnim momentom rozpodilu i kovariaciyi vipadkovoyi velichini iz samoyu soboyu tomu zazvichaj vona poznachayetsya yak s2 displaystyle sigma 2 s2 displaystyle s 2 abo Var X displaystyle operatorname Var X VstupPrikladi Dispersiya vipadkovoyi velichini ce odin z parametriv rozpodilu jmovirnostej ce serednokvadratichne vidhilennya vid serednogo znachennya Inakshe kazhuchi ce matematichne spodivannya kvadratu vidhilennya ciyeyi zminnoyi vid yiyi ochikuvanogo znachennya yiyi matematichnogo spodivannya Otzhe dispersiya ye vimiryuvannyam velichini rozporoshenosti znachen ciyeyi zminnoyi beruchi do uvagi vsi yiyi znachennya i yihni jmovirnosti abo vagi Napriklad yaksho pidkinuti idealnij gralnij kubik to ochikuvannya znachennya bude 16 1 2 3 4 5 6 3 5 displaystyle frac 1 6 1 2 3 4 5 6 3 5 Ochikuvane serednye absolyutne vidhilennya take 16 1 3 5 2 3 5 3 3 5 4 3 5 5 3 5 6 3 5 16 2 5 1 5 0 5 0 5 1 5 2 5 1 5 displaystyle frac 1 6 1 3 5 2 3 5 3 3 5 4 3 5 5 3 5 6 3 5 frac 1 6 2 5 1 5 0 5 0 5 1 5 2 5 1 5 Ale ochikuvane kvadratichne vidhilennya take 16 2 52 1 52 0 52 0 52 1 52 2 52 17 5 6 2 9 displaystyle frac 1 6 2 5 2 1 5 2 0 5 2 0 5 2 1 5 2 2 5 2 17 5 6 approx 2 9 Yaksho monetu pidkinuti dvichi kilkist aversiv stanovit 0 z imovirnistyu 0 25 1 z imovirnistyu 0 5 i 2 z imovirnistyu 0 25 Otzhe ochikuvannya kilkosti aversiv take 0 25 0 0 5 1 0 25 2 1 displaystyle 0 25 times 0 0 5 times 1 0 25 times 2 1 i dispersiya taka 0 25 0 1 2 0 5 1 1 2 0 25 2 1 2 0 25 0 0 25 0 5 displaystyle 0 25 times 0 1 2 0 5 times 1 1 2 0 25 times 2 1 2 0 25 0 0 25 0 5 OznachennyaDispersiyeyu vipadkovoyi velichini X displaystyle X nazivayetsya matematichne spodivannya kvadrata vidhilennya ciyeyi velichini vid yiyi matematichnogo spodivannya serednogo znachennya Dispersiya ye centralnim momentom drugogo poryadku Nehaj vipadkova zminna X displaystyle X mozhe nabuvati znachennya x1 x2 displaystyle x 1 x 2 ldots vidpovidno z jmovirnostyami p x1 p x2 displaystyle p x 1 p x 2 ldots prichomu xp x 1 displaystyle sum x p x 1 Dispersiya diskretnoyi vipadkovoyi velichini X displaystyle X maye takij viglyad s2 D X E X m 2 x x m 2p x displaystyle sigma 2 equiv operatorname D X operatorname E X mu 2 sum x x mu 2 p x de s s2 displaystyle sigma sqrt sigma 2 i nazivayetsya standartnim vidhilennyam velichini X displaystyle X vid yiyi serednogo znachennya m displaystyle mu D displaystyle operatorname D ce operator dispersiyi vipadkovoyi velichini Yaksho vipadkova velichina 3 x displaystyle xi x zadana gustinoyu imovirnosti todi dispersiya viglyadaye tak s2 D 3 E 3 m 2 X x m 2p3 x dx displaystyle sigma 2 equiv operatorname D xi operatorname E xi mu 2 int X x mu 2 p xi x dx de m E 3 Xxp3 x dx displaystyle mu equiv operatorname E xi int X xp xi x dx tobto ce serednye znachennya velichini 3 displaystyle xi p3 x displaystyle p xi x funkciya gustini imovirnosti TeoremiDispersiya yavlyaye soboyu riznicyu matematichnogo ochikuvannya kvadrata vipadkovoyi velichini E X2 displaystyle operatorname E X 2 i kvadrata serednogo znachennya m displaystyle mu ciyeyi velichini s2 E X2 m2 xx2p x m2 displaystyle sigma 2 operatorname E X 2 mu 2 sum x x 2 p x mu 2 Teorema Chebishova Jmovirnist bud yakoyi vipadkovoyi velichini X displaystyle X yaka nabuvaye znachennya v granicyah k displaystyle k standartnih vidhilen vid serednogo znachennya m displaystyle mu ne menshe 1 1k2 displaystyle 1 frac 1 k 2 tobtoP m ks lt X lt m ks 1 1k2 displaystyle P mu k sigma lt X lt mu k sigma geq 1 frac 1 k 2 VlastivostiOsnovni vlastivosti Dispersiya vipadkovoyi zminnoyi ye nevid yemnoyu velichinoyu oskilki chislo pidnesene v kvadrat mozhe buti dodatnim abo nulem D X 0 displaystyle operatorname D X geq 0 Dispersiya staloyi velichini dorivnyuye nulyu tobto D c 0 displaystyle operatorname D c 0 de c const displaystyle c const a yaksho dispersiya vipadkovoyi velichini u nabori danih dorivnyuye 0 todi vsi vhodzhennya cogo naboru mayut odnakove znachennya P X a 1 D X 0 displaystyle P X a 1 Leftrightarrow operatorname D X 0 Dispersiya ye invariantnoyu do zmin koeficiyentu zsuvu Takim chinom dodavannya konstanti do znachen vipadkovoyi velichini ne zminyuye dispersiyi D X a D X displaystyle operatorname D X a operatorname D X Yaksho vsi znachennya vipadkovoyi velichini pomnozheno na konstantu dispersiya bude pomnozhena na kvadrat ciyeyi konstanti Tobto konstantu mozhna vinositi v kvadrati za znak dispersiyi D aX a2D X displaystyle operatorname D aX a 2 operatorname D X Dispersiya sumi dvoh vipadkovih velichin dorivnyuvatime D aX bY a2D X b2D Y 2abCov X Y displaystyle operatorname D aX bY a 2 operatorname D X b 2 operatorname D Y 2ab operatorname Cov X Y D aX bY a2D X b2D Y 2abCov X Y displaystyle operatorname D aX bY a 2 operatorname D X b 2 operatorname D Y 2ab operatorname Cov X Y de Cov kovariaciya U zagalnomu vipadku dlya sumi N displaystyle N vipadkovih velichin X1 XN displaystyle X 1 dots X N D i 1NXi i j 1NCov Xi Xj i 1ND Xi i jCov Xi Xj displaystyle operatorname D left sum i 1 N X i right sum i j 1 N operatorname Cov X i X j sum i 1 N operatorname D X i sum i neq j operatorname Cov X i X j Ci rezultati privodyat do rezultatu sho dispersiya dlya linijnoyi kombinaciyi velichin ye nastupnoyu D i 1NaiXi i j 1NaiajCov Xi Xj i 1Nai2D Xi i jaiajCov Xi Xj i 1Nai2D Xi 2 1 i lt j NaiajCov Xi Xj displaystyle begin aligned operatorname D left sum i 1 N a i X i right amp sum i j 1 N a i a j operatorname Cov X i X j amp sum i 1 N a i 2 operatorname D X i sum i not j a i a j operatorname Cov X i X j amp sum i 1 N a i 2 operatorname D X i 2 sum 1 leq i lt j leq N a i a j operatorname Cov X i X j end aligned Yaksho vipadkovi velichini X1 XN displaystyle X 1 dots X N ye takimi sho Cov Xi Xj 0 i j displaystyle operatorname Cov X i X j 0 forall i neq j govoryat sho voni ye nekorelovanimi Ce viplivaye na pryamu iz virazu opisanogo ranishe yake govorit pro te sho yaksho vipadkovi velichini X1 XN displaystyle X 1 dots X N ye nekorelovanimi todi dispersiyi yih sumi dorivnyuye sumi dispersij Simvolichno ce viglyadaye nastupnim chinom D i 1NXi i 1ND Xi displaystyle operatorname D left sum i 1 N X i right sum i 1 N operatorname D X i Oskilki nezalezhni vipadkovi velichini zavzhdi ye nekorelovanimi vishenavedene rivnyannya ye dijsnim zokrema dlya vipadku koli vipadkovi velichini X1 Xn displaystyle X 1 dots X n nezalezhni Takim chinom nezalezhnist ye dostatnoyu ale ne neobhidnoyu umovoyu dlya togo shob dispersiya sumi velichin dorivnyuvala sumi dispersij Suma nekorelovanih vipadkovih velichin formula Biyenajme Odniyeyu z perevag vikoristannya dispersiyi pered inshimi mirami variabelnosti ye te sho dispersiya sumi abo riznici nekorelovanih vipadkovih velichin D i 1nXi i 1nD Xi displaystyle operatorname D left sum i 1 n X i right sum i 1 n operatorname D X i Cej viraz maye nazvu formula en i buv vidkritij v 1853 Yiyi zazvichaj formulyuyut iz bilsh suvoroyu vimogoyu sho vipadkovi velichini povinni buti nezalezhnimi ale dostatnoyu umovoyu ye te sho velichini ye nekorelovanimi Takim chinom yaksho vsi zminni mayut odnakovu dispersiyu s2 todi oskilki dilennya na n ye linijnim peretvorennyam cya formula odrazu dozvolyaye viznachiti sho dispersiyi yih serednih znachen stanovit D X D 1n i 1nXi 1n2 i 1nD Xi s2n displaystyle operatorname D left overline X right operatorname D left frac 1 n sum i 1 n X i right frac 1 n 2 sum i 1 n operatorname D left X i right frac sigma 2 n Takim chinom dispersiya serednogo zmenshuyetsya iz zbilshennyam n Cya formula dispersiyi serednogo vikoristovuyetsya u viznachenni standartnoyi pohibki dlya vibirkovogo serednogo sho vikoristovuyetsya u centralnij granichnij teoremi Abi dovesti pochatkovij viraz dostatno pokazati sho D X Y D X D Y displaystyle operatorname D X Y operatorname D X operatorname D Y U zagalnomu rezultati za cim sliduye induktivnij vivid Pochinayuchi iz viznachennya D X Y E X Y 2 E X Y 2 E X2 2XY Y2 E X E Y 2 displaystyle begin aligned operatorname D X Y amp E X Y 2 E X Y 2 amp E X 2 2XY Y 2 E X E Y 2 end aligned Vikoristavshi linijnist operatora mat spodivannya i pripushennya pro nezalezhnist abo vidsutnist korelyaciyi velichin X i Y dali cej viraz sproshuyetsya nastupnim chinom D X Y E X2 2E XY E Y2 E X 2 2E X E Y E Y 2 E X2 E Y2 E X 2 E Y 2 D X D Y displaystyle begin aligned operatorname D X Y amp E X 2 2E XY E Y 2 E X 2 2E X E Y E Y 2 amp E X 2 E Y 2 E X 2 E Y 2 amp operatorname D X operatorname D Y end aligned Suma korelovanih zminnih U zagalnomu vipadku yaksho vipadkovi velichini korelovani todi dispersiya yih sumi dorivnyuye sumi yih kovariacij D i 1nXi i 1n j 1nCov Xi Xj i 1nD Xi 2 1 i lt j nCov Xi Xj displaystyle operatorname D left sum i 1 n X i right sum i 1 n sum j 1 n operatorname Cov X i X j sum i 1 n operatorname D X i 2 sum 1 leq i lt j leq n operatorname Cov X i X j Primitka Druga rivnist otrimana iz faktu sho Cov Xi Xi D Xi V danij formuli Cov poznachaye kovariaciyu sho dorivnyuye nulyu dlya nezalezhnih vipadkovih velichin za umovi yaksho vona isnuye Cya formula stverdzhuye sho variaciya sumi velichin dorivnyuye sumi vsih elementiv matrici kovariaciyi yih komponent Drugij viraz stverdzhuye ekvivalentne sho dispersiya sumi velichin dorivnyuye sumi diagonalnih elementiv matrici kovariacij plyus dodanij podvijnij sumi elementiv yiyi verhnoyi trikutnoyi polovini abo elementiv iz nizhnogo trikutnika matrici ce viplivaye z togo sho matricya kovariacij ye simetrichnoyu vidnosno yiyi diagonali Cya formula vikoristovuyetsya u teoriyi alfa Kronbaha iz en Yaksho vipadkovi velichini mayut odnakovu dispersiyu s2 a serednye znachennya korelyaciyi okremih velichin dorivnyuye r todi dispersiya yih serednih znachen dorivnyuvatime D X s2n n 1nrs2 displaystyle operatorname D overline X frac sigma 2 n frac n 1 n rho sigma 2 Cya formula viznachaye sho dispersiya serednogo zbilshuyetsya iz zbilshennyam serednogo znachennya korelyacij Inshimi slovami dodavannya korelovanih sposterezhen ne ye nastilki efektivnim yak dodavannya nezalezhnih sposterezhen dlya zmenshennya standartnoyi pohibki Krim togo yaksho vipadkovi velichini mayut odinichnu dispersiyu napriklad yaksho yih zvedeno do standartnih parametriv todi cej viraz sproshuyetsya do nastupnogo D X 1n n 1nr displaystyle operatorname D overline X frac 1 n frac n 1 n rho Cya formula vikoristovuyetsya u en iz klasichnoyi teoriyi viprobuvan Cej viraz zbigayetsya do r yaksho n pryamuye do neskinchennosti za umovi sho serednya korelyaciya zalishayetsya staloyu abo zbigayetsya do yakogos znachennya takozh Takim chinom dlya dispersiyi serednogo standartizovanih vipadkovih velichin iz odnakovimi korelyaciyami abo zbizhnoyu serednoyu korelyaciyeyu mayemo nastupne limn D X r displaystyle lim n to infty operatorname D overline X rho Tomu dispersiya serednogo znachennya dlya velikoyi kilkosti standartizovanih velichin priblizno dorivnyuye yih serednij korelyaciyi Iz cogo staye ochevidnim sho vibirkove serednye korelovanih velichin v zagalnomu vipadku ne zbigayetsya do serednogo sukupnosti navit zvazhayuchi na te sho zakon velikih chisel stverdzhuye sho vibirkove serednye bude zbizhnim u vipadku nezalezhnih vipadkovih velichin Matrichna notaciya dlya dispersiyi linijnoyi kombinaciyi velichin Viznachimo velichinu X displaystyle X u viglyadi vektora stovpcya iz n displaystyle n vipadkovih velichin X1 Xn displaystyle X 1 ldots X n i c displaystyle c u viglyadi vektora stovpcya iz n displaystyle n skalyarnih znachen c1 cn displaystyle c 1 ldots c n Takim chinom cTX displaystyle c T X ye linijnoyu kombinaciyeyu cih vipadkovih velichin de cT displaystyle c T poznachaye operaciyu transponuvannya vektora c displaystyle c Takozh nehaj S displaystyle Sigma ye kovariacijnoyu matriceyu velichini X displaystyle X Dispersiya dlya cTX displaystyle c T X bude zadavatisya nastupnim chinom D cTX cTSc displaystyle operatorname D c T X c T Sigma c Zvazhena suma velichin Vlastivist masshtabovanosti i formula Biyenajme razom iz vlastivistyu kovariaciyi Cov aX bY ab Cov X Y viznachayut nastupne D aX bY a2D X b2D Y 2abCov X Y displaystyle operatorname D aX pm bY a 2 operatorname D X b 2 operatorname D Y pm 2ab operatorname Cov X Y Ce oznachaye sho dlya zvazhenoyi sumi vipadkovih velichin velichina iz najbilshoyu vagoyu matime neproporcijne velikih vpliv na zagalnu dispersiyu Napriklad yaksho X i Y ye nekorelovanimi velichinami a vaga X v dvichi bilsha za vagu velichini Y todi vaga dispersiyi velichini X bude v chotiri razi bilshe za vagu dispersiyi velichini Y Cej viraz mozhna uzagalniti dlya vipadku zvazhenoyi sumi bagatoh velichin D inaiXi i 1nai2D Xi 2 1 i lt j naiajCov Xi Xj displaystyle operatorname D left sum i n a i X i right sum i 1 n a i 2 operatorname D X i 2 sum 1 leq i sum lt j leq n a i a j operatorname Cov X i X j Dobutok nezalezhnih velichin Yaksho dvi velichini X i Y nezalezhni dispersiya yih dobutku bude dorivnyuvati D XY E X 2D Y E Y 2D X D X D Y displaystyle begin aligned operatorname D XY amp E X 2 operatorname D Y E Y 2 operatorname D X operatorname D X operatorname D Y end aligned Ekvivalentno vikoristavshi osnovni vlastivosti spodivannya mozhna otrimati D XY E X2 E Y2 E X 2 E Y 2 displaystyle operatorname D XY E X 2 E Y 2 E X 2 E Y 2 Dobutok statistichno zalezhnih velichin U zagalnomu vipadku dlya dvoh vipadkovih velichin sho mayut statistichnu zalezhnist dispersiya yih dobutku dorivnyuvatime D XY E X2Y2 E XY 2 Cov X2 Y2 E X2 E Y2 E XY 2 Cov X2 Y2 D X E X 2 D Y E Y 2 Cov X Y E X E Y 2 displaystyle begin aligned operatorname D XY amp E X 2 Y 2 E XY 2 amp operatorname Cov X 2 Y 2 E X 2 E Y 2 E XY 2 amp operatorname Cov X 2 Y 2 operatorname D X E X 2 operatorname D Y E Y 2 operatorname Cov X Y E X E Y 2 end aligned Dekompoziciya Zagalna formula dlya dekompoziciyi dispersiyi abo en viznachayetsya nastupnim chinom Yaksho X displaystyle X i Y displaystyle Y dvi vipadkovi velichini i dispersiya velichini X displaystyle X isnuye todi D X EY D X Y DY E X Y displaystyle operatorname D X operatorname E Y operatorname D X mid Y operatorname D Y operatorname E X mid Y de E X Y displaystyle operatorname E X Y umovne matematichne spodivannya velichini X displaystyle X za umovi Y displaystyle Y a D X Y displaystyle operatorname D X mid Y en velichini X displaystyle X za umovi Y displaystyle Y Bilsh intuyitivno zrozumilim poyasnennyam ye te sho pri pevnomu znachenni Y displaystyle Y za yakim sliduye X displaystyle X matime rozpodil iz serednim E X Y displaystyle operatorname E X mid Y i dispersiyeyu D X Y displaystyle operatorname D X mid Y Oskilki E X Y displaystyle operatorname E X mid Y ye funkciyeyu velichini Y displaystyle Y zovnishnye ochikuvannya dispersiyi u virazi beretsya vidnosno Y Vishenavedena formula viznachaye yak znajti D X displaystyle operatorname D X na osnovi rozpodiliv cih dvoh velichini koli Y displaystyle Y mozhe zminyuvatisya Zokrema yaksho Y displaystyle Y diskretna vipadkova velichina sho pripuskaye y1 y2 yn displaystyle y 1 y 2 ldots y n iz vidpovidnimi masami imovirnostej p1 p2 pn displaystyle p 1 p 2 ldots p n todi u formuli zagalnoyi dispesiyi pershij term v pravij chastini virazu bude nastupnim EY D X Y i 1npisi2 displaystyle operatorname E Y operatorname D X mid Y sum i 1 n p i sigma i 2 de si2 D X yi displaystyle sigma i 2 operatorname D X mid y i Analogichnim chinom drugij term v pravij chastini stane nastupnim DY E X Y i 1npimi2 i 1npimi 2 i 1npimi2 m2 displaystyle operatorname D Y operatorname E X mid Y sum i 1 n p i mu i 2 left sum i 1 n p i mu i right 2 sum i 1 n p i mu i 2 mu 2 de mi E X yi displaystyle mu i operatorname E X mid y i i m i 1npimi displaystyle mu sum i 1 n p i mu i Takim chinom zagalna dispersiya bude zadavatisya virazom D X i 1npisi2 i 1npimi2 m2 displaystyle operatorname D X sum i 1 n p i sigma i 2 left sum i 1 n p i mu i 2 mu 2 right Podibna formula zastosovuyetsya u dispersijnomu analizi de vona vidpovidno ye nastupnoyu MStotal MSbetween MSwithin displaystyle mathit MS text total mathit MS text between mathit MS text within tut MS displaystyle mathit MS vidnositsya do seredno kvadratichnogo Vidpovidna formula u analizi linijnoyi regresiyi nastupna MStotal MSregression MSresidual displaystyle mathit MS text total mathit MS text regression mathit MS text residual Cej viraz takozh mozhna otrimati iz aditivnosti dispersij oskilki zagalna sposterezhuvana ocinka ye sumoyu peredbachenih ocinok i ocinok pohibok de ostanni ye nekorelovanimi Analogichna dekompoziciya ye mozhlivoyu dlya sumi kvadratichnih vidhilen sumi kvadrativ SS displaystyle mathit SS SStotal SSbetween SSwithin displaystyle mathit SS text total mathit SS text between mathit SS text within SStotal SSregression SSresidual displaystyle mathit SS text total mathit SS text regression mathit SS text residual Formuli dlya dispersiyi Formula sho najchastishe vikoristovuyetsya dlya otrimannya dispersiyi teoretichnih rozpodiliv ye nastupnoyu D X E X2 E X 2 displaystyle operatorname D X operatorname E X 2 operatorname E X 2 Cej viraz ye korisnim koli ye mozhlivist otrimati formuli dlya matematichnogo spodivannya i dlya matematichnogo spodivannya v kvadrati Cya formula chasto vikoristovuyetsya po vidnoshennyu i do vibirkovoyi dispersiyi Hocha yiyi mozhna zastosuvati dlya ruchnih rozrahunkiv yiyi ne rekomenduyut zastosovuvati dlya komp yuternih rozrahunkiv oskilki takij rozrahunok prizvodit do katastrofichnoyi vtrati tochnosti koli dva komponenti rivnyannya ye blizkimi za velichinoyu i do nih zastosovuyutsya arifmetichni operaciyi z plavuchoyu tochkoyu Dokladnishe ce opisane v statti en Rozrahunok iz funkciyi rozpodilu imovirnostej Dispersiyu sukupnosti dlya ne vid yemnoyi vipadkovoyi velchini mozhlivo otrimati za dopomogoyu kumulyativnoyi funkciyi rozpodilu F nastupnim chinom 2 0 u 1 F u du 0 1 F u du 2 displaystyle 2 int 0 infty u 1 F u du Big int 0 infty 1 F u du Big 2 Cej viraz mozhna vikoristovuvati dlya rozrahunku dispersiyi u vipadkah koli mozhlivo otrimati zruchnij analitichnij viraz dlya funkciyi rozpodilu ale ne mozhlivo otrimati jogo dlya funkciyi gustini imovirnosti Moment Drugij moment vipadkovoyi velichini prijmatime minimalne znachennya yaksho jogo otrimuyut v okoli dovkola pershogo momentu tobto serednogo znachennya vipadkovoyi velichini tobto argminmE X m 2 E X displaystyle mathrm argmin m mathrm E X m 2 mathrm E X I navpaki yaksho neperervna funkciya f displaystyle varphi zadovolnyaye rivnyannya argminmE f X m E X displaystyle mathrm argmin m mathrm E varphi X m mathrm E X dlya vih vipadkovih velichin X to vona obov yazkovo matime formu f x ax2 b displaystyle varphi x ax 2 b de a gt 0 Ce takozh ye virnim i dlya bagatovimirnogo vipadku Odinici vimiryuvannya Na vidminu vid absolyutnogo vidhilennya dispersiya vipadkovoyi velichini maye odinici vimiryuvannya sho dorivnyuyut kvadratu odinic vimiryuvannya samoyi vipadkovoyi velichini Napriklad yaksho velichina vimiryuvalasya u metrah vona matime dispersiyu u metrah v kvadrati Z ciyeyi prichini dlya opisannya vibirok danih perevazhno vikoristovuyut yih standartne vidhilennya zamist togo shob vikoristovuvati dispersiyu U prikladi iz kidannyam gralnoyi kistki standartne vidhilennya dorivnyuye 2 9 1 7 sho ye desho bilshe za znachennya serednogo absolyutnogo vidhilennya 1 5 Standartne vidhilennya i ochikuvana absolyutna dispersiya mozhut rivnoznachno vikoristovuvatisya dlya ocinki rozmahu rozpodilu Standartne vidhilennya bilsh pridatne do algebrayichnih manipulyacij nizh absolyutne vidhilennya dispersiya i yiyi uzagalnennya u viglyadi kovariaciyi yaki chastishe vikoristovuyutsya v teoretichnij statistici Odnak absolyutne vidhilennya yak pravilo ye bilsh pridatnim oskilki cya ocinka ye mensh chutlivoyu do vikidiv sho vinikayut v rezultati pohibki vimiryuvannya ta in Prikladi dlya rozpodilivNormalnij rozpodil Normalnij rozpodil iz parametrami m displaystyle mu i s displaystyle sigma ce neperervnij rozpodil funkciya gustini imovirnosti yakogo zadayetsya yak f x 12ps2e x m 22s2 displaystyle f x frac 1 sqrt 2 pi sigma 2 e frac x mu 2 2 sigma 2 V comu rozpodili spodivannya E X m displaystyle operatorname E X mu i dispersiya D X displaystyle operatorname D X spivvidnosyatsya iz s displaystyle sigma nastupnim chinom D X x22ps2e x m 22s2dx m2 s2 displaystyle operatorname D X int infty infty frac x 2 sqrt 2 pi sigma 2 e frac x mu 2 2 sigma 2 dx mu 2 sigma 2 Klyuchova rol normalnogo rozpodilu u centralnij granichnij teoremi ye prichinoyu shirokogo vikoristannya dispersiyi yak takoyi u statistici i teoriyi jmovirnosti Eksponencijnij rozpodil Eksponencijnij rozpodil iz parametrom l displaystyle lambda ye neperervnim rozpodilom yakij isnuye u napiv neskinchennomu intervali 0 displaystyle 0 infty Jogo funkciya gustini imovirnosti zadayetsya nastupnim chinom f x le lx displaystyle f x lambda e lambda x vin maye matematichne spodivannya m l 1 displaystyle mu lambda 1 Dispersiya dorivnyuye D X 0 x2le lxdx m2 l 2 displaystyle operatorname D X int 0 infty x 2 lambda e lambda x dx mu 2 lambda 2 Takim chinom dlya eksponencijno rozpodilenoyi vipadkovoyi velichini s2 m2 displaystyle sigma 2 mu 2 Rozpodil Puassona Rozpodil Puassona iz parametrom l displaystyle lambda diskretnij rozpodil dlya k 0 1 2 displaystyle k 0 1 2 ldots Jogo funkciya gustini imovirnosti zadayetsya nastupnim chinom p k lkk e l displaystyle p k frac lambda k k e lambda a jogo spodivannya m l displaystyle mu lambda Dispersiya dorivnyuye D X k 0 k2lkk e l m2 l displaystyle operatorname D X left sum k 0 infty k 2 frac lambda k k e lambda right mu 2 lambda Takim chinom dlya vipadkovoyi velichini iz rozpodilom Puassona s2 m displaystyle sigma 2 mu Binomialnij rozpodil Binomialnij rozpodil iz parametrami n displaystyle n i p displaystyle p ye diskretnim rozpodilom dlya k 0 1 2 n displaystyle k 0 1 2 ldots n Jogo funkciya gustini imovirnosti zadayetsya nastupnim chinom p k nk pk 1 p n k displaystyle p k n choose k p k 1 p n k a jogo matematichne spodivannya m np displaystyle mu np Dispersiya dorivnyuye D X k 0nk2 nk pk 1 p n k m2 np 1 p displaystyle operatorname D X left sum k 0 n k 2 n choose k p k 1 p n k right mu 2 np 1 p Yak priklad binomialnij rozpodil iz p 1 2 displaystyle p 1 2 opisuye imovirnist togo sho iz kupki v n displaystyle n monet k displaystyle k z nih vipadut gerbom Takim chinom znachennya mat spodivannya sho vidpovidaye kilkosti gerbiv sho vipali stanovit n 2 displaystyle n 2 a dispersiya n 4 displaystyle n 4 Gralna kistka Klasichnu shestigrannu gralnu kistku mozhna predstaviti yak diskretnu vipadkovu velichinu X iz mozhlivimi rezultuyuchimi znachennyami vid 1 do 6 kozhne z yakih maye imovirnist trapitisya taku sho dorivnyuye 1 6 Matematichne spodivannya velichini X stanovit 1 2 3 4 5 6 6 7 2 displaystyle 1 2 3 4 5 6 6 7 2 Takim chinom dispersiya X dorivnyuvatime D X i 1616 i 72 2 16 5 2 2 3 2 2 1 2 2 1 2 2 3 2 2 5 2 2 3512 2 92 displaystyle begin aligned operatorname D X amp sum i 1 6 frac 1 6 left i frac 7 2 right 2 amp frac 1 6 left 5 2 2 3 2 2 1 2 2 1 2 2 3 2 2 5 2 2 right amp frac 35 12 approx 2 92 end aligned Zagalna formula dispersiyi velichini X dlya n granoyi kistki bude nastupnoyu D X E X2 E X 2 1n i 1ni2 1n i 1ni 2 n 1 2n 1 6 n 12 2 n2 112 displaystyle begin aligned operatorname D X amp operatorname E X 2 operatorname E X 2 amp frac 1 n sum i 1 n i 2 left frac 1 n sum i 1 n i right 2 amp frac n 1 2n 1 6 left frac n 1 2 right 2 amp frac n 2 1 12 end aligned Dispersiya sukupnosti i dispersiya vibirkiSposterezhennya realnogo svitu taki yak vimiryuvannya rivnya vchorashnogo doshu protyagom dnya zazvichaj ne mozhut zabezpechiti povnij nabir vsih mozhlivih sposterezhen yaki mozhut vidbutisya Dispersiya sho rozrahovana iz skinchennoyi mnozhini danih v zagalnomu vipadku ne bude dorivnyuvati dispersiyi yaku b mozhna bulo rozrahuvati iz povnoyi sukupnosti vsih mozhlivih sposterezhen Ce oznachaye sho mozhna lishe ociniti serednye znachennya dispersiyi otrimavshi jogo na osnovi prezentativnogo naboru sposterezhen za dopomogoyu rivnyannya ocinki Ocinka ye funkciyeyu sho prijmaye na vhid vibirku iz n sposterezhen vikonanih nezalezhnim chinom sho ye pidmnozhinoyu usiyeyi sukupnosti potencijnih sposterezhen V comu prikladi vibirka bude skladatisya iz faktichnih vimiryuvan vipadinnya doshu iz usih dostupnih datchikiv doshu v ramkah deyakogo geografichnogo regionu Najprostishimi ocinkami serednogo znachennya sukupnosti i dispersiyi sukupnosti ye prostij pidrahunok serednogo i dispersiyi vibirki vibirkove serednye i nekoregovana dispersiya vibirki ye reprezentativnimi ocinkami oskilki voni zbigayutsya do pravilnogo znachennya iz zbilshennyam velichini vibirki ale ci ocinki mozhut buti pokrasheni Ocinyuvannya dispersiyi sukupnosti za dopomogoyu dispersiyi vipadku v zagalnomu vipadku ye blizkim do optimalnogo ale jogo mozhna polipshiti dvoma sposobami Samij prostij rozrahovuvati vibirkovu dispersiyu yak serednye znachennya en vid vibirkovogo serednogo dilyachi na chislo n Odnak ocinku mozhna polipshiti vikoristavshi znachennya vidminni za n Chotirma zagalnimi znachennyami znamennika mozhut buti n n 1 n 1 i n 1 5 n vikoristovuyetsya dlya najprostishogo vipadku dispersiya sukupnosti na osnovi vibirki n 1 zmenshuye zmishennya ocinki n 1 minimizuye serednokvadratichnu pohibku dlya normalnogo rozpodilu a n 1 5 majzhe povnistyu usuvaye zmishennya dlya nezmishenoyi ocinki standartnogo vidhilennya dlya normalnogo rozpodilu Po pershe yaksho zagalne serednye znachennya ne vidome i rozrahovuyetsya yak serednye znachennya vibirki todi dispersiya vibirki bude zmishenoyu ocinkoyu vona zanizhuye ocinku dispersiyi na koeficiyent sho dorivnyuye n 1 n vidpovidno taka popravka dilennya na n 1 zamist n nazivayetsya popravkoyu Besselya V rezultati otrimana ocinka ye nezmishenoyu i tomu maye nazvu koregovanoyi dispersiyi vibirki abo nezmishenoyi dispersiyi vibirki Napriklad yaksho n 1 dispersiya dlya odnogo sposterezhennya vidnosno vibirkovogo serednogo sho ye tim samim sposterezhennyam ochevidno dorivnyuye nulyu nezalezhno vid dispersiyi sukupnosti Yaksho serednye znachennya viznachayetsya yakimos inshim sposobom nizh na osnovi tiyeyi zh vibirki sho vikoristovuyetsya dlya ocinki dispersiyi todi take zmishennya ne vidbuvayetsya i dispersiyu mozhna bezpechnim chinom ociniti dlya vibirki dovkola nezalezhno vidomogo serednogo Po druge vibirkova dispersiya u zagalnomu vipadku ne minimizuye serednokvadratichnu pohibku mizh vibirkovoyu dispersiyeyu i dispersiyeyu sukupnosti Popravka na zmishennya yak pravilo pogirshuye situaciyu zavzhdi mozhna obrati koeficiyent popravki pri yakomu ocinka povoditime sebe krashe nizh koregovana dispersiya vibirki oskilki optimalnij koeficiyent popravki zalezhit vid koeficiyentu ekscesu sukupnosti ale vnosit zmishennya Ce zavzhdi prizvodit do zmenshennya ob yektivnoyi ocinki pri dilenni na chislo bilshe nizh n 1 Dlya normalnogo rozpodilu vikoristannya dilnika n 1 zamist n 1 abo n minimizuye kvadratichnu pohibku Sho prizvodit do togo sho ocinka ye zmishenoyu Dispersiya sukupnosti V zagalnomu vipadku dispersiya sukupnosti dlya skinchennoyi sukupnosti rozmirom N iz znachennyami xi bude dorivnyuvati nastupnomu s2 1N i 1N xi m 2 1N i 1N xi2 2mxi m2 1N i 1Nxi2 2m 1N i 1Nxi m2 1N i 1Nxi2 m2 displaystyle sigma 2 frac 1 N sum i 1 N left x i mu right 2 frac 1 N sum i 1 N left x i 2 2 mu x i mu 2 right left frac 1 N sum i 1 N x i 2 right 2 mu left frac 1 N sum i 1 N x i right mu 2 left frac 1 N sum i 1 N x i 2 right mu 2 de serednye znachennya sukupnosti dorivnyuye m 1N i 1Nxi displaystyle mu frac 1 N sum i 1 N x i Dispersiyu sukupnosti takozh mozhna rozrahuvati yak s2 1N2 i lt j xi xj 2 12N2 i j 1N xi xj 2 displaystyle sigma 2 frac 1 N 2 sum i lt j left x i x j right 2 frac 1 2N 2 sum i j 1 N left x i x j right 2 Ce otrimano tomu sho 12N2 i j 1N xi xj 2 12N2 i j 1N xi2 2xixj xj2 12N j 1N 1N i 1Nxi2 1N i 1Nxi 1N j 1Nxj 12N i 1N 1N j 1Nxj2 12 s2 m2 m2 12 s2 m2 s2 displaystyle begin aligned frac 1 2N 2 sum i j 1 N left x i x j right 2 amp frac 1 2N 2 sum i j 1 N left x i 2 2x i x j x j 2 right amp frac 1 2N sum j 1 N left frac 1 N sum i 1 N x i 2 right left frac 1 N sum i 1 N x i right left frac 1 N sum j 1 N x j right frac 1 2N sum i 1 N left frac 1 N sum j 1 N x j 2 right amp frac 1 2 left sigma 2 mu 2 right mu 2 frac 1 2 left sigma 2 mu 2 right sigma 2 end aligned Dispersiya sukupnosti vidpovidaye dispersiyi otrimanogo rozpodilu imovirnostej U takomu rozuminni ponyattya sukupnosti mozhna uzagalniti dlya vipadku neperervnoyi vipadkovoyi velichini iz neskinchenno velikoyu sukupnistyu Dispersiya vibirki U bagatoh praktichnih zastosuvannyah spravzhnya dispersiya sukupnosti ne vidoma a priori i yiyi neobhidno rozrahuvati odnim iz sposobiv Mayuchi spravu iz nadto velikoyu sukupnistyu praktichno ne mozhlivo pidrahuvati kozhen ob yekt ciyeyi sukupnosti tomu rozrahunki provodyatsya na osnovi vibirki iz sukupnosti Dispersiya vibirki mozhe takozh zastosovuvatisya dlya ocinki dispersiyi bezperervnogo rozpodilu za vibirkoyu cogo rozpodilu Vizmemo vibirku iz n znachen y1 yn iz sukupnosti de n lt N i ocinimo dispersiyu na osnovi ciyeyi vibirki Rozrahuvavshi dispersiyu na pryamu iz vibirki mi otrimayemo serednye znachennya kvadratichnih vidhilen sy2 1n i 1n yi y 2 1n i 1nyi2 y 2 1n2 i lt j yi yj 2 displaystyle sigma y 2 frac 1 n sum i 1 n left y i overline y right 2 left frac 1 n sum i 1 n y i 2 right overline y 2 frac 1 n 2 sum i lt j left y i y j right 2 Tut y displaystyle overline y poznachaye vibirkove serednye y 1n i 1nyi displaystyle overline y frac 1 n sum i 1 n y i Oskilki yi obrani vipadkovim chinom obidvi velichini y displaystyle scriptstyle overline y i sy2 displaystyle scriptstyle sigma y 2 ye vipadkovimi velichinami Yih znachennya spodivannya mozhlivo rozrahuvati yaksho useredniti poslidovnist vsih znachen vibirki yi rozmirom n iz sukupnosti Dlya sy2 displaystyle scriptstyle sigma y 2 ce bude dorivnyuvati E sy2 E 1n i 1n yi 1n j 1nyj 2 1n i 1nE yi2 2nyi j 1nyj 1n2 j 1nyj k 1nyk 1n i 1n n 2nE yi2 2n j iE yiyj 1n2 j 1n k jnE yjyk 1n2 j 1nE yj2 1n i 1n n 2n s2 m2 2n n 1 m2 1n2n n 1 m2 1n s2 m2 n 1ns2 displaystyle begin aligned E sigma y 2 amp E left frac 1 n sum i 1 n left y i frac 1 n sum j 1 n y j right 2 right amp frac 1 n sum i 1 n E left y i 2 frac 2 n y i sum j 1 n y j frac 1 n 2 sum j 1 n y j sum k 1 n y k right amp frac 1 n sum i 1 n left frac n 2 n E y i 2 frac 2 n sum j neq i E y i y j frac 1 n 2 sum j 1 n sum k neq j n E y j y k frac 1 n 2 sum j 1 n E y j 2 right amp frac 1 n sum i 1 n left frac n 2 n sigma 2 mu 2 frac 2 n n 1 mu 2 frac 1 n 2 n n 1 mu 2 frac 1 n sigma 2 mu 2 right amp frac n 1 n sigma 2 end aligned Zvidsi sy2 displaystyle scriptstyle sigma y 2 otrimayemo ocinku dispersiyi sukupnosti sho bude zmishena na koeficiyent n 1n displaystyle frac n 1 n Z ciyeyi prichini sy2 displaystyle scriptstyle sigma y 2 nazivayetsya zmishenoyu dispersiyeyu vibirki Vvedennya popravki sho usuvaye zmishennya dozvolyaye otrimati nezmishenu dispersiyu dlya vibirki s2 nn 1sy2 nn 1 1n i 1n yi y 2 1n 1 i 1n yi y 2 displaystyle s 2 frac n n 1 sigma y 2 frac n n 1 left frac 1 n sum i 1 n left y i overline y right 2 right frac 1 n 1 sum i 1 n left y i overline y right 2 Bud yaku ocinku sprosheno nazivayut vibirkovoyu dispersiyu de riznovid ocinki zazvichaj rozumiyut z kontekstu Take zh dovedennya takozh zastosovuyetsya i dlya neperervnih rozpodiliv jmovirnostej Zastosuvannya dilnika n 1 nazivayut Popravkoyu Besselya yiyi takozh zastosovuyut dlya vibirkovoyi kovariaciyi i vibirkovogo standartnogo vidhilennya kvadratnogo korenya iz dispersiyi Funkciya kvadratnogo korenya ye uvignutoyu funkciyeyu i tomu vnosit vid yemne zmishennya iz nerivnosti Yensena sho zalezhit vid rozpodilu i takim chinom skoregovane standartne vidhilennya vibirki v yakomu zastosovuyetsya popravka Besselya zalishayetsya zmishenim Nezmishena ocinka standartnogo vidhilennya ye tehnichnoyu zadacheyu hocha dlya normalnogo rozpodilu zastosuvannya popravki n 1 5 majzhe povnistyu usuvaye zmishennya IstoriyaGeometrichna vizualizaciya dispersiyi dovilnogo rozpodilu 2 4 4 4 5 5 7 9 1 Pobudovana chastotna gistograma rozpodilu 2 Centroyid rozpodilu dozvolyaye ociniti jogo serednye 3 Dlya kozhnogo znachennya sformuyemo kvadrat iz storonami sho dorivnyuye vidstani kozhnogo znachennya vid serednogo 4 Yaksho vporyadkuvati kvadrati u viglyadi pryamokutniku odna storona yakogo dorivnyuye kilkosti vimiryanih znachen n v rezultati insha storona pryamokutnika bude dorivnyuvati dispersiyi rozpodilu s Ponyattya dispersiya tochnishe variaciya angl variance vpershe zaproponuvav Ronald Fisher v svoyij statti 1918 r pid nazvoyu en Velika kilkist nayavnoyi statistiki svidchit sho vidhilennya vimiryuvan lyudini vid serednogo znachennya duzhe blizko vidpovidayut normalnomu zakonu rozpodilu pohibok i takim chinom variabelnist mozhlivo universalnim sposobom vimiryuvati za dopomogoyu standartnogo vidhilennya sho vidpovidaye kvadratnomu korenyu iz serednokvadratichnoyi pohibki Koli isnuye dva nezalezhnih dzherela variabelnosti sho zdatni utvoryuvati inshij rivnomirnij rozpodil imovirnostej iz standartnimi vidhilennyami s1 displaystyle sigma 1 i s2 displaystyle sigma 2 mozhna znajti sho rozpodil za umovi sho ci dva dzherela variabelnosti vnosyat odnochasnij vpliv maye standartne vidhilennya s12 s22 displaystyle sqrt sigma 1 2 sigma 2 2 Takim chinom pri analizi takih variacij bazhano vikoristovuvati kvadrat standartnogo vidhilennya yak miru variabelnosti Budemo vikoristovuvati dlya ciyeyi miri okremij termin dispersiya Moment inerciyiDispersiya rozpodilu imovirnostej ye analogom momentu inerciyi v klasichnij mehanici dlya vidpovidnogo rozpodilu masi zdovzh pryamoyi pri obertanni dovkola centra mas Za ciyeyu analogiyeyu taki ponyattya yak dispersiya mayut suputnyu nazvu momenti rozpodilu imovirnostej Matricya kovariacij spivvidnositsya iz tenzorom momentu inerciyi dlya rozpodiliv bagatoh velichin Moment inerciyi hmari z n tochok iz matriceyu kovariacij S displaystyle Sigma viznachayetsya nastupnim chinom I n 13 3tr S S displaystyle I n mathbf 1 3 times 3 operatorname tr Sigma Sigma Vidminnist mizh momentom inerciyi v fizici i statistici staye ochevidnoyu dlya tochok sho skupcheni dovkola pryamoyi Pripustimo sho tochki znahodyatsya blizko do osi x i rozpodileni zdovzh neyi Matricya kovariacij matime nastupnij viglyad S 100000 10000 1 displaystyle Sigma begin bmatrix 10 amp 0 amp 0 0 amp 0 1 amp 0 0 amp 0 amp 0 1 end bmatrix Oskilki najbilsha dispersiya zbigayetsya z napryamkom x Fiziki rozglyadali b ce yak male znachennya momentu zdovzh osi x i takim chinom tenzor momentu inerciyi dorivnyuye I n 0 200010 100010 1 displaystyle I n begin bmatrix 0 2 amp 0 amp 0 0 amp 10 1 amp 0 0 amp 0 amp 10 1 end bmatrix PrimitkiSmirnov N V Dunin Barkovskij I V 1965 Kurs teorii veroyatnosti i matematicheskoj statistiki Moskva Nauka T T Soong 2004 Fundamentals of Probability and Statistics for Engineers PDF Wiley ISBN 0 470 86813 9 PDF originalu za 3 lyutogo 2021 Walpole Roland E Myers Raymond H Probability and Statistics for Engineers and Scientists 3 th edition Macmillan Publishing Company New York 1985 639 p ISBN 0 02 424170 9 1977 Probability Theory Graduate Texts in Mathematics Volume 45 4th edition Springer Verlag p 12 1853 Considerations a l appui de la decouverte de Laplace sur la loi de probabilite dans la methode des moindres carres Comptes rendus de l Academie des sciences Paris 37 p 309 317 digital copy available 1 23 chervnya 2018 u Wayback Machine 1867 Considerations a l appui de la decouverte de Laplace sur la loi de probabilite dans la methode des moindres carres Journal de Mathematiques Pures et Appliquees Serie 2 Tome 12 p 158 167 digital copy available 2 23 chervnya 2018 u Wayback Machine 3 13 lipnya 2019 u Wayback Machine Johnson Richard Wichern Dean 2001 Applied Multivariate Statistical Analysis Prentice Hall s 76 ISBN 0 13 187715 1 inshi movi On the exact variance of products December 1960 708 713 DOI 10 2307 2281592 Kagan A Shepp L A 1998 Why the variance Statistics amp Probability Letters 38 4 329 333 doi 10 1016 S0167 7152 98 00041 8 Navidi William 2006 Statistics for Engineers and Scientists McGraw Hill pg 14 Montgomery D C and Runger G C 1994 Applied statistics and probability for engineers page 201 John Wiley amp Sons New York 1918 The correlation between relatives on the supposition of Mendelian Inheritance 3 chervnya 2013 u Wayback Machine Div takozhPortal Matematika Uzagalnena dispersiya Dispersijnij analiz Momenti vipadkovoyi velichini Koeficiyent korelyaciyi Kvartet Anskombe Vibirkovi dispersiyi Nerivnist Chebishova Vimiryuvannya Serednye kvadratichne vidhilennyaDzherelaGnyedenko B V Kurs teoriyi jmovirnostej Kiyiv VPC Kiyivskij universitet 2010 464 s Kartashov M V Imovirnist procesi statistika Kiyiv VPC Kiyivskij universitet 2007 504 s Gihman I I Skorohod A V Yadrenko M V Teoriya veroyatnostej i matematicheskaya statistika Kiyiv Visha shkola 1988 436 s ros Ce nezavershena stattya zi statistiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi