У статистиці, центральна тенденція (частіше міра центральної тенденції) — це центральне або типове значення для розподілу ймовірностей. ЇЇ також можна назвати центром або місцем розподілу. У мовленні, міру центральної тенденції часто називають середнім значенням. Термін центральна тенденція бере свій початок від 1920-х рр.
Найпоширенішими мірами центральної тенденції є середнє арифметичне, медіана та мода. Центральна тенденція може бути обчислена для будь-якої скінченої множини значень або для теоретичного розподілу, як, наприклад, для нормального розподілу. Час від часу, автори використовують центральну тенденцію, аби позначити «тенденцію кількісних даних, що групується навколо деякого центрального значення.»
Центральна тенденція розподілу, як правило, різниться з його дисперсією; дисперсія і центральна тенденція часто характеризують властивості розподілів. Базуючись на дисперсії даних, аналітики можуть судити чи мають дані сильну або слабку центральну тенденцію.
Слід зазначити, що центральна тенденція не характеризує достатньою мірою випадкову величину, тому поряд з мірами центральної тенденції використовують інші міри, які характеризують розсіяння величини навколо центру, асиметрію розподілу тощо.
Міри центральної тенденції
Наступне може бути застосованим до одновимірних даних. Залежно від обставин, перш ніж обчислювати центральну тенденцію може бути доцільним спочатку перетворити дані. Наприклад, це може бути піднесення значень у квадрат або взяття логарифма. Чи є ці перетворення доцільними і якими вони повинні бути, значною мірою залежать від даних, які аналізуються.
- Середнє арифметичне значення (або просто, середнє арифметичне) — це сума всіх значень, поділена на кількість елементів в наборі даних.
- Медіана — це середня величина, яка відокремлює вищу половину від нижньої в наборі даних. Медіана і мода є єдиними мірами центральної тенденції, які можуть бути використані для порядкових даних, в яких значення ранжуються по відношенню один до одного, але не вимірюються.
- Мода — це значення, яке найчастіше зустрічається в наборі даних. Це єдина міра центральної тенденції, яка може бути застосована для номінальних даних, які мають тільки сукупність числових даних.
- Середнє геометричне значення — це корінь n-го степеня від добутку значень набору даних, де n — це кількість елементів. Це вимірювання є дійсним тільки для тих даних, які вимірюються тільки по позитивній шкалі.
- Середнє гармонійне значення — це обернена величина середнього арифметичного, яка складається з обернених значень набору даних. Ця міра також дійсна тільки для даних, які вимірюються тільки по позитивній шкалі.
- Середнє арифметичне зважене — це середнє арифметичне значення, яке включає зважування для певних елементів даних.
- [en] — це метод усереднення, який видаляє невеликий відсоток від найбільшого та найменшого значення перед обчисленням середнього значення.
- [en] — усічене середнє, яке обчислюється на даних інтерквантільного розмаху.
- [en] — це середнє арифметичне максимального та мінімального значення в наборі даних.
- [en] — середнє арифметичне двох квантилів.
- [en] — зважене середнє арифметичне медіани та двох квантилів.
- [en] — це арифметичне середнє в якому крайні значення замінюються значеннями, які є ближчими по значенню до медіани.
Будь-яка з перерахованих вище мір центральної тенденції може бути застосована до будь-якої координати багатовимірних даних, але результати не можуть бути незмінними стосовно повороту багатовимірного простору. Крім того, існує
- Геометрична медіана — зменшує суму відстаней до базових координат. Це та ж сама медіана, яка застосовується до одновимірних даних, але зовсім не те, що й взяти медіану для кожного виміру незалежно. Вона не залишається інваріантною для різних змін масштабу різних вимірів.
- Квадратичне середнє (часто називають середньоквадратичне) є корисним у техніці, але не часто використовується в статистиці. Це відбувається тому, що воно вважається не точним показником центру розподілу, особливо коли розподіл охоплює від'ємні значення.
Розв'язок варіаційних задач
Деякі міри центральної тенденції можна характеризувати як розв'язок до варіаційної задачі, в сенсі варіаційного аналізу, а саме зменшення відхилень від центру. Тобто, враховуючи міру статистичної дисперсії, з'являється питання щодо міри центральної тенденції, яка зменшує відхилення: таким чином, що такі відхилення від центру є мінімальними серед усіх варіантів із центру. Грубо кажучи, «дисперсія передує параметр зсуву розподілу». У тому сенсі й Lp простір, аналогія є такою:
Lp | дисперсія | центральна тенденція |
---|---|---|
L1 | середнє абсолютне відхилення | медіана |
L2 | середньоквадратичне відхилення | середнє значення |
L∞ | максимальне відхилення | середнє значення вибірки |
Таким чином, середньоквадратичне відхилення щодо середнього значення є меншим, ніж стандартне відхилення у будь-якій точці, та максимальне відхилення щодо середнього значення вибірки є меншим, ніж максимальне відхилення у будь-якій точці. Унікальність цієї характеристики випливає з опуклої оптимізації. Дійсно, для заданого (фіксованого) набору даних х, функція
є дисперсією сталої величини С відносно норми L2. Оскільки функція ƒ2 це строго опукла коерцитивна функція, то точка мінімуму існує і вона єдина.
Слід зазначити, що медіана, взагалі кажучи, не є сталою, і фактично будь-яка точка між двома центральними точками дискретного розподілу мінімізує середнє абсолютне відхилення. Дисперсія в нормі L1, задається
не строго опуклою, в той час, як строга опуклість необхідна аби забезпечити єдиність мінімального значення. Не зважаючи на це, точка мінімуму є єдиною для норми L∞.
Відношення між середнім значенням, медіаною та модою
Для одномодального розподілу відомі такі норми та вони є точними:
де μ — це середнє значення, ν — медіана, θ — мода, а σ — стандартне відхилення.
Для кожного розподілу маємо,
Див. також
Примітки
- Weisberg H.F (1992) Central Tendency and Variability, Sage University Paper Series on Quantitative Applications in the Social Sciences, p.2
- Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics, OUP (entry for «central tendency»)
- Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP for International Statistical Institute. (entry for «central tendency»)
- Johnson NL, Rogers CA (1951) «The moment problem for unimodal distributions». Annals of Mathematical Statistics, 22 (3) 433—439
- Hotelling H, Solomons LM (1932) The limits of a measure of skewness. Annals Math Stat 3, 141—114
- Garver (1932) Concerning the limits of a mesuare of skewness. Ann Math Stats 3(4) 141—142
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U statistici centralna tendenciya chastishe mira centralnoyi tendenciyi ce centralne abo tipove znachennya dlya rozpodilu jmovirnostej YiYi takozh mozhna nazvati centrom abo miscem rozpodilu U movlenni miru centralnoyi tendenciyi chasto nazivayut serednim znachennyam Termin centralna tendenciya bere svij pochatok vid 1920 h rr Najposhirenishimi mirami centralnoyi tendenciyi ye serednye arifmetichne mediana ta moda Centralna tendenciya mozhe buti obchislena dlya bud yakoyi skinchenoyi mnozhini znachen abo dlya teoretichnogo rozpodilu yak napriklad dlya normalnogo rozpodilu Chas vid chasu avtori vikoristovuyut centralnu tendenciyu abi poznachiti tendenciyu kilkisnih danih sho grupuyetsya navkolo deyakogo centralnogo znachennya Centralna tendenciya rozpodilu yak pravilo riznitsya z jogo dispersiyeyu dispersiya i centralna tendenciya chasto harakterizuyut vlastivosti rozpodiliv Bazuyuchis na dispersiyi danih analitiki mozhut suditi chi mayut dani silnu abo slabku centralnu tendenciyu Slid zaznachiti sho centralna tendenciya ne harakterizuye dostatnoyu miroyu vipadkovu velichinu tomu poryad z mirami centralnoyi tendenciyi vikoristovuyut inshi miri yaki harakterizuyut rozsiyannya velichini navkolo centru asimetriyu rozpodilu tosho Miri centralnoyi tendenciyiNastupne mozhe buti zastosovanim do odnovimirnih danih Zalezhno vid obstavin persh nizh obchislyuvati centralnu tendenciyu mozhe buti docilnim spochatku peretvoriti dani Napriklad ce mozhe buti pidnesennya znachen u kvadrat abo vzyattya logarifma Chi ye ci peretvorennya docilnimi i yakimi voni povinni buti znachnoyu miroyu zalezhat vid danih yaki analizuyutsya Serednye arifmetichne znachennya abo prosto serednye arifmetichne ce suma vsih znachen podilena na kilkist elementiv v nabori danih Mediana ce serednya velichina yaka vidokremlyuye vishu polovinu vid nizhnoyi v nabori danih Mediana i moda ye yedinimi mirami centralnoyi tendenciyi yaki mozhut buti vikoristani dlya poryadkovih danih v yakih znachennya ranzhuyutsya po vidnoshennyu odin do odnogo ale ne vimiryuyutsya Moda ce znachennya yake najchastishe zustrichayetsya v nabori danih Ce yedina mira centralnoyi tendenciyi yaka mozhe buti zastosovana dlya nominalnih danih yaki mayut tilki sukupnist chislovih danih Serednye geometrichne znachennya ce korin n go stepenya vid dobutku znachen naboru danih de n ce kilkist elementiv Ce vimiryuvannya ye dijsnim tilki dlya tih danih yaki vimiryuyutsya tilki po pozitivnij shkali Serednye garmonijne znachennya ce obernena velichina serednogo arifmetichnogo yaka skladayetsya z obernenih znachen naboru danih Cya mira takozh dijsna tilki dlya danih yaki vimiryuyutsya tilki po pozitivnij shkali Serednye arifmetichne zvazhene ce serednye arifmetichne znachennya yake vklyuchaye zvazhuvannya dlya pevnih elementiv danih en ce metod userednennya yakij vidalyaye nevelikij vidsotok vid najbilshogo ta najmenshogo znachennya pered obchislennyam serednogo znachennya en usichene serednye yake obchislyuyetsya na danih interkvantilnogo rozmahu en ce serednye arifmetichne maksimalnogo ta minimalnogo znachennya v nabori danih en serednye arifmetichne dvoh kvantiliv en zvazhene serednye arifmetichne mediani ta dvoh kvantiliv en ce arifmetichne serednye v yakomu krajni znachennya zaminyuyutsya znachennyami yaki ye blizhchimi po znachennyu do mediani Bud yaka z pererahovanih vishe mir centralnoyi tendenciyi mozhe buti zastosovana do bud yakoyi koordinati bagatovimirnih danih ale rezultati ne mozhut buti nezminnimi stosovno povorotu bagatovimirnogo prostoru Krim togo isnuye Geometrichna mediana zmenshuye sumu vidstanej do bazovih koordinat Ce ta zh sama mediana yaka zastosovuyetsya do odnovimirnih danih ale zovsim ne te sho j vzyati medianu dlya kozhnogo vimiru nezalezhno Vona ne zalishayetsya invariantnoyu dlya riznih zmin masshtabu riznih vimiriv Kvadratichne serednye chasto nazivayut serednokvadratichne ye korisnim u tehnici ale ne chasto vikoristovuyetsya v statistici Ce vidbuvayetsya tomu sho vono vvazhayetsya ne tochnim pokaznikom centru rozpodilu osoblivo koli rozpodil ohoplyuye vid yemni znachennya Rozv yazok variacijnih zadachDeyaki miri centralnoyi tendenciyi mozhna harakterizuvati yak rozv yazok do variacijnoyi zadachi v sensi variacijnogo analizu a same zmenshennya vidhilen vid centru Tobto vrahovuyuchi miru statistichnoyi dispersiyi z yavlyayetsya pitannya shodo miri centralnoyi tendenciyi yaka zmenshuye vidhilennya takim chinom sho taki vidhilennya vid centru ye minimalnimi sered usih variantiv iz centru Grubo kazhuchi dispersiya pereduye parametr zsuvu rozpodilu U tomu sensi j Lp prostir analogiya ye takoyu Lp dispersiya centralna tendenciya L1 serednye absolyutne vidhilennya mediana L2 serednokvadratichne vidhilennya serednye znachennya L maksimalne vidhilennya serednye znachennya vibirki Takim chinom serednokvadratichne vidhilennya shodo serednogo znachennya ye menshim nizh standartne vidhilennya u bud yakij tochci ta maksimalne vidhilennya shodo serednogo znachennya vibirki ye menshim nizh maksimalne vidhilennya u bud yakij tochci Unikalnist ciyeyi harakteristiki viplivaye z opukloyi optimizaciyi Dijsno dlya zadanogo fiksovanogo naboru danih h funkciya f 2 c x c 2 displaystyle f 2 c x c 2 ye dispersiyeyu staloyi velichini S vidnosno normi L2 Oskilki funkciya ƒ2 ce strogo opukla koercitivna funkciya to tochka minimumu isnuye i vona yedina Slid zaznachiti sho mediana vzagali kazhuchi ne ye staloyu i faktichno bud yaka tochka mizh dvoma centralnimi tochkami diskretnogo rozpodilu minimizuye serednye absolyutne vidhilennya Dispersiya v normi L1 zadayetsya f 1 c x c 1 displaystyle f 1 c x c 1 ne strogo opukloyu v toj chas yak stroga opuklist neobhidna abi zabezpechiti yedinist minimalnogo znachennya Ne zvazhayuchi na ce tochka minimumu ye yedinoyu dlya normi L Vidnoshennya mizh serednim znachennyam medianoyu ta modoyuDlya odnomodalnogo rozpodilu vidomi taki normi ta voni ye tochnimi 8 m s 3 displaystyle frac theta mu sigma leq sqrt 3 n m s 0 6 displaystyle frac nu mu sigma leq sqrt 0 6 8 n s 3 displaystyle frac theta nu sigma leq sqrt 3 de m ce serednye znachennya n mediana 8 moda a s standartne vidhilennya Dlya kozhnogo rozpodilu mayemo n m s 1 displaystyle frac nu mu sigma leqslant 1 Div takozhMatematichne spodivannya Koeficiyent zsuvu Miri rozsiyannyaPrimitkiWeisberg H F 1992 Central Tendency and Variability Sage University Paper Series on Quantitative Applications in the Social Sciences ISBN 0 8039 4007 6 p 2 Upton G Cook I 2008 Oxford Dictionary of Statistics OUP ISBN 978 0 19 954145 4 entry for central tendency Dodge Y 2003 The Oxford Dictionary of Statistical Terms OUP for International Statistical Institute ISBN 0 19 920613 9 entry for central tendency Johnson NL Rogers CA 1951 The moment problem for unimodal distributions Annals of Mathematical Statistics 22 3 433 439 Hotelling H Solomons LM 1932 The limits of a measure of skewness Annals Math Stat 3 141 114 Garver 1932 Concerning the limits of a mesuare of skewness Ann Math Stats 3 4 141 142