Мо́да — значення випадкової величини, що трапляється найчастіше в сукупності спостережень. Це таке значення x, в якому функція мас ймовірностей набуває максимального значення. Іноді трапляється більше, аніж одна мода (наприклад: 2, 6, 6, 6, 8, 9, 9, 9, 10; мода = 6 і 9). У такому випадку, можна сказати, що сукупність мультимодальна. Із структурних середніх величин лише мода має таку унікальну властивість. Як правило, мультимодальність вказує на те, що набір даних не підпорядковується нормальному розподілу.
Мода, як середня величина, вживається частіше для даних, що мають нечислову природу. Серед перелічених кольорів автомобілів — «білий», «чорний», «синій металік», «білий», «синій металік», «білий» — мода дорівнюватиме значенню «білий». За експертної оцінки з її допомогою визначають найпопулярніші типи продукту, що враховується при прогнозі продажів чи плануванні їх виробництва.
Іншими словами, мода є найпоширеніше значення випадкової величини (ознаки). У дискретному ряду вона визначається візуально за найбільшою частотою (часткою), а в інтервальному — таким чином визначається модальний інтервал, а конкретне модальне значення розраховується за формулою:
де
- х0 та h — нижня межа та ширина модального інтервалу,
- fmo, fmo-1, fmo+1 — частоти (частки) відповідно модального, передмодального та післямодального інтервалів.
Мода вибірки
Мода вибірки це такий елемент, що з'являється в наборі найчастіше. Наприклад, модою вибірки [1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17] є 6. В наступному наборі даних [1, 1, 2, 4, 4] мода не є унікальною — такий набір даних називають бімодальним, а набір із більше ніж однією модою — мультимодальним.
Для вибірки для неперервного розподілу, такої як [0.935…, 1.211…, 2.430…, 3.668…, 3.874…], це поняття в своїй початковій формі є непридатним, оскільки не існує двох точно однакових значень вибірки, оскільки кожне значення буде зустрічатися точно один раз. Для того, щоб визначити моду в даному випадку, типовою практикою є дискретизація даних, після якої значення частоти виникнення призначається інтервалам із однаковим розміром, оскільки це робиться при побудові гістограм, призначаючи цьому інтервалу значення його середньої точки. Мода як правилом є тим значенням де гістограма досягає свого максимуму. Для малих і середніх за розміром вибірок результат цієї процедури дуже чутливий до обраної величини інтервалу, якщо він може бути обраним занадто вузьким чи занадто широким; зазвичай інтервал обирають так, щоб значна частка даних була сконцентрована у відносно не великій кількість інтервалів (від 5 до 10), так, щоб частка даних що випадає за межі цих інтервалів також була значною. Альтернативним підходом може бути ядрова оцінка густини розподілу, який розмиває точки вибірки таким чином, аби утворити неперервну оцінку функції густини імовірностей, яка забезпечує можливість оцінки моди.
Наступний код для програмного застосунку MATLAB (або Octave) розраховує моду вибірки:
X = sort(x); indices = find(diff([X; realmax]) > 0); % індекси, де повторювані значення змінюються [modeL,i] = max (diff([0; indices])); % найдовша довжина серії повторюваних значень mode = X(indices(i));
На першому кроці алгоритм потребує відсортувати вибірку в порядку зростання. Потім він розраховує дискретну похідну відсортованого спису, аби знайти індекси де ця похідна є доданою. Потім він розраховує дискретну похідну цього отриманого набору індексів, знаходить максимум цієї похідної індексів, і зрештою отримує значення із відсортованої вибірки у цій точці максимуму, що відповідатиме останньому входженню послідовності повторюваних значень.
Порівняння середнього, медіани і моди
Тип | Опис | Приклад | Результат |
---|---|---|---|
Середнє арифметичне | Сума всіх значень вибірки поділена на кількість цих елементів вибірки: | (1+2+2+3+4+7+9) / 7 | 4 |
Медіана | Середнє значення, що відокремлює більшу половину і меншу половину вибірки | 1, 2, 2, 3, 4, 7, 9 | 3 |
Мода | Значення, що зустрічається у вибірці найчастіше | 1, 2, 2, 3, 4, 7, 9 | 2 |
Застосування
На відміну від середнього і медіани, поняття моди має сенс навіть для випадку із («номінальними даними») (тобто таких, що не складаються із числових значень, що необхідно для середнього, або навіть можуть не бути впорядкованими значеннями як для випадку із медіаною). Наприклад, якщо мова йде про вибірку популярності корейських імен, можна встановити, що ім'я «Кім» зустрічається частіше ніж будь-яке інше. В такому випадку «Кім» буде модою даною вибірки. При проведенні будь-якої процедури голосування, де множина голосів означає перемогу, визначити переможця можна у випадку існування одного значення моди, а якщо результат буде мультимодальним зазвичай проводять другий тур голосування, або застосовують якусь додаткову процедуру визначення переможця.
На відміну від медіани, поняття моди має сенс для будь-які випадкової величини що може приймати значення із векторного простору, включаючи дійсні числа (одно-вимірний векторний простір) і цілі числа (які можна вважати вбудованими в дійсні). Наприклад, для розподілу точок на площині зазвичай можна отримати середнє і моду, а концепцію медіани тут застосувати не можна. Медіана матиме сенс якщо існує лінійне впорядкування можливих значень.
Властивості
За умови визначеності, і для спрощення унікальності, наведемо наступні її найбільш важливі властивості.
- Всі три міри мають таку властивість: Якщо над випадковою величиною (або кожним значенням вибірки) виконують лінійне або афінне перетворення, що заміняє величину X на aX+b, то те саме перетворення відбудеться із середнім, медіаною і модою.
- Крім випадку дуже малих вибірок, мода є чутливою до «викидів» (такі як випадкові, не часті, хибні експериментальні вимірювання). Медіана більш стійка до присутності викидів, в той час як середнє також чутливе до них.
- Для неперервних одномодальних розподілів медіана часто знаходиться між середнім і модою, близько на третій частині відстані між середнім і модою. У вигляді формули, медіана ≈ (2 × середнє + мода)/3. Це правило Карла Пірсона, часто застосовується для злегка не симетричних розподілів, які за формою подібні до нормального розподілу, але це правило не завжди буде вірним в загальному випадку і ці три статистичні міри можуть бути в довільному порядку.
- Для одномодальних розподілів, мода знаходиться в межах стандартних відхилень від середнього, а корінь із сереньоквадратичного відхилення від моди знаходиться між значеннями одного стандартного відхилення і двох стандартних відхилень.
Приклад із не симетричними розподілами
Прикладом не симетричного розподілу є розподіл особистого достатку людей: Декілька людей є дуже багатими, але серед них є деякі, які є екстремально багатими. Однак, досить велика кількість є бідними.
Добре відомий клас розподілів, які можуть мати довільну асиметрію це логнормальний розподіл. Він отримується шляхом перетворення випадкової величини X, що має нормальний розподіл у випадкову величину Y = eX. Тоді логарифм випадкової величини Y є нормально розподіленим, з чого і була утворена назва розподілу.
Якщо прийняти, що μ величини X дорівнює 0, медіана величини Y буде дорівнювати 1, не залежно від стандартного відхилення σ величини X. Це тому що X має симетричний розподіл, так що його медіана також дорівнює 0. Перетворення величини X у Y є монотонним, тому медіана e0 = 1 для Y.
Коли X має стандартне відхилення σ = 0.25, розподіл Y є злегка асиметричним. Використавши формули для логнормального розподілу, отримаємо:
Насправді, медіана знаходиться приблизно на третині відстані від середнього до моди.
Коли X має більше стандартне відхилення, σ = 1, розподіл Y буде сильно асиметричним. Тепер
Тут, правило Пірсона не виконується.
Нерівність Ван Звета
Ван Звет отримав нерівність, що має достатні умови, за яких вона є правдивою. Нерівність
- Мода ≤ Медіана ≤ Середнє
виконується коли
- F(Медіана − x) + F(Медіана + x) ≥ 1
для всіх x де F() — кумулятивна функція розподілу імовірностей.
Див. також
Примітки
- . Архів оригіналу за 2 квітня 2015. Процитовано 16 березня 2015.
- . Архів оригіналу за 29 травня 2018. Процитовано 27 червня 2018.
- Hippel, Paul T. von (2005). . Journal of Statistics Education. 13 (2). doi:10.1080/10691898.2005.11910556. Архів оригіналу за 14 жовтня 2008. Процитовано 27 червня 2018.
- Bottomley H. Maximum distance between the mode and the mean of a unimodal distribution. — 2004. з джерела 14 червня 2018. Процитовано 27 червня 2018.
- van Zwet, WR (1979). Mean, median, mode II. Statistica Neerlandica. 33 (1): 1—5. doi:10.1111/j.1467-9574.1979.tb00657.x.
Джерела
- Гнєденко Б. В. Курс теорії ймовірностей. — Київ : ВПЦ Київський університет, 2010. — 464 с.
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Гихман И. И., Скороход А. В., Ядренко М. В. Теория вероятностей и математическая статистика. — Київ : Вища школа, 1988. — 436 с.(рос.)
Це незавершена стаття з математики. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Mo da znachennya vipadkovoyi velichini sho traplyayetsya najchastishe v sukupnosti sposterezhen Ce take znachennya x v yakomu funkciya mas jmovirnostej nabuvaye maksimalnogo znachennya Inodi traplyayetsya bilshe anizh odna moda napriklad 2 6 6 6 8 9 9 9 10 moda 6 i 9 U takomu vipadku mozhna skazati sho sukupnist multimodalna Iz strukturnih serednih velichin lishe moda maye taku unikalnu vlastivist Yak pravilo multimodalnist vkazuye na te sho nabir danih ne pidporyadkovuyetsya normalnomu rozpodilu Moda yak serednya velichina vzhivayetsya chastishe dlya danih sho mayut nechislovu prirodu Sered perelichenih koloriv avtomobiliv bilij chornij sinij metalik bilij sinij metalik bilij moda dorivnyuvatime znachennyu bilij Za ekspertnoyi ocinki z yiyi dopomogoyu viznachayut najpopulyarnishi tipi produktu sho vrahovuyetsya pri prognozi prodazhiv chi planuvanni yih virobnictva Inshimi slovami moda ye najposhirenishe znachennya vipadkovoyi velichini oznaki U diskretnomu ryadu vona viznachayetsya vizualno za najbilshoyu chastotoyu chastkoyu a v intervalnomu takim chinom viznachayetsya modalnij interval a konkretne modalne znachennya rozrahovuyetsya za formuloyu M o x 0 h f m o f m o 1 f m o f m o 1 f m o f m o 1 displaystyle Mo x 0 h frac f mo f mo 1 f mo f mo 1 f mo f mo 1 de h0 ta h nizhnya mezha ta shirina modalnogo intervalu fmo fmo 1 fmo 1 chastoti chastki vidpovidno modalnogo peredmodalnogo ta pislyamodalnogo intervaliv Moda vibirkiModa vibirki ce takij element sho z yavlyayetsya v nabori najchastishe Napriklad modoyu vibirki 1 3 6 6 6 6 7 7 12 12 17 ye 6 V nastupnomu nabori danih 1 1 2 4 4 moda ne ye unikalnoyu takij nabir danih nazivayut bimodalnim a nabir iz bilshe nizh odniyeyu modoyu multimodalnim Dlya vibirki dlya neperervnogo rozpodilu takoyi yak 0 935 1 211 2 430 3 668 3 874 ce ponyattya v svoyij pochatkovij formi ye nepridatnim oskilki ne isnuye dvoh tochno odnakovih znachen vibirki oskilki kozhne znachennya bude zustrichatisya tochno odin raz Dlya togo shob viznachiti modu v danomu vipadku tipovoyu praktikoyu ye diskretizaciya danih pislya yakoyi znachennya chastoti viniknennya priznachayetsya intervalam iz odnakovim rozmirom oskilki ce robitsya pri pobudovi gistogram priznachayuchi comu intervalu znachennya jogo serednoyi tochki Moda yak pravilom ye tim znachennyam de gistograma dosyagaye svogo maksimumu Dlya malih i serednih za rozmirom vibirok rezultat ciyeyi proceduri duzhe chutlivij do obranoyi velichini intervalu yaksho vin mozhe buti obranim zanadto vuzkim chi zanadto shirokim zazvichaj interval obirayut tak shob znachna chastka danih bula skoncentrovana u vidnosno ne velikij kilkist intervaliv vid 5 do 10 tak shob chastka danih sho vipadaye za mezhi cih intervaliv takozh bula znachnoyu Alternativnim pidhodom mozhe buti yadrova ocinka gustini rozpodilu yakij rozmivaye tochki vibirki takim chinom abi utvoriti neperervnu ocinku funkciyi gustini imovirnostej yaka zabezpechuye mozhlivist ocinki modi Nastupnij kod dlya programnogo zastosunku MATLAB abo Octave rozrahovuye modu vibirki X sort x indices find diff X realmax gt 0 indeksi de povtoryuvani znachennya zminyuyutsya modeL i max diff 0 indices najdovsha dovzhina seriyi povtoryuvanih znachen mode X indices i Na pershomu kroci algoritm potrebuye vidsortuvati vibirku v poryadku zrostannya Potim vin rozrahovuye diskretnu pohidnu vidsortovanogo spisu abi znajti indeksi de cya pohidna ye dodanoyu Potim vin rozrahovuye diskretnu pohidnu cogo otrimanogo naboru indeksiv znahodit maksimum ciyeyi pohidnoyi indeksiv i zreshtoyu otrimuye znachennya iz vidsortovanoyi vibirki u cij tochci maksimumu sho vidpovidatime ostannomu vhodzhennyu poslidovnosti povtoryuvanih znachen Porivnyannya serednogo mediani i modiGeometrichna vizualizaciya modi mediani i serednogo znachennya dovilnoyi funkciyi gustini imovirnostej Porivnyannya riznih zagalnih serednih znachen na prikladi vibirki vibirki 1 2 2 3 4 7 9 Tip Opis Priklad Rezultat Serednye arifmetichne Suma vsih znachen vibirki podilena na kilkist cih elementiv vibirki x 1 n i 1 n x i displaystyle scriptstyle bar x frac 1 n sum i 1 n x i 1 2 2 3 4 7 9 7 4 Mediana Serednye znachennya sho vidokremlyuye bilshu polovinu i menshu polovinu vibirki 1 2 2 3 4 7 9 3 Moda Znachennya sho zustrichayetsya u vibirci najchastishe 1 2 2 3 4 7 9 2 Zastosuvannya Na vidminu vid serednogo i mediani ponyattya modi maye sens navit dlya vipadku iz nominalnimi danimi tobto takih sho ne skladayutsya iz chislovih znachen sho neobhidno dlya serednogo abo navit mozhut ne buti vporyadkovanimi znachennyami yak dlya vipadku iz medianoyu Napriklad yaksho mova jde pro vibirku populyarnosti korejskih imen mozhna vstanoviti sho im ya Kim zustrichayetsya chastishe nizh bud yake inshe V takomu vipadku Kim bude modoyu danoyu vibirki Pri provedenni bud yakoyi proceduri golosuvannya de mnozhina golosiv oznachaye peremogu viznachiti peremozhcya mozhna u vipadku isnuvannya odnogo znachennya modi a yaksho rezultat bude multimodalnim zazvichaj provodyat drugij tur golosuvannya abo zastosovuyut yakus dodatkovu proceduru viznachennya peremozhcya Na vidminu vid mediani ponyattya modi maye sens dlya bud yaki vipadkovoyi velichini sho mozhe prijmati znachennya iz vektornogo prostoru vklyuchayuchi dijsni chisla odno vimirnij vektornij prostir i cili chisla yaki mozhna vvazhati vbudovanimi v dijsni Napriklad dlya rozpodilu tochok na ploshini zazvichaj mozhna otrimati serednye i modu a koncepciyu mediani tut zastosuvati ne mozhna Mediana matime sens yaksho isnuye linijne vporyadkuvannya mozhlivih znachen Vlastivosti Za umovi viznachenosti i dlya sproshennya unikalnosti navedemo nastupni yiyi najbilsh vazhlivi vlastivosti Vsi tri miri mayut taku vlastivist Yaksho nad vipadkovoyu velichinoyu abo kozhnim znachennyam vibirki vikonuyut linijne abo afinne peretvorennya sho zaminyaye velichinu X na aX b to te same peretvorennya vidbudetsya iz serednim medianoyu i modoyu Krim vipadku duzhe malih vibirok moda ye chutlivoyu do vikidiv taki yak vipadkovi ne chasti hibni eksperimentalni vimiryuvannya Mediana bilsh stijka do prisutnosti vikidiv v toj chas yak serednye takozh chutlive do nih Dlya neperervnih odnomodalnih rozpodiliv mediana chasto znahoditsya mizh serednim i modoyu blizko na tretij chastini vidstani mizh serednim i modoyu U viglyadi formuli mediana 2 serednye moda 3 Ce pravilo Karla Pirsona chasto zastosovuyetsya dlya zlegka ne simetrichnih rozpodiliv yaki za formoyu podibni do normalnogo rozpodilu ale ce pravilo ne zavzhdi bude virnim v zagalnomu vipadku i ci tri statistichni miri mozhut buti v dovilnomu poryadku Dlya odnomodalnih rozpodiliv moda znahoditsya v mezhah 3 displaystyle sqrt 3 standartnih vidhilen vid serednogo a korin iz serenokvadratichnogo vidhilennya vid modi znahoditsya mizh znachennyami odnogo standartnogo vidhilennya i dvoh standartnih vidhilen Priklad iz ne simetrichnimi rozpodilami Prikladom ne simetrichnogo rozpodilu ye rozpodil osobistogo dostatku lyudej Dekilka lyudej ye duzhe bagatimi ale sered nih ye deyaki yaki ye ekstremalno bagatimi Odnak dosit velika kilkist ye bidnimi Porivnyannya serednogo mediani i modi dvoh lognormalnih rozpodiliv iz riznimi koeficiyentami asimetriyi Dobre vidomij klas rozpodiliv yaki mozhut mati dovilnu asimetriyu ce lognormalnij rozpodil Vin otrimuyetsya shlyahom peretvorennya vipadkovoyi velichini X sho maye normalnij rozpodil u vipadkovu velichinu Y eX Todi logarifm vipadkovoyi velichini Y ye normalno rozpodilenim z chogo i bula utvorena nazva rozpodilu Yaksho prijnyati sho m velichini X dorivnyuye 0 mediana velichini Y bude dorivnyuvati 1 ne zalezhno vid standartnogo vidhilennya s velichini X Ce tomu sho X maye simetrichnij rozpodil tak sho jogo mediana takozh dorivnyuye 0 Peretvorennya velichini X u Y ye monotonnim tomu mediana e0 1 dlya Y Koli X maye standartne vidhilennya s 0 25 rozpodil Y ye zlegka asimetrichnim Vikoristavshi formuli dlya lognormalnogo rozpodilu otrimayemo serednye e m s 2 2 e 0 0 25 2 2 1 032 moda e m s 2 e 0 0 25 2 0 939 mediana e m e 0 1 displaystyle begin array rlll text serednye amp e mu sigma 2 2 amp e 0 0 25 2 2 amp approx 1 032 text moda amp e mu sigma 2 amp e 0 0 25 2 amp approx 0 939 text mediana amp e mu amp e 0 amp 1 end array Naspravdi mediana znahoditsya priblizno na tretini vidstani vid serednogo do modi Koli X maye bilshe standartne vidhilennya s 1 rozpodil Y bude silno asimetrichnim Teper serednye e m s 2 2 e 0 1 2 2 1 649 moda e m s 2 e 0 1 2 0 368 mediana e m e 0 1 displaystyle begin array rlll text serednye amp e mu sigma 2 2 amp e 0 1 2 2 amp approx 1 649 text moda amp e mu sigma 2 amp e 0 1 2 amp approx 0 368 text mediana amp e mu amp e 0 amp 1 end array Tut pravilo Pirsona ne vikonuyetsya Nerivnist Van Zveta Van Zvet otrimav nerivnist sho maye dostatni umovi za yakih vona ye pravdivoyu Nerivnist Moda Mediana Serednye vikonuyetsya koli F Mediana x F Mediana x 1 dlya vsih x de F kumulyativna funkciya rozpodilu imovirnostej Div takozhPortal Matematika Mediana Matematichne spodivannyaPrimitki Arhiv originalu za 2 kvitnya 2015 Procitovano 16 bereznya 2015 Arhiv originalu za 29 travnya 2018 Procitovano 27 chervnya 2018 Hippel Paul T von 2005 Journal of Statistics Education 13 2 doi 10 1080 10691898 2005 11910556 Arhiv originalu za 14 zhovtnya 2008 Procitovano 27 chervnya 2018 Bottomley H Maximum distance between the mode and the mean of a unimodal distribution 2004 z dzherela 14 chervnya 2018 Procitovano 27 chervnya 2018 van Zwet WR 1979 Mean median mode II Statistica Neerlandica 33 1 1 5 doi 10 1111 j 1467 9574 1979 tb00657 x DzherelaGnyedenko B V Kurs teoriyi jmovirnostej Kiyiv VPC Kiyivskij universitet 2010 464 s Kartashov M V Imovirnist procesi statistika Kiyiv VPC Kiyivskij universitet 2007 504 s Gihman I I Skorohod A V Yadrenko M V Teoriya veroyatnostej i matematicheskaya statistika Kiyiv Visha shkola 1988 436 s ros Ce nezavershena stattya z matematiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi