У теорії ймовірності та статистиці змішаний розподіл (суміш, змішка, чи збиранина розподілів) — це розподіл ймовірностей випадкової величини, отриманий із набору інших випадкових величин наступним чином: спочатку випадкова змінна вибирається випадково з набору відповідно до заданих імовірностей вибору, а потім реалізується значення обраної випадкової величини. Випадкові змінні, що лежать в основі, можуть бути дійснозначними випадковими величинами або випадковими векторами (з однаковою розмірністюю), і в цьому випадку змішаний розподіл є багатовимірним розподілом.
Вступ
У випадках, коли кожна з базових випадкових змінних є неперервною, кінцева змінна також буде неперервною, а її густину ймовірності іноді називають щільністю змішки. Кумулятивну функцію розподілу (і функцію щільності ймовірності, якщо вона існує) можна виразити як опуклу комбінацію (тобто зважену суму з невід'ємними вагами, сума яких дорівнює 1) інших функцій розподілу та щільностей. Індивідуальні розподіли, які об'єднуються для формування змішки, називаються компонентами змішки, а ймовірності (або ваги), пов'язані з кожним компонентом, називаються вагами змішки. Кількість компонентів у суміші часто скінченна, хоча в деяких випадках кількість компонентів може бути нескінченною. Більш загальні випадки (тобто незліченний набір компонентних розподілів), а також зліченний випадок відомі під назвою складених розподілів.
Необхідно розрізняти випадкову величину, функція розподілу або щільність якої є сумою набору компонентів (тобто розподіл суміші), і випадкову величину, значення якої є сумою значень двох або більше базових випадкових змінних, у такому випадку розподіл задається згорткою. Як приклад, сума двох нормально розподілених випадкових величин, кожна з яких має різні середні значення, все одно матиме нормальний розподіл. З іншого боку, щільність змішки, створена як суміш двох нормальних розподілів з різними середніми, матиме два піки за умови, що два середні досить віддалені один від одного, показуючи, що цей розподіл дуже відрізняється від нормального розподілу.
Змішані розподіли виникають у багатьох контекстах у літературі та виникають природним чином там, де статистична сукупність містить дві або більше субпопуляції. Вони також іноді використовуються як засіб представлення ненормальних розподілів. Аналіз даних щодо статистичних моделей, що включають суміші розподілів, обговорюється під назвою моделі сумішей, тоді як ця стаття зосереджується на простих імовірнісних і статистичних властивостях сумішей розподілів і як вони пов'язані з властивостями базових розподілів.
Скінченні та злічені суміші
Дано скінченний набір густин ймовірності p 1 (x), …, p n (x) або відповідних функцій розподілу P 1 (x), . . ., P n (x) і ваги w 1, …, w n такі, що wi ≥ 0 і Σwi = 1, розподіл суміші можна представити записом або густини, f, або функції розподілу, F, як сума (яка в обох випадках є опуклою комбінацією):
Цей тип змішки, оскільки є скінченною сумою, називається скінченною змішкою, і на практиці коли кажуть «густина суміші (змішки)», то зазвичай мають на увазі скінченну суміш (змішку). Випадок зліченно нескінченної множини компонент формально розглядається просто вважаючи .
Незліченні змішки
Якщо набір компонентних розподілів є незліченним, результат часто називають змішаним розподілом ймовірностей. Побудова таких розподілів формально схожа з побудовою змішок, де нескінченні суми або інтеграли замінюють скінченними сумами у випадкку скінченних змішок.
Розглянемо щільність p(x; a) для змінної x, і параметром a. Тобто для кожного значення a в деякій множині A p(x;a) є функцією щільності ймовірності відносно x. Для заданої функцію щільності w (тобто w — невід'ємна та інтегрується до 1), тоді функція
знову є функцією щільності ймовірності для x. Аналогічний інтеграл можна записати для функції розподілу. Зверніть увагу, що наведені тут формули зводяться до випадку скінченної або нескінченної змішки, якщо щільність w може бути узагальненою функцією, що представляє «похідну» кумулятивної функції розподілу дискретного розподілу.
Застосування
Щільності суміші — це складні щільності, які можна виразити за допомогою простіших щільностей (компонентів суміші), і використовуються як тому, що вони забезпечують гарне моделювання певних наборів даних (де різні підмножини даних демонструють різні характеристики, і їх найкраще моделювати окремо), так і тому що вони можуть бути більш піддатливими математично, тому що окремі компоненти суміші можна легше вивчити, ніж загальну щільність суміші.
Щільності суміші можна використовувати для моделювання статистичної генеральної сукупності з субпопуляціями, де компоненти суміші є щільністю субпопуляцій, а ваги — це частки кожної субсукупності в загальній сукупності.
Щільність суміші також можна використовувати для моделювання експериментальної помилки або збурення — вважають, що більшість зразків вимірюють бажане явище, а деякі зразки мають інший, помилковий розподіл.
Параметричні статистики, які припускають відсутність помилок, часто дають збій для таких густин суміші — наприклад, статистика, яка передбачає нормальність, часто катастрофічно непридатна за наявності навіть кількох викидів — і натомість використовується надійна статистика .
У мета-аналізі окремих досліджень неоднорідність дослідження призводить до того, що розподіл результатів є змішаним розподілом і призводить до надмірної дисперсії результатів відносно прогнозованої помилки. Наприклад, у статистичному дослідженні межа похибки (визначена розміром вибірки) передбачає похибку вибірки і, отже, дисперсію результатів повторних опитувань. Наявність неоднорідності дослідження (дослідження мають різну похибку вибірки) збільшує дисперсію щодо межі похибки.
Див. також
- Опукла комбінація
- Алгоритм очікування-максимізації (EM).
- Не плутати зі: список згорток розподілу ймовірностей
Примітки
Список літератури
- Frühwirth-Schnatter, Sylvia (2006), Finite Mixture and Markov Switching Models, Springer, ISBN
- Lindsay, Bruce G. (1995), Mixture models: theory, geometry and applications, NSF-CBMS Regional Conference Series in Probability and Statistics, т. 5, Hayward, CA, USA: Institute of Mathematical Statistics, ISBN , JSTOR 4153184
- Seidel, Wilfried (2010), Lovric, M. (ред.), Mixture models, International Encyclopedia of Statistical Science, Heidelberg: Springer: 827—829, arXiv:0909.0389, doi:10.1007/978-3-642-04898-2, ISBN
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U teoriyi jmovirnosti ta statistici zmishanij rozpodil sumish zmishka chi zbiranina rozpodiliv ce rozpodil jmovirnostej vipadkovoyi velichini otrimanij iz naboru inshih vipadkovih velichin nastupnim chinom spochatku vipadkova zminna vibirayetsya vipadkovo z naboru vidpovidno do zadanih imovirnostej viboru a potim realizuyetsya znachennya obranoyi vipadkovoyi velichini Vipadkovi zminni sho lezhat v osnovi mozhut buti dijsnoznachnimi vipadkovimi velichinami abo vipadkovimi vektorami z odnakovoyu rozmirnistyuyu i v comu vipadku zmishanij rozpodil ye bagatovimirnim rozpodilom VstupU vipadkah koli kozhna z bazovih vipadkovih zminnih ye neperervnoyu kinceva zminna takozh bude neperervnoyu a yiyi gustinu jmovirnosti inodi nazivayut shilnistyu zmishki Kumulyativnu funkciyu rozpodilu i funkciyu shilnosti jmovirnosti yaksho vona isnuye mozhna viraziti yak opuklu kombinaciyu tobto zvazhenu sumu z nevid yemnimi vagami suma yakih dorivnyuye 1 inshih funkcij rozpodilu ta shilnostej Individualni rozpodili yaki ob yednuyutsya dlya formuvannya zmishki nazivayutsya komponentami zmishki a jmovirnosti abo vagi pov yazani z kozhnim komponentom nazivayutsya vagami zmishki Kilkist komponentiv u sumishi chasto skinchenna hocha v deyakih vipadkah kilkist komponentiv mozhe buti neskinchennoyu Bilsh zagalni vipadki tobto nezlichennij nabir komponentnih rozpodiliv a takozh zlichennij vipadok vidomi pid nazvoyu skladenih rozpodiliv Neobhidno rozriznyati vipadkovu velichinu funkciya rozpodilu abo shilnist yakoyi ye sumoyu naboru komponentiv tobto rozpodil sumishi i vipadkovu velichinu znachennya yakoyi ye sumoyu znachen dvoh abo bilshe bazovih vipadkovih zminnih u takomu vipadku rozpodil zadayetsya zgortkoyu Yak priklad suma dvoh normalno rozpodilenih vipadkovih velichin kozhna z yakih maye rizni seredni znachennya vse odno matime normalnij rozpodil Z inshogo boku shilnist zmishki stvorena yak sumish dvoh normalnih rozpodiliv z riznimi serednimi matime dva piki za umovi sho dva seredni dosit viddaleni odin vid odnogo pokazuyuchi sho cej rozpodil duzhe vidriznyayetsya vid normalnogo rozpodilu Zmishani rozpodili vinikayut u bagatoh kontekstah u literaturi ta vinikayut prirodnim chinom tam de statistichna sukupnist mistit dvi abo bilshe subpopulyaciyi Voni takozh inodi vikoristovuyutsya yak zasib predstavlennya nenormalnih rozpodiliv Analiz danih shodo statistichnih modelej sho vklyuchayut sumishi rozpodiliv obgovoryuyetsya pid nazvoyu modeli sumishej todi yak cya stattya zoseredzhuyetsya na prostih imovirnisnih i statistichnih vlastivostyah sumishej rozpodiliv i yak voni pov yazani z vlastivostyami bazovih rozpodiliv Skinchenni ta zlicheni sumishiDano skinchennij nabir gustin jmovirnosti p 1 x p n x abo vidpovidnih funkcij rozpodilu P 1 x P n x i vagi w 1 w n taki sho wi 0 i Swi 1 rozpodil sumishi mozhna predstaviti zapisom abo gustini f abo funkciyi rozpodilu F yak suma yaka v oboh vipadkah ye opukloyu kombinaciyeyu F x i 1nwiPi x displaystyle F x sum i 1 n w i P i x f x i 1nwipi x displaystyle f x sum i 1 n w i p i x Cej tip zmishki oskilki ye skinchennoyu sumoyu nazivayetsya skinchennoyu zmishkoyu i na praktici koli kazhut gustina sumishi zmishki to zazvichaj mayut na uvazi skinchennu sumish zmishku Vipadok zlichenno neskinchennoyi mnozhini komponent formalno rozglyadayetsya prosto vvazhayuchi n displaystyle n infty Nezlichenni zmishkiYaksho nabir komponentnih rozpodiliv ye nezlichennim rezultat chasto nazivayut zmishanim rozpodilom jmovirnostej Pobudova takih rozpodiliv formalno shozha z pobudovoyu zmishok de neskinchenni sumi abo integrali zaminyuyut skinchennimi sumami u vipadkku skinchennih zmishok Rozglyanemo shilnist p x a dlya zminnoyi x i parametrom a Tobto dlya kozhnogo znachennya a v deyakij mnozhini A p x a ye funkciyeyu shilnosti jmovirnosti vidnosno x Dlya zadanoyi funkciyu shilnosti w tobto w nevid yemna ta integruyetsya do 1 todi funkciya f x Aw a p x a da displaystyle f x int A w a p x a da znovu ye funkciyeyu shilnosti jmovirnosti dlya x Analogichnij integral mozhna zapisati dlya funkciyi rozpodilu Zvernit uvagu sho navedeni tut formuli zvodyatsya do vipadku skinchennoyi abo neskinchennoyi zmishki yaksho shilnist w mozhe buti uzagalnenoyu funkciyeyu sho predstavlyaye pohidnu kumulyativnoyi funkciyi rozpodilu diskretnogo rozpodilu ZastosuvannyaShilnosti sumishi ce skladni shilnosti yaki mozhna viraziti za dopomogoyu prostishih shilnostej komponentiv sumishi i vikoristovuyutsya yak tomu sho voni zabezpechuyut garne modelyuvannya pevnih naboriv danih de rizni pidmnozhini danih demonstruyut rizni harakteristiki i yih najkrashe modelyuvati okremo tak i tomu sho voni mozhut buti bilsh piddatlivimi matematichno tomu sho okremi komponenti sumishi mozhna legshe vivchiti nizh zagalnu shilnist sumishi Shilnosti sumishi mozhna vikoristovuvati dlya modelyuvannya statistichnoyi generalnoyi sukupnosti z subpopulyaciyami de komponenti sumishi ye shilnistyu subpopulyacij a vagi ce chastki kozhnoyi subsukupnosti v zagalnij sukupnosti Shilnist sumishi takozh mozhna vikoristovuvati dlya modelyuvannya eksperimentalnoyi pomilki abo zburennya vvazhayut sho bilshist zrazkiv vimiryuyut bazhane yavishe a deyaki zrazki mayut inshij pomilkovij rozpodil Parametrichni statistiki yaki pripuskayut vidsutnist pomilok chasto dayut zbij dlya takih gustin sumishi napriklad statistika yaka peredbachaye normalnist chasto katastrofichno nepridatna za nayavnosti navit kilkoh vikidiv i natomist vikoristovuyetsya nadijna statistika U meta analizi okremih doslidzhen neodnoridnist doslidzhennya prizvodit do togo sho rozpodil rezultativ ye zmishanim rozpodilom i prizvodit do nadmirnoyi dispersiyi rezultativ vidnosno prognozovanoyi pomilki Napriklad u statistichnomu doslidzhenni mezha pohibki viznachena rozmirom vibirki peredbachaye pohibku vibirki i otzhe dispersiyu rezultativ povtornih opituvan Nayavnist neodnoridnosti doslidzhennya doslidzhennya mayut riznu pohibku vibirki zbilshuye dispersiyu shodo mezhi pohibki Div takozhOpukla kombinaciya Algoritm ochikuvannya maksimizaciyi EM Ne plutati zi spisok zgortok rozpodilu jmovirnostejIyerarhichna model BajyesaPrimitkiSpisok literaturiFruhwirth Schnatter Sylvia 2006 Finite Mixture and Markov Switching Models Springer ISBN 978 1 4419 2194 9 Lindsay Bruce G 1995 Mixture models theory geometry and applications NSF CBMS Regional Conference Series in Probability and Statistics t 5 Hayward CA USA Institute of Mathematical Statistics ISBN 0 940600 32 3 JSTOR 4153184 Seidel Wilfried 2010 Lovric M red Mixture models International Encyclopedia of Statistical Science Heidelberg Springer 827 829 arXiv 0909 0389 doi 10 1007 978 3 642 04898 2 ISBN 978 3 642 04898 2