У баєсівській теорії ймовірностей, якщо апостеріорні розподіли p(θ | x) належать до того ж сімейства розподілу ймовірностей, що і апріорний розподіл ймовірностей p(θ), то апріорний і постеріорний розподіли називають спряженими розподілами, а апріорний розподіл називають спряженим апріором (або апріорним спряженням) функції правдоподібности p(x|θ).
Наприклад, сімейство Гаусса є спряженим до себе (або самосопряженим) відносно функції правдоподібності Гаусса: якщо функція правдоподібності є Гауссівською, вибір гауссового апріору на противагу простому середньому значенню гарантує, що постеріорний розподіл буде також Гауссівським. Це означає, що розподіл Гауса є спряженим апріором для Гаусівської функції правдоподібности.
Поняття, а також термін "спряжений апріор" запроваджено Говардом Райффою та Робертом Шлайфером в їхній роботі з Баєсівської теорії прийняття рішень. Подібну концепцію незалежно описав Джордж Альфред Барнард.
Розглянемо загальну задачу виведення (неперервного) розподілу параметра θ з урахуванням деякого даного чи даних x . За теоремою Баєса постеріорний розподіл дорівнює добутку функції правдоподібності і апраіорного розподілу , нормованого ймовірністю даних :
Зафіксуємо функцію правдоподібності; функція правдоподібності, як правило, добре визначається на основі запису про твірний процес даних. Зрозуміло, що різні варіанти попереднього розподілу p ( θ ) можуть ускладнити обчислення інтегралу, а добуток p ( x | θ ) × p ( θ ) може приймати ту чи іншу алгебраїчну форму. Для певного вибору пріоритета, задній має ту саму алгебраїчну форму, що і пріоритет (як правило, з різними значеннями параметрів). Такий вибір є спряженим пріоритетом .
Спряжений апріор використовують для алгебричної зручности, за його допомогою можна отримати формулу для постеріорного розподілу; без нього може знадобитися чисельне інтегрування. Далі, спряжені апріори можуть давати інтуїтивне трактування, більш прозоро показуючи, як функція правдоподібності оновлює апріорний розподіл.
Усі члени експоненційної сім'ї мають спряжені апріори.
Приклад
Форму спряженого апріора як правило, можне визначити шляхом перевірки густини ймовірності чи функції ймовірності розподілу. Наприклад, розглянемо випадкову величину, що складається з кількості успіхів в випробуваннях Бернуллі з невідомою ймовірністю успіху в [0,1]. Ця випадкова величина має біноміальний розподіл з функцією ймовірності у вигляді
Звичайним спряженим апріором такої функції є функція ймовірності бета-розподілу з параметрами ( , ):
де і вибираються для відображення будь-яких наявних переконань чи інформації ( = 1 і = 1 дасть рівномірний розподіл ) і Β ( , ) — бета-функція, яка діє як нормалізуюча константа .
У цьому контексті, і називаються гіперпараметрами (параметрами апріора), щоб відрізнити їх від параметрів базової моделі (тут q). Типовою характеристикою спряжених апріорів є те, що розмірність гіперпараметрів на одиницю більша, ніж розмірність параметрів вихідного розподілу. Якщо всі параметри є скалярними значеннями, то це означає, що буде на один гіперпараметр більше, ніж параметр; але це також стосується параметрів із векторними та матричними значеннями. (Див. загальну статтю про експоненційну сім’ю, а також розглянемо розподіл Вішарта, спряжений апріор коваріаційної матриці багатовимірного нормального розподілу, для прикладу, коли маємо справу з великою розмірністю).
Якщо ми потім виберемо цю випадкову величину і отримаємо s успіхів і f невдач, ми маємо
тобто ще один бета-розподіл з параметрами ( + s, + f ). Цей апостеріорний розподіл можна було б використовувати як апріор для більшої кількості вибірок, при цьому гіперпараметри просто щоразу додають додаткову порцію інформації щойно вона надходить.
Псевдоспостереження
Часто корисно вважати гіперпараметри спряженого апріора розподілу як відповідні спостереженню певної кількості псевдоспостережень із властивостями, заданими параметрами. Наприклад, значення і бета-розподілу можна вважати відповідним успіхам і невдачам, якщо постеріорний режим використовується для вибору оптимального параметра, або успіхів і невдач, якщо для вибору оптимального параметра використовується постеріорне середнє значенняя. Загалом, для майже всіх спряжених апріорів розподілів гіперпараметри можна інтерпретувати в термінах псевдоспостережень. Це може допомогти як в інтуїтивному трактуванні часто заплутаних оновлень рівняннянь, так і для вибору розумних гіперпараметрів для апріора.
Інтерпретації
Аналогія з власними функціями
Спряжені апріори аналогічні власним функціям в теорії операторів, оскільки вони є розподілами, на які «оператор зумовлення» діє зрозумілим чином. Для цього треба розглянути процес перетворення апріорного в апостеріорний розподіл як оператор.
І у випадку власних функцій, і у випадку спряжених апріорів скінченновимірні простори зберігаються при дії оператора: результат виражається тією ж формою (в тому самому просторі), що й вхідні дані. Це значно спрощує аналіз, оскільки в іншому випадку матимемо справу з нескінченновимірним простором (усіх функцій, чи усіх розподілів).
А проте процеси лише аналогічні, не ідентичні: оператор зумовлення не лінійний, оскільки простір розподілів не замкнений відносто лінійної комбінації, а тільки відносно опуклою комбінацією, а апостеріор має лише ту саму форму, що й апріор, але не є його лінійним перетворенням.
Подібно до того, як можна побачити, як виявляється лінійна комбінація власних функцій при застосуванні оператора (оскільки щодо цих функцій оператор діагоналізований), можна легко проаналізувати, як опукла комбінація спряжених апріорів розвивається в зумовности; це називається використання гіпер-апріорного і є відповідником використання щільності суміші спряжених апріорів, а не одного спряженого апріора.
Динамічна система
Можна розглядати умовність спряжених апріорів як задання певного роду (в дискретному часі) динамічної системи: із заданого набору гіперпараметрів вхідні дані оновлюють ці гіперпараметри, тож можна розглядати зміну гіперпараметрів як свого роду «еволюцію в часі» системи, яку можна вважати «навчанням». Різні початкові умови спричинюються до різних траєкторій. Знову ж таки таке трактування аналогічне динамічній системі, визначеній лінійним оператором, однак зауважте, що оскільки різні вибірки призводять до різних результатів, тут маємо не просто залежність від часу, а скоріше від потоку даних у часі. Для пов’язаних підходів див. Рекурсивна байєсівська оцінка та Засвоєння даних .
Практичний приклад
Припустимо, у вашому місті працює служба прокату автомобілів. Водії можуть залишати та брати автомобілі в будь-якому місці в межах міста. Ви можете знайти та орендувати авто за допомогою програми.
Припустимо, ви хочете знайти ймовірність того, що ви зможете знайти авто для оренди на невеликій відстані від вашої домашньої адреси в будь-який час доби.
Протягом трьох днів ви переглядаєте додаток і знаходите таку кількість автомобілів на невеликій відстані від вашої домашньої адреси:
Якщо ми припустимо, що дані отримані з розподілу Пуассона, ми можемо обчислити оцінку максимальної правдоподібності параметра моделі Використовуючи цю оцінку максимальної ймовірності, ми можемо обчислити ймовірність того, що в певний день буде принаймні один автомобіль:
Цей розподіл Пуассона, який, скоріш за все, породив бачені нами дані . Але дані також могли бути отримані з іншого розподілу Пуассона, наприклад, з , або , тощо Насправді існує нескінченна кількість розподілів Пуассона, які могли б генерувати спостережувані дані, і з відносно невеликою кількістю спостережень ми не можемо бути досить впевнені щодо того, який саме розподіл Пуассона згенерував ці дані. Інтуїтивно ми повинні замість цього взяти середнє зважене значення ймовірності для кожного з цих розподілів Пуассона, зважених значенням того наскільки вони ймовірні, враховуючи дані, які ми спостерігали .
Як правило, ця величина відома як апостеріорний прогнозний розподіл де це нова точка даних, є спостережуваними даними і є параметрами моделі. Використовуючи теорему Баєса, можна розширити тому Як правило, цей інтеграл важко обчислити. Однак, якщо ви виберете спряжений апріорний розподіл , можна отримати явну формулу. Її можна знайти в останньому стовпці в таблицях нижче.
Повертаючись до нашого прикладу, якщо виберемо гамма-розподіл як наш апріорний розподіл параметра в розподілі Пуассона, то постеріорним розподілом для передбачення буде негативний біноміальний розподіл, як видно з останнього стовпця таблиці нижче. Гамма-розподіл параметризується двома гіперпараметрами які ми маємо вибрати. Зважаючи на графіки гамма-розподілу, вибираємо , що, видається обґрунтованим апріором для середньої кількості автівок. Вибір апріорних гіперпараметрів за своєю суттю є суб’єктивним і заснований на попередніх знаннях і досвіді.
Враховуючи апріорні гіперпараметри і ми можемо обчислити постеріорні гіперпараметри і
Враховуючи постеріорні гіперпараметри, ми можемо нарешті обчислити апостеріорний прогноз
Ця набагато більш консервативна оцінка відображає невизначеність параметрів моделі, яку враховує постеріорний прогноз.
Таблиця спряжених розподілів
Нехай n - кількість спостережень. У всіх нижченаведених випадках передбачається, що дані складаються з n точок (які будуть випадковими векторами у багатовимірних випадках).
Якщо функція правдоподібності належить експоненціальному сімейству, то спряжений апріор існує, часто також з експоненціального сімейства.
Коли функція правдоподібності є дискретним розподілом
Правдоподібність | Параметри моделі | Розподіл спряженого апріора | Гіперпараметри апріора | Гіперпараметри постреріора | Інтерпретація гіперпараметрів | Постеріорний прогнозний розподіл |
---|---|---|---|---|---|---|
Бернуллі | p (ймовірність) | Бета | успіхи, невдачі | |||
Біноміальний | p (ймовірність) | Бета | успіхи, невдачі | (Бета-біноміальний) | ||
Від'ємний біноміальний з відомою кількістю невдач, r | p (ймовірність) | Бета | число всіх успіхів, невдачі (тобто, експериментів, за умови, що фіксоване) | |||
Пуассон | λ (темп) | Гамма | загальна кількість випадань в інтервалах | (Від'ємний біноміальний) | ||
загальна кількість випадань в інтервалах | (Від'ємний біноміальний) | |||||
Категорійний | p (вектор ймовірності), k (число категорій; тобто, розмірність p) | Діріхле | де число спостережень в категорії i | число випадінь категорії | ||
Поліноміальний | p (вектор ймовірності), k (число категорій; тобто, розмірність p) | Діріхле | число випадінь категорії | ([en]) | ||
Гіпергеометричний з відомим розміром загальної популяції, N | M (цільове число членів) | Бета-біноміальний | успіхи, невдачі | |||
Геометричний | p0 (ймовірність) | Бета | експерименти, всі невдачі |
Коли функція ймовірності є безперервним розподілом
Ця стаття містить фрагменти іноземною мовою. |
Правдоподібність | Параметри моделі | Розподіл спряженого апріора | Гіперпараметри апріора | Гіперпараметри постреріора | Інтерпретація гіперпараметрів | Постеріорний прогнозний розподіл | |
---|---|---|---|---|---|---|---|
Нормальний з відомою дисперсією σ2 | μ (середнє) | Нормальний | mean was estimated from observations with total precision (sum of all individual precisions) and with sample mean | ||||
Нормальний with known precision τ | μ (середнє) | Нормальний | mean was estimated from observations with total precision (sum of all individual precisions) and with sample mean | ||||
Нормальний з відомим середнім μ | σ2 (дисперсія) | Обернений гамма | variance was estimated from observations with sample variance (i.e. with sum of squared deviations , where deviations are from known mean ) | ||||
Нормальний з відомим середнім μ | σ2 (дисперсія) | Scaled inverse chi-squared | variance was estimated from observations with sample variance | ||||
Нормальний з відомим середнім μ | τ (прецизійність) | Гамма | precision was estimated from observations with sample variance (i.e. with sum of squared deviations , where deviations are from known mean ) | ||||
Нормальний | μ і σ2 за умови взаємозамінности | Normal-inverse gamma |
| mean was estimated from observations with sample mean ; variance was estimated from observations with sample mean and sum of squared deviations | |||
Нормальний | μ і τ за умови взаємозамінности | Normal-gamma |
| mean was estimated from observations with sample mean , and precision was estimated from observations with sample mean and sum of squared deviations | |||
Багатовимірний нормальний з відомою матрицею коваріації Σ | μ (вектор середнього) | Багатовимірний нормальний |
| mean was estimated from observations with total precision (sum of all individual precisions) and with sample mean | |||
Багатовимірний нормальний з відомою матрицею прецизійності Λ | μ (вектор середнього) | Багатовимірний нормальний |
| mean was estimated from observations with total precision (sum of all individual precisions) and with sample mean | |||
Багатовимірний нормальний з відомим середнім μ | Σ (матриця коваріації) | Inverse-Wishart | covariance matrix was estimated from observations with sum of pairwise deviation products | ||||
Багатовимірний нормальний з відомим середнім μ | Λ (матриця прецизійності) | Wishart | covariance matrix was estimated from observations with sum of pairwise deviation products | ||||
Багатовимірний нормальний | μ (вектор середнього) і Σ (матриця коваріації) | normal-inverse-Wishart |
| mean was estimated from observations with sample mean ; covariance matrix was estimated from observations with sample mean and with sum of pairwise deviation products | |||
Багатовимірний нормальний | μ (вектор середнього) і Λ (матриця прецизійності) | normal-Wishart |
| mean was estimated from observations with sample mean ; covariance matrix was estimated from observations with sample mean and with sum of pairwise deviation products | |||
Рівномірний | Парето | observations with maximum value | |||||
Парето з відомим мінімумом xm | k (форма) | Гамма | observations with sum of the order of magnitude of each observation (i.e. the logarithm of the ratio of each observation to the minimum ) | ||||
Weibull з відомим параметром форми β | θ (масштаб) | Обернений гамма | observations with sum of the β'th power of each observation | ||||
Логнормальний | Same as for the normal distribution after applying the natural logarithm to the data for the posterior hyperparameters. Please refer to page 21 and 22 to see the details. | ||||||
Експоненційний | λ (темп) | Гамма | observations that sum to | (Lomax distribution) | |||
Гамма з відомим параметром α | β (темп) | Гамма | observations with sum | ||||
Обернений гамма з відомим параметром форми α | β (обернений масштаб) | Гамма | observations with sum | ||||
Гамма з відомим параметром темпу β | α (форма) | or observations ( for estimating , for estimating ) with product | |||||
Гамма | α (форма), β (обернений масштаб) | was estimated from observations with product ; was estimated from observations with sum | |||||
Beta | α, β | and were estimated from observations with product and product of the complements |
Див. також
Примітки
- Позначається тими ж символами що й апріорні гіперпараметри з апострофами('). Наприклад позначається
- Це постеріорний прогнозний розподіл нової точки зумовлений спостереженими точками (наявною інформацією), що мають парпметри . Змінні з апострофами позначають постеріорні значення параметрів.
- Точна інтерпретація параметрів бета-розподілу з точки зору кількості успіхів і невдач залежить від того, яка функція використовується для отримання точкової оцінки з розподілу. Матсподівання бета-розподілу обчислюється як що відповідає успіхам і невдачам, тоді як його мода дорівнює що відповідає успіхам і невдачам. У Баєсівських обчисленнях точкових оцінок віддають перевагу постеріорному матсподіванню перед постеріорною модою, ґрунтуючись на квадратичній функції втрат, до того ж використання і математично зручніше, тоді як перевагою використання і є те, що рівномірний апріор відповідає випадку коли маємо 0 успіхів і 0 невдач. Аналогічні міркування мають місце при використанні розподілу Діріхле.
- β темп зміни чи обернений до параметра масштабу. В параметризації Гамма-розподіл, θ = 1/β і k = α.
- Це постеріорний прогнозний розподіл нової точки зумовлений спостереженими точками (наявною інформацією), що мають парпметри . Змінні з апострофами позначають постеріорні значення параметрів. and позначають нормальний розподіл і t-розподіл Стьюдента або ж багатовимірний нормальний розподіл і у багатовиміних випадках відповідно.
Джерела
- and . Applied Statistical Decision Theory. Division of Research, Graduate School of Business Administration, Harvard University, 1961.
- Jeff Miller et al. Earliest Known Uses of Some of the Words of Mathematics [ 4 березня 2009 у Wayback Machine.], "conjugate prior distributions" [ 1 травня 2011 у Wayback Machine.]. Electronic document, revision of November 13, 2005, retrieved December 2, 2005.
- For a catalog, see ; Carlin, John B.; Stern, Hal S.; Rubin, Donald B. (2003). Bayesian Data Analysis (вид. 2nd). CRC Press. ISBN .
- Daniel Fink (May 1997). (PDF). Архів оригіналу (PDF) за 4 травня 2021. Процитовано 16 січня 2022. (англ.)
- Murphy, Kevin P. (2007), (PDF), архів оригіналу (PDF) за 18 січня 2022, процитовано 18 січня 2022
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U bayesivskij teoriyi jmovirnostej yaksho aposteriorni rozpodili p 8 x nalezhat do togo zh simejstva rozpodilu jmovirnostej sho i apriornij rozpodil jmovirnostej p 8 to apriornij i posteriornij rozpodili nazivayut spryazhenimi rozpodilami a apriornij rozpodil nazivayut spryazhenim apriorom abo apriornim spryazhennyam funkciyi pravdopodibnosti p x 8 Napriklad simejstvo Gaussa ye spryazhenim do sebe abo samosopryazhenim vidnosno funkciyi pravdopodibnosti Gaussa yaksho funkciya pravdopodibnosti ye Gaussivskoyu vibir gaussovogo aprioru na protivagu prostomu serednomu znachennyu garantuye sho posteriornij rozpodil bude takozh Gaussivskim Ce oznachaye sho rozpodil Gausa ye spryazhenim apriorom dlya Gausivskoyi funkciyi pravdopodibnosti Ponyattya a takozh termin spryazhenij aprior zaprovadzheno Govardom Rajffoyu ta Robertom Shlajferom v yihnij roboti z Bayesivskoyi teoriyi prijnyattya rishen Podibnu koncepciyu nezalezhno opisav Dzhordzh Alfred Barnard Rozglyanemo zagalnu zadachu vivedennya neperervnogo rozpodilu parametra 8 z urahuvannyam deyakogo danogo chi danih x Za teoremoyu Bayesa posteriornij rozpodil dorivnyuye dobutku funkciyi pravdopodibnosti 8 p x 8 displaystyle theta mapsto p x mid theta i apraiornogo rozpodilu p 8 displaystyle p theta normovanogo jmovirnistyu danih p x displaystyle p x p 8 x p x 8 p 8 p x p x 8 p 8 8 p x 8 d 8 p x 8 p 8 8 p x 8 p 8 d 8 displaystyle begin aligned p theta mid x amp frac p x mid theta p theta p x amp frac p x mid theta p theta int theta p x theta d theta amp frac p x mid theta p theta int theta p x mid theta p theta d theta end aligned Zafiksuyemo funkciyu pravdopodibnosti funkciya pravdopodibnosti yak pravilo dobre viznachayetsya na osnovi zapisu pro tvirnij proces danih Zrozumilo sho rizni varianti poperednogo rozpodilu p 8 mozhut uskladniti obchislennya integralu a dobutok p x 8 p 8 mozhe prijmati tu chi inshu algebrayichnu formu Dlya pevnogo viboru prioriteta zadnij maye tu samu algebrayichnu formu sho i prioritet yak pravilo z riznimi znachennyami parametriv Takij vibir ye spryazhenim prioritetom Spryazhenij aprior vikoristovuyut dlya algebrichnoyi zruchnosti za jogo dopomogoyu mozhna otrimati formulu dlya posteriornogo rozpodilu bez nogo mozhe znadobitisya chiselne integruvannya Dali spryazheni apriori mozhut davati intuyitivne traktuvannya bilsh prozoro pokazuyuchi yak funkciya pravdopodibnosti onovlyuye apriornij rozpodil Usi chleni eksponencijnoyi sim yi mayut spryazheni apriori PrikladFormu spryazhenogo apriora yak pravilo mozhne viznachiti shlyahom perevirki gustini jmovirnosti chi funkciyi jmovirnosti rozpodilu Napriklad rozglyanemo vipadkovu velichinu sho skladayetsya z kilkosti uspihiv s displaystyle s v n displaystyle n viprobuvannyah Bernulli z nevidomoyu jmovirnistyu uspihu q displaystyle q v 0 1 Cya vipadkova velichina maye binomialnij rozpodil z funkciyeyu jmovirnosti u viglyadi p s n s q s 1 q n s displaystyle p s n choose s q s 1 q n s Zvichajnim spryazhenim apriorom takoyi funkciyi ye funkciya jmovirnosti beta rozpodilu z parametrami a displaystyle alpha b displaystyle beta p q q a 1 1 q b 1 B a b displaystyle p q q alpha 1 1 q beta 1 over mathrm B alpha beta de a displaystyle alpha i b displaystyle beta vibirayutsya dlya vidobrazhennya bud yakih nayavnih perekonan chi informaciyi a displaystyle alpha 1 i b displaystyle beta 1 dast rivnomirnij rozpodil i B a displaystyle alpha b displaystyle beta beta funkciya yaka diye yak normalizuyucha konstanta U comu konteksti a displaystyle alpha i b displaystyle beta nazivayutsya giperparametrami parametrami apriora shob vidrizniti yih vid parametriv bazovoyi modeli tut q Tipovoyu harakteristikoyu spryazhenih aprioriv ye te sho rozmirnist giperparametriv na odinicyu bilsha nizh rozmirnist parametriv vihidnogo rozpodilu Yaksho vsi parametri ye skalyarnimi znachennyami to ce oznachaye sho bude na odin giperparametr bilshe nizh parametr ale ce takozh stosuyetsya parametriv iz vektornimi ta matrichnimi znachennyami Div zagalnu stattyu pro eksponencijnu sim yu a takozh rozglyanemo rozpodil Visharta spryazhenij aprior kovariacijnoyi matrici bagatovimirnogo normalnogo rozpodilu dlya prikladu koli mayemo spravu z velikoyu rozmirnistyu Yaksho mi potim viberemo cyu vipadkovu velichinu i otrimayemo s uspihiv i f nevdach mi mayemo P s f q x s f s x s 1 x f P q x x a 1 1 x b 1 B a b P q x s f P s f x P x P s f y P y d y s f s x s a 1 1 x f b 1 B a b y 0 1 s f s y s a 1 1 y f b 1 B a b d y x s a 1 1 x f b 1 B s a f b displaystyle begin aligned P s f mid q x amp s f choose s x s 1 x f P q x amp x alpha 1 1 x beta 1 over mathrm B alpha beta P q x mid s f amp frac P s f mid x P x int P s f mid y P y dy amp s f choose s x s alpha 1 1 x f beta 1 mathrm B alpha beta over int y 0 1 left s f choose s y s alpha 1 1 y f beta 1 mathrm B alpha beta right dy amp x s alpha 1 1 x f beta 1 over mathrm B s alpha f beta end aligned tobto she odin beta rozpodil z parametrami a displaystyle alpha s b displaystyle beta f Cej aposteriornij rozpodil mozhna bulo b vikoristovuvati yak aprior dlya bilshoyi kilkosti vibirok pri comu giperparametri prosto shorazu dodayut dodatkovu porciyu informaciyi shojno vona nadhodit PsevdosposterezhennyaChasto korisno vvazhati giperparametri spryazhenogo apriora rozpodilu yak vidpovidni sposterezhennyu pevnoyi kilkosti psevdosposterezhen iz vlastivostyami zadanimi parametrami Napriklad znachennya a displaystyle alpha i b displaystyle beta beta rozpodilu mozhna vvazhati vidpovidnim a 1 displaystyle alpha 1 uspiham i b 1 displaystyle beta 1 nevdacham yaksho posteriornij rezhim vikoristovuyetsya dlya viboru optimalnogo parametra abo a displaystyle alpha uspihiv i b displaystyle beta nevdach yaksho dlya viboru optimalnogo parametra vikoristovuyetsya posteriorne serednye znachennyaya Zagalom dlya majzhe vsih spryazhenih aprioriv rozpodiliv giperparametri mozhna interpretuvati v terminah psevdosposterezhen Ce mozhe dopomogti yak v intuyitivnomu traktuvanni chasto zaplutanih onovlen rivnyannyan tak i dlya viboru rozumnih giperparametriv dlya apriora InterpretaciyiAnalogiya z vlasnimi funkciyami Spryazheni apriori analogichni vlasnim funkciyam v teoriyi operatoriv oskilki voni ye rozpodilami na yaki operator zumovlennya diye zrozumilim chinom Dlya cogo treba rozglyanuti proces peretvorennya apriornogo v aposteriornij rozpodil yak operator I u vipadku vlasnih funkcij i u vipadku spryazhenih aprioriv skinchennovimirni prostori zberigayutsya pri diyi operatora rezultat virazhayetsya tiyeyu zh formoyu v tomu samomu prostori sho j vhidni dani Ce znachno sproshuye analiz oskilki v inshomu vipadku matimemo spravu z neskinchennovimirnim prostorom usih funkcij chi usih rozpodiliv A prote procesi lishe analogichni ne identichni operator zumovlennya ne linijnij oskilki prostir rozpodiliv ne zamknenij vidnosto linijnoyi kombinaciyi a tilki vidnosno opukloyu kombinaciyeyu a aposterior maye lishe tu samu formu sho j aprior ale ne ye jogo linijnim peretvorennyam Podibno do togo yak mozhna pobachiti yak viyavlyayetsya linijna kombinaciya vlasnih funkcij pri zastosuvanni operatora oskilki shodo cih funkcij operator diagonalizovanij mozhna legko proanalizuvati yak opukla kombinaciya spryazhenih aprioriv rozvivayetsya v zumovnosti ce nazivayetsya vikoristannya giper apriornogo i ye vidpovidnikom vikoristannya shilnosti sumishi spryazhenih aprioriv a ne odnogo spryazhenogo apriora Dinamichna sistema Mozhna rozglyadati umovnist spryazhenih aprioriv yak zadannya pevnogo rodu v diskretnomu chasi dinamichnoyi sistemi iz zadanogo naboru giperparametriv vhidni dani onovlyuyut ci giperparametri tozh mozhna rozglyadati zminu giperparametriv yak svogo rodu evolyuciyu v chasi sistemi yaku mozhna vvazhati navchannyam Rizni pochatkovi umovi sprichinyuyutsya do riznih trayektorij Znovu zh taki take traktuvannya analogichne dinamichnij sistemi viznachenij linijnim operatorom odnak zauvazhte sho oskilki rizni vibirki prizvodyat do riznih rezultativ tut mayemo ne prosto zalezhnist vid chasu a skorishe vid potoku danih u chasi Dlya pov yazanih pidhodiv div Rekursivna bajyesivska ocinka ta Zasvoyennya danih Praktichnij prikladPripustimo u vashomu misti pracyuye sluzhba prokatu avtomobiliv Vodiyi mozhut zalishati ta brati avtomobili v bud yakomu misci v mezhah mista Vi mozhete znajti ta orenduvati avto za dopomogoyu programi Pripustimo vi hochete znajti jmovirnist togo sho vi zmozhete znajti avto dlya orendi na nevelikij vidstani vid vashoyi domashnoyi adresi v bud yakij chas dobi Protyagom troh dniv vi pereglyadayete dodatok i znahodite taku kilkist avtomobiliv na nevelikij vidstani vid vashoyi domashnoyi adresi x 3 4 1 displaystyle mathbf x 3 4 1 Yaksho mi pripustimo sho dani otrimani z rozpodilu Puassona mi mozhemo obchisliti ocinku maksimalnoyi pravdopodibnosti parametra modeli l 3 4 1 3 2 67 textstyle lambda frac 3 4 1 3 approx 2 67 Vikoristovuyuchi cyu ocinku maksimalnoyi jmovirnosti mi mozhemo obchisliti jmovirnist togo sho v pevnij den bude prinajmni odin avtomobil p x gt 0 l 2 67 1 p x 0 l 2 67 1 2 67 0 e 2 67 0 0 93 textstyle p x gt 0 lambda approx 2 67 1 p x 0 lambda approx 2 67 1 frac 2 67 0 e 2 67 0 approx 0 93 Cej rozpodil Puassona yakij skorish za vse porodiv bacheni nami dani x displaystyle mathbf x Ale dani takozh mogli buti otrimani z inshogo rozpodilu Puassona napriklad z l 3 displaystyle lambda 3 abo l 2 displaystyle lambda 2 tosho Naspravdi isnuye neskinchenna kilkist rozpodiliv Puassona yaki mogli b generuvati sposterezhuvani dani i z vidnosno nevelikoyu kilkistyu sposterezhen mi ne mozhemo buti dosit vpevneni shodo togo yakij same rozpodil Puassona zgeneruvav ci dani Intuyitivno mi povinni zamist cogo vzyati serednye zvazhene znachennya jmovirnosti p x gt 0 l displaystyle p x gt 0 lambda dlya kozhnogo z cih rozpodiliv Puassona zvazhenih znachennyam togo naskilki voni jmovirni vrahovuyuchi dani yaki mi sposterigali x displaystyle mathbf x Yak pravilo cya velichina vidoma yak aposteriornij prognoznij rozpodil p x x 8 p x 8 p 8 x d 8 displaystyle p x mathbf x int theta p x theta p theta mathbf x d theta de x displaystyle x ce nova tochka danih x displaystyle mathbf x ye sposterezhuvanimi danimi i 8 displaystyle theta ye parametrami modeli Vikoristovuyuchi teoremu Bayesa mozhna rozshiriti p 8 x p x 8 p 8 p x displaystyle p theta mathbf x frac p mathbf x theta p theta p mathbf x tomu p x x 8 p x 8 p x 8 p 8 p x d 8 displaystyle p x mathbf x int theta p x theta frac p mathbf x theta p theta p mathbf x d theta Yak pravilo cej integral vazhko obchisliti Odnak yaksho vi viberete spryazhenij apriornij rozpodil p 8 displaystyle p theta mozhna otrimati yavnu formulu Yiyi mozhna znajti v ostannomu stovpci v tablicyah nizhche Povertayuchis do nashogo prikladu yaksho viberemo gamma rozpodil yak nash apriornij rozpodil parametra l displaystyle lambda v rozpodili Puassona to posteriornim rozpodilom dlya peredbachennya bude negativnij binomialnij rozpodil yak vidno z ostannogo stovpcya tablici nizhche Gamma rozpodil parametrizuyetsya dvoma giperparametrami a b displaystyle alpha beta yaki mi mayemo vibrati Zvazhayuchi na grafiki gamma rozpodilu vibirayemo a b 2 displaystyle alpha beta 2 sho vidayetsya obgruntovanim apriorom dlya serednoyi kilkosti avtivok Vibir apriornih giperparametriv za svoyeyu suttyu ye sub yektivnim i zasnovanij na poperednih znannyah i dosvidi Vrahovuyuchi apriorni giperparametri a displaystyle alpha i b displaystyle beta mi mozhemo obchisliti posteriorni giperparametri a a i x i 2 3 4 1 10 textstyle alpha alpha sum i x i 2 3 4 1 10 i b b n 2 3 5 textstyle beta beta n 2 3 5 Vrahovuyuchi posteriorni giperparametri mi mozhemo nareshti obchisliti aposteriornij prognoz p x gt 0 x 1 p x 0 x 1 N B 0 10 1 1 5 0 84 textstyle p x gt 0 mathbf x 1 p x 0 mathbf x 1 NB left 0 10 frac 1 1 5 right approx 0 84 Cya nabagato bilsh konservativna ocinka vidobrazhaye neviznachenist parametriv modeli yaku vrahovuye posteriornij prognoz Tablicya spryazhenih rozpodilivNehaj n kilkist sposterezhen U vsih nizhchenavedenih vipadkah peredbachayetsya sho dani skladayutsya z n tochok x 1 x n displaystyle x 1 ldots x n yaki budut vipadkovimi vektorami u bagatovimirnih vipadkah Yaksho funkciya pravdopodibnosti nalezhit eksponencialnomu simejstvu to spryazhenij aprior isnuye chasto takozh z eksponencialnogo simejstva Koli funkciya pravdopodibnosti ye diskretnim rozpodilom Pravdopodibnist Parametri modeli Rozpodil spryazhenogo apriora Giperparametri apriora Giperparametri postreriora Interpretaciya giperparametriv Posteriornij prognoznij rozpodil Bernulli p jmovirnist Beta a b R displaystyle alpha beta in mathbb R a i 1 n x i b n i 1 n x i displaystyle alpha sum i 1 n x i beta n sum i 1 n x i a displaystyle alpha uspihi b displaystyle beta nevdachi p x 1 a a b displaystyle p tilde x 1 frac alpha alpha beta Binomialnij p jmovirnist Beta a b R displaystyle alpha beta in mathbb R a i 1 n x i b i 1 n N i i 1 n x i displaystyle alpha sum i 1 n x i beta sum i 1 n N i sum i 1 n x i a displaystyle alpha uspihi b displaystyle beta nevdachi BetaBin x a b displaystyle operatorname BetaBin tilde x alpha beta Beta binomialnij Vid yemnij binomialnij z vidomoyu kilkistyu nevdach r p jmovirnist Beta a b R displaystyle alpha beta in mathbb R a r n b i 1 n x i displaystyle alpha rn beta sum i 1 n x i a displaystyle alpha chislo vsih uspihiv b displaystyle beta nevdachi tobto b r displaystyle frac beta r eksperimentiv za umovi sho r displaystyle r fiksovane BetaNegBin x a b displaystyle operatorname BetaNegBin tilde x alpha beta Beta negativnij binomialnij Puasson l temp Gamma k 8 R displaystyle k theta in mathbb R k i 1 n x i 8 n 8 1 displaystyle k sum i 1 n x i frac theta n theta 1 k displaystyle k zagalna kilkist vipadan v 1 8 displaystyle frac 1 theta intervalah NB x k 8 8 1 displaystyle operatorname NB left tilde x mid k frac theta theta 1 right Vid yemnij binomialnij a b displaystyle alpha beta a i 1 n x i b n displaystyle alpha sum i 1 n x i beta n a displaystyle alpha zagalna kilkist vipadan v b displaystyle beta intervalah NB x a 1 1 b displaystyle operatorname NB left tilde x mid alpha frac 1 1 beta right Vid yemnij binomialnij Kategorijnij p vektor jmovirnosti k chislo kategorij tobto rozmirnist p Dirihle a R k displaystyle boldsymbol alpha in mathbb R k a c 1 c k displaystyle boldsymbol alpha c 1 ldots c k de c i displaystyle c i chislo sposterezhen v kategoriyi i a i displaystyle alpha i chislo vipadin kategoriyi i displaystyle i p x i a i i a i a i c i i a i n displaystyle begin aligned p tilde x i amp frac alpha i sum i alpha i amp frac alpha i c i sum i alpha i n end aligned Polinomialnij p vektor jmovirnosti k chislo kategorij tobto rozmirnist p Dirihle a R k displaystyle boldsymbol alpha in mathbb R k a i 1 n x i displaystyle boldsymbol alpha sum i 1 n mathbf x i a i displaystyle alpha i chislo vipadin kategoriyi i displaystyle i DirMult x a displaystyle operatorname DirMult tilde mathbf x mid boldsymbol alpha en Gipergeometrichnij z vidomim rozmirom zagalnoyi populyaciyi N M cilove chislo chleniv Beta binomialnij n N a b displaystyle n N alpha beta a i 1 n x i b i 1 n N i i 1 n x i displaystyle alpha sum i 1 n x i beta sum i 1 n N i sum i 1 n x i a displaystyle alpha uspihi b displaystyle beta nevdachi Geometrichnij p0 jmovirnist Beta a b R displaystyle alpha beta in mathbb R a n b i 1 n x i displaystyle alpha n beta sum i 1 n x i a displaystyle alpha eksperimenti b displaystyle beta vsi nevdachi Koli funkciya jmovirnosti ye bezperervnim rozpodilom Cya stattya mistit neperekladeni fragmenti inozemnoyu movoyu Vi mozhete dopomogti proyektu pereklavshi yih ukrayinskoyu Pravdopodibnist Parametri modeli Rozpodil spryazhenogo apriora Giperparametri apriora Giperparametri postreriora Interpretaciya giperparametriv Posteriornij prognoznij rozpodil Normalnij z vidomoyu dispersiyeyu s2 m serednye Normalnij m 0 s 0 2 displaystyle mu 0 sigma 0 2 1 1 s 0 2 n s 2 m 0 s 0 2 i 1 n x i s 2 1 s 0 2 n s 2 1 displaystyle frac 1 frac 1 sigma 0 2 frac n sigma 2 left frac mu 0 sigma 0 2 frac sum i 1 n x i sigma 2 right left frac 1 sigma 0 2 frac n sigma 2 right 1 mean was estimated from observations with total precision sum of all individual precisions 1 s 0 2 displaystyle 1 sigma 0 2 and with sample mean m 0 displaystyle mu 0 N x m 0 s 0 2 s 2 displaystyle mathcal N tilde x mu 0 sigma 0 2 sigma 2 Normalnij with known precision t m serednye Normalnij m 0 t 0 displaystyle mu 0 tau 0 t 0 m 0 t i 1 n x i t 0 n t t 0 n t 1 displaystyle frac tau 0 mu 0 tau sum i 1 n x i tau 0 n tau left tau 0 n tau right 1 mean was estimated from observations with total precision sum of all individual precisions t 0 displaystyle tau 0 and with sample mean m 0 displaystyle mu 0 N x m 0 1 t 0 1 t displaystyle mathcal N left tilde x mid mu 0 frac 1 tau 0 frac 1 tau right Normalnij z vidomim serednim m s2 dispersiya Obernenij gamma a b displaystyle mathbf alpha beta a n 2 b i 1 n x i m 2 2 displaystyle mathbf alpha frac n 2 mathbf beta frac sum i 1 n x i mu 2 2 variance was estimated from 2 a displaystyle 2 alpha observations with sample variance b a displaystyle beta alpha i e with sum of squared deviations 2 b displaystyle 2 beta where deviations are from known mean m displaystyle mu t 2 a x m s 2 b a displaystyle t 2 alpha tilde x mu sigma 2 beta alpha Normalnij z vidomim serednim m s2 dispersiya Scaled inverse chi squared n s 0 2 displaystyle nu sigma 0 2 n n n s 0 2 i 1 n x i m 2 n n displaystyle nu n frac nu sigma 0 2 sum i 1 n x i mu 2 nu n variance was estimated from n displaystyle nu observations with sample variance s 0 2 displaystyle sigma 0 2 t n x m s 0 2 displaystyle t nu tilde x mu sigma 0 2 Normalnij z vidomim serednim m t precizijnist Gamma a b displaystyle alpha beta a n 2 b i 1 n x i m 2 2 displaystyle alpha frac n 2 beta frac sum i 1 n x i mu 2 2 precision was estimated from 2 a displaystyle 2 alpha observations with sample variance b a displaystyle beta alpha i e with sum of squared deviations 2 b displaystyle 2 beta where deviations are from known mean m displaystyle mu t 2 a x m s 2 b a displaystyle t 2 alpha tilde x mid mu sigma 2 beta alpha Normalnij m i s2 za umovi vzayemozaminnosti Normal inverse gamma m 0 n a b displaystyle mu 0 nu alpha beta n m 0 n x n n n n a n 2 displaystyle frac nu mu 0 n bar x nu n nu n alpha frac n 2 b 1 2 i 1 n x i x 2 n n n n x m 0 2 2 displaystyle beta tfrac 1 2 sum i 1 n x i bar x 2 frac n nu nu n frac bar x mu 0 2 2 x displaystyle bar x serednye vibirki mean was estimated from n displaystyle nu observations with sample mean m 0 displaystyle mu 0 variance was estimated from 2 a displaystyle 2 alpha observations with sample mean m 0 displaystyle mu 0 and sum of squared deviations 2 b displaystyle 2 beta t 2 a x m b n 1 n a displaystyle t 2 alpha left tilde x mid mu frac beta nu 1 nu alpha right Normalnij m i t za umovi vzayemozaminnosti Normal gamma m 0 n a b displaystyle mu 0 nu alpha beta n m 0 n x n n n n a n 2 displaystyle frac nu mu 0 n bar x nu n nu n alpha frac n 2 b 1 2 i 1 n x i x 2 n n n n x m 0 2 2 displaystyle beta tfrac 1 2 sum i 1 n x i bar x 2 frac n nu nu n frac bar x mu 0 2 2 x displaystyle bar x serednye vibirki mean was estimated from n displaystyle nu observations with sample mean m 0 displaystyle mu 0 and precision was estimated from 2 a displaystyle 2 alpha observations with sample mean m 0 displaystyle mu 0 and sum of squared deviations 2 b displaystyle 2 beta t 2 a x m b n 1 a n displaystyle t 2 alpha left tilde x mid mu frac beta nu 1 alpha nu right Bagatovimirnij normalnij z vidomoyu matriceyu kovariaciyi S m vektor serednogo Bagatovimirnij normalnij m 0 S 0 displaystyle boldsymbol boldsymbol mu 0 boldsymbol Sigma 0 S 0 1 n S 1 1 S 0 1 m 0 n S 1 x displaystyle left boldsymbol Sigma 0 1 n boldsymbol Sigma 1 right 1 left boldsymbol Sigma 0 1 boldsymbol mu 0 n boldsymbol Sigma 1 mathbf bar x right S 0 1 n S 1 1 displaystyle left boldsymbol Sigma 0 1 n boldsymbol Sigma 1 right 1 x displaystyle mathbf bar x serednye vibirki mean was estimated from observations with total precision sum of all individual precisions S 0 1 displaystyle boldsymbol Sigma 0 1 and with sample mean m 0 displaystyle boldsymbol mu 0 N x m 0 S 0 S displaystyle mathcal N tilde mathbf x mid boldsymbol mu 0 boldsymbol Sigma 0 boldsymbol Sigma Bagatovimirnij normalnij z vidomoyu matriceyu precizijnosti L m vektor serednogo Bagatovimirnij normalnij m 0 L 0 displaystyle mathbf boldsymbol mu 0 boldsymbol Lambda 0 L 0 n L 1 L 0 m 0 n L x L 0 n L displaystyle left boldsymbol Lambda 0 n boldsymbol Lambda right 1 left boldsymbol Lambda 0 boldsymbol mu 0 n boldsymbol Lambda mathbf bar x right left boldsymbol Lambda 0 n boldsymbol Lambda right x displaystyle mathbf bar x serednye vibirki mean was estimated from observations with total precision sum of all individual precisions L 0 displaystyle boldsymbol Lambda 0 and with sample mean m 0 displaystyle boldsymbol mu 0 N x m 0 L 0 1 L 1 displaystyle mathcal N left tilde mathbf x mid boldsymbol mu 0 boldsymbol Lambda 0 1 boldsymbol Lambda 1 right Bagatovimirnij normalnij z vidomim serednim m S matricya kovariaciyi Inverse Wishart n PS displaystyle nu boldsymbol Psi n n PS i 1 n x i m x i m T displaystyle n nu boldsymbol Psi sum i 1 n mathbf x i boldsymbol mu mathbf x i boldsymbol mu T covariance matrix was estimated from n displaystyle nu observations with sum of pairwise deviation products PS displaystyle boldsymbol Psi t n p 1 x m 1 n p 1 PS displaystyle t nu p 1 left tilde mathbf x boldsymbol mu frac 1 nu p 1 boldsymbol Psi right Bagatovimirnij normalnij z vidomim serednim m L matricya precizijnosti Wishart n V displaystyle nu mathbf V n n V 1 i 1 n x i m x i m T 1 displaystyle n nu left mathbf V 1 sum i 1 n mathbf x i boldsymbol mu mathbf x i boldsymbol mu T right 1 covariance matrix was estimated from n displaystyle nu observations with sum of pairwise deviation products V 1 displaystyle mathbf V 1 t n p 1 x m 1 n p 1 V 1 displaystyle t nu p 1 left tilde mathbf x mid boldsymbol mu frac 1 nu p 1 mathbf V 1 right Bagatovimirnij normalnij m vektor serednogo i S matricya kovariaciyi normal inverse Wishart m 0 k 0 n 0 PS displaystyle boldsymbol mu 0 kappa 0 nu 0 boldsymbol Psi k 0 m 0 n x k 0 n k 0 n n 0 n displaystyle frac kappa 0 boldsymbol mu 0 n mathbf bar x kappa 0 n kappa 0 n nu 0 n PS C k 0 n k 0 n x m 0 x m 0 T displaystyle boldsymbol Psi mathbf C frac kappa 0 n kappa 0 n mathbf bar x boldsymbol mu 0 mathbf bar x boldsymbol mu 0 T x displaystyle mathbf bar x serednye vibirki C i 1 n x i x x i x T displaystyle mathbf C sum i 1 n mathbf x i mathbf bar x mathbf x i mathbf bar x T mean was estimated from k 0 displaystyle kappa 0 observations with sample mean m 0 displaystyle boldsymbol mu 0 covariance matrix was estimated from n 0 displaystyle nu 0 observations with sample mean m 0 displaystyle boldsymbol mu 0 and with sum of pairwise deviation products PS n 0 S 0 displaystyle boldsymbol Psi nu 0 boldsymbol Sigma 0 t n 0 p 1 x m 0 k 0 1 k 0 n 0 p 1 PS displaystyle t nu 0 p 1 left tilde mathbf x boldsymbol mu 0 frac kappa 0 1 kappa 0 nu 0 p 1 boldsymbol Psi right Bagatovimirnij normalnij m vektor serednogo i L matricya precizijnosti normal Wishart m 0 k 0 n 0 V displaystyle boldsymbol mu 0 kappa 0 nu 0 mathbf V k 0 m 0 n x k 0 n k 0 n n 0 n displaystyle frac kappa 0 boldsymbol mu 0 n mathbf bar x kappa 0 n kappa 0 n nu 0 n V 1 C k 0 n k 0 n x m 0 x m 0 T 1 displaystyle left mathbf V 1 mathbf C frac kappa 0 n kappa 0 n mathbf bar x boldsymbol mu 0 mathbf bar x boldsymbol mu 0 T right 1 x displaystyle mathbf bar x serednye vibirki C i 1 n x i x x i x T displaystyle mathbf C sum i 1 n mathbf x i mathbf bar x mathbf x i mathbf bar x T mean was estimated from k 0 displaystyle kappa 0 observations with sample mean m 0 displaystyle boldsymbol mu 0 covariance matrix was estimated from n 0 displaystyle nu 0 observations with sample mean m 0 displaystyle boldsymbol mu 0 and with sum of pairwise deviation products V 1 displaystyle mathbf V 1 t n 0 p 1 x m 0 k 0 1 k 0 n 0 p 1 V 1 displaystyle t nu 0 p 1 left tilde mathbf x mid boldsymbol mu 0 frac kappa 0 1 kappa 0 nu 0 p 1 mathbf V 1 right Rivnomirnij U 0 8 displaystyle U 0 theta Pareto x m k displaystyle x m k max x 1 x n x m k n displaystyle max x 1 ldots x n x mathrm m k n k displaystyle k observations with maximum value x m displaystyle x m Pareto z vidomim minimumom xm k forma Gamma a b displaystyle alpha beta a n b i 1 n ln x i x m displaystyle alpha n beta sum i 1 n ln frac x i x mathrm m a displaystyle alpha observations with sum b displaystyle beta of the order of magnitude of each observation i e the logarithm of the ratio of each observation to the minimum x m displaystyle x m Weibull z vidomim parametrom formi b 8 masshtab Obernenij gamma a b displaystyle a b a n b i 1 n x i b displaystyle a n b sum i 1 n x i beta a displaystyle a observations with sum b displaystyle b of the b th power of each observation Lognormalnij Same as for the normal distribution after applying the natural logarithm to the data for the posterior hyperparameters Please refer to page 21 and 22 to see the details Eksponencijnij l temp Gamma a b displaystyle alpha beta a n b i 1 n x i displaystyle alpha n beta sum i 1 n x i a 1 displaystyle alpha 1 observations that sum to b displaystyle beta Lomax x b a displaystyle operatorname Lomax tilde x mid beta alpha Lomax distribution Gamma z vidomim parametrom a b temp Gamma a 0 b 0 displaystyle alpha 0 beta 0 a 0 n a b 0 i 1 n x i displaystyle alpha 0 n alpha beta 0 sum i 1 n x i a 0 a displaystyle alpha 0 alpha observations with sum b 0 displaystyle beta 0 CG x a a 0 b 0 b x a a 0 1 b 0 displaystyle operatorname CG tilde mathbf x mid alpha alpha 0 beta 0 operatorname beta tilde mathbf x alpha alpha 0 1 beta 0 Obernenij gamma z vidomim parametrom formi a b obernenij masshtab Gamma a 0 b 0 displaystyle alpha 0 beta 0 a 0 n a b 0 i 1 n 1 x i displaystyle alpha 0 n alpha beta 0 sum i 1 n frac 1 x i a 0 a displaystyle alpha 0 alpha observations with sum b 0 displaystyle beta 0 Gamma z vidomim parametrom tempu b a forma a a 1 b a c G a b displaystyle propto frac a alpha 1 beta alpha c Gamma alpha b a b c displaystyle a b c a i 1 n x i b n c n displaystyle a prod i 1 n x i b n c n b displaystyle b or c displaystyle c observations b displaystyle b for estimating a displaystyle alpha c displaystyle c for estimating b displaystyle beta with product a displaystyle a Gamma a forma b obernenij masshtab p a 1 e b q G a r b a s displaystyle propto frac p alpha 1 e beta q Gamma alpha r beta alpha s p q r s displaystyle p q r s p i 1 n x i q i 1 n x i r n s n displaystyle p prod i 1 n x i q sum i 1 n x i r n s n a displaystyle alpha was estimated from r displaystyle r observations with product p displaystyle p b displaystyle beta was estimated from s displaystyle s observations with sum q displaystyle q Beta a b G a b k p a q b G a k G b k displaystyle propto frac Gamma alpha beta k p alpha q beta Gamma alpha k Gamma beta k p q k displaystyle p q k p i 1 n x i q i 1 n 1 x i k n displaystyle p prod i 1 n x i q prod i 1 n 1 x i k n a displaystyle alpha and b displaystyle beta were estimated from k displaystyle k observations with product p displaystyle p and product of the complements q displaystyle q Div takozhBeta binomialnij rozpodilPrimitkiPoznachayetsya timi zh simvolami sho j apriorni giperparametri z apostrofami Napriklad a displaystyle alpha poznachayetsya a displaystyle alpha Ce posteriornij prognoznij rozpodil novoyi tochki x displaystyle tilde x zumovlenij sposterezhenimi tochkami nayavnoyu informaciyeyu sho mayut parpmetri Zminni z apostrofami poznachayut posteriorni znachennya parametriv Tochna interpretaciya parametriv beta rozpodilu z tochki zoru kilkosti uspihiv i nevdach zalezhit vid togo yaka funkciya vikoristovuyetsya dlya otrimannya tochkovoyi ocinki z rozpodilu Matspodivannya beta rozpodilu obchislyuyetsya yak a a b displaystyle frac alpha alpha beta sho vidpovidaye a displaystyle alpha uspiham i b displaystyle beta nevdacham todi yak jogo moda dorivnyuye a 1 a b 2 displaystyle frac alpha 1 alpha beta 2 sho vidpovidaye a 1 displaystyle alpha 1 uspiham i b 1 displaystyle beta 1 nevdacham U Bayesivskih obchislennyah tochkovih ocinok viddayut perevagu posteriornomu matspodivannyu pered posteriornoyu modoyu gruntuyuchis na kvadratichnij funkciyi vtrat do togo zh vikoristannya a displaystyle alpha i b displaystyle beta matematichno zruchnishe todi yak perevagoyu vikoristannya a 1 displaystyle alpha 1 i b 1 displaystyle beta 1 ye te sho rivnomirnij aprior B e t a 1 1 displaystyle rm Beta 1 1 vidpovidaye vipadku koli mayemo 0 uspihiv i 0 nevdach Analogichni mirkuvannya mayut misce pri vikoristanni rozpodilu Dirihle b temp zmini chi obernenij do parametra masshtabu V parametrizaciyi Gamma rozpodil 8 1 b i k a Ce posteriornij prognoznij rozpodil novoyi tochki x displaystyle tilde x zumovlenij sposterezhenimi tochkami nayavnoyu informaciyeyu sho mayut parpmetri Zminni z apostrofami poznachayut posteriorni znachennya parametriv N displaystyle mathcal N and t n displaystyle t n poznachayut normalnij rozpodil i t rozpodil Styudenta abo zh bagatovimirnij normalnij rozpodil i u bagatoviminih vipadkah vidpovidno Dzherelaand Applied Statistical Decision Theory Division of Research Graduate School of Business Administration Harvard University 1961 Jeff Miller et al Earliest Known Uses of Some of the Words of Mathematics 4 bereznya 2009 u Wayback Machine conjugate prior distributions 1 travnya 2011 u Wayback Machine Electronic document revision of November 13 2005 retrieved December 2 2005 For a catalog see Carlin John B Stern Hal S Rubin Donald B 2003 Bayesian Data Analysis vid 2nd CRC Press ISBN 1 58488 388 X Daniel Fink May 1997 PDF Arhiv originalu PDF za 4 travnya 2021 Procitovano 16 sichnya 2022 angl Murphy Kevin P 2007 PDF arhiv originalu PDF za 18 sichnya 2022 procitovano 18 sichnya 2022