Ця стаття містить , але походження тверджень у ній через практично повну відсутність . (червень 2015) |
У теорії оцінювання та теорії рішень ба́єсова оці́нка або ба́єсова дія є оцінкою або [en], що мінімізує апостеріорне математичне сподівання функції втрат (тобто, апостеріо́рні очі́кувані втра́ти). Рівносильно, вона максимізує апостеріорне математичне сподівання функції корисності. Альтернативним способом формулювання оцінки в баєсовій статистиці є оцінка апостеріорного максимуму.
Визначення
Припустімо, нам відомо, що невідомий параметр θ має апріорний розподіл . Нехай буде оцінкою θ (на підставі первних вимірювань x), та нехай буде функцією втрат, наприклад, квадратичною похибкою. Ба́єсів ри́зик визначають як , де береться математичне сподівання від розподілу ймовірності : це визначає функцію ризику як функцію від . Про оцінку кажуть, що вона є баєсовою оцінкою, якщо вона мінімізує баєсів ризик серед усіх оцінок. Рівноцінно, оцінка, що мінімізує апостеріорне математичне сподівання втрат для кожного x також мінімізує й баєсів ризик, а отже є баєсовою оцінкою.
Якщо апріорне є некоректним, то оцінка, що мінімізує апостеріорне математичне сподівання втрат для кожного x, називається узага́льненою ба́єсовою оці́нкою.
Приклади
Оцінка мінімальної середньоквадратичної похибки
Детальніші відомості з цієї теми ви можете знайти в статті [en].
Найпоширенішою функцією ризику, що застосовується для баєсової оцінки, є середньоквадратична похибка (СКП, англ. mean square error, MSE), що також називають квадратичним ризиком похибки. СКП визначається як
де математичне сподівання береться над спільним розподілом та .
Апостеріорне середнє
При використанні СКП як ризику баєсова оцінка невідомого параметру є просто середнім значенням апостеріорного розподілу,
Це відомо як оцінка мінімальної середньоквадратичної похибки (МСКП, англ. minimum mean square error, MMSE). Баєсів ризик у цьому випадку є апостеріорною дисперсією.
Баєсові оцінки для спряжених апріорних
Детальніші відомості з цієї теми ви можете знайти в статті Спряжений апріорний розподіл.
Якщо немає неусувної підстави віддавати перевагу одному апріорному розподілові перед іншим, іноді для спрощення обирають спряжений апріорний розподіл. Спряжений апріорний розподіл визначається як апріорний розподіл, що належить до [en], для якого результатний апостеріорний розподіл також належить до цього ж сімейства. Це є важливою властивістю, оскільки баєсову оцінку, так само як і її статистичні властивості (дисперсію, довірчий інтервал тощо), може бути виведено з апостеріорного розподілу.
Спряжені апріорні є особливо зручними для послідовного оцінювання, коли апостеріорне поточного вимірювання використовується як апріорне в наступному вимірюванні. У послідовному оцінюванні, якщо не використовуються спряжені апріорні, апостеріорний розподіл типово стає складнішим із кожним доданим вимірюванням, і баєсову оцінку зазвичай неможливо обчислювати без удавання до чисельних методів.
Нижче наведено деякі приклади спряжених апріорних.
- Якщо x|θ є нормальним, x|θ ~ N(θ,σ2) та апріорне є нормальним, θ ~ N(μ,τ2), тоді апостеріорне також є нормальним, а баєсова оцінка при СКП задається як
- Якщо x1,…,xn є незалежними однаково розподіленими пуассонівськими випадковими змінними xi|θ ~ P(θ), та апріорне є гамма-розподіленим θ ~ G(a, b), тоді апостеріорне є також гамма-розподіленим, а баєсова оцінка при СКП задається як
- Якщо x1,…,xn є незалежними однаково розподіленими неперервними рівномірними xi|θ~U(0,θ), а апріорне є паретівським θ~Pa(θ0,a), тоді апостеріорне також має розподіл Парето, а баєсова оцінка при СКП задається як
Альтернативні функції ризику
Функції ризику обираються в залежності від способу вимірювання відстані між оцінкою та невідомим параметром. Найпоширенішою функцією ризику у вжитку є СКП, головно завдяки її простоті. Проте іноді використовуються й альтернативні функції ризику. Далі наведено декілька прикладів таких альтернатив. Ми позначаємо функцію апостеріорного узагальненого розподілу через .
Апостеріорна медіана та інші квантилі
- «Лінійна» функція втрат, з , що видає як баєсову оцінку :
- Інша «лінійна» функція втрат, що призначає різну «вагу» для пере- та недооцінки. Вона видає квантиль апостеріорного розподілу, і є узагальненням попередньої функції втрат:
Апостеріорна мода
- Наступна функція втрат є хитрішою: вона видає або апостеріорну моду, або близьку до неї точку, в залежності від кривизни та властивостей апостеріорного розподілу. Малі значення параметру рекомендуються для того, щоби використовувати цю моду як наближення ():
Може бути задумано й інші функції втрат, незважаючи на те, що середньоквадратична похибка є найширше вживаною й перевіреною.
Узагальнені баєсові оцінки
Детальніші відомості з цієї теми ви можете знайти в статті [en].
Апріорний розподіл досі вважався правильним розподілом ймовірності, в тому сенсі, що
Проте іноді це може бути обмежувальною вимогою. Наприклад, не існує розподілу (що покриває множину R усіх дійсних чисел), для якого будь-яке дійсне число є однаково ймовірним. Ще, у певному сенсі, такий «розподіл» виглядає як природний вибір неінформативного апріорного, тобто такий апріорний розподіл, що не віддає переваги жодному конкретному значенню невідомого параметра. Все ще можна визначити функцію , але вона вже не буде коректним апріорним розподілом ймовірності, оскільки вона має нескінченну масу,
Такі міри , що не є розподілами ймовірності, називаються некоректними апріорними.
Використання некоректного апріорного означає, що баєсів ризик є невизначеним (оскільки апріорне не є розподілом ймовірності, й ми не можемо взяти його математичне сподівання). Як наслідок, вже немає сенсу говорити про баєсову оцінку, що мінімізує баєсів ризик. Тим не менш, у багатьох випадках можна визначити апостеріорний розподіл
Це є визначенням, але не застосуванням теореми Баєса, оскільки теорему Баєса можна застосовувати лише якщо всі розподіли є коректними. Проте для результатного «апостеріорного» не є незвичним бути чинним розподілом ймовірності. В такому випадку апостеріорні очікувані втрати
є добре визначеними та скінченними. Нагадаймо, що для коректного апріорного баєсова оцінка мінімізує апостеріорні очікувані втрати. Коли апріорне є некоректним, оцінка, що мінімізує апостеріорні очікувані втрати, називається узага́льненою ба́єсовою оці́нкою.
Приклад
Типовим прикладом є оцінювання коефіцієнту зсуву з функцією втрат типу . Тут є коефіцієнтом зсуву, тобто .
В такому випадку є звичним застосовувати некоректне апріорне , особливо якщо ніякої іншої суб'єктивнішої інформації немає в наявності. Це дає
таким чином, апостеріорні очікувані втрати дорівнюють
Узагальнена баєсова оцінка є значенням , що мінімізує цей вираз для заданого . Це є еквівалентним мінімізації
- для заданого (1)
В цьому випадку може бути показано, що узагальнений баєсів оцінювач може мати вигляд , для деякої сталої . Щоби побачити це, нехай буде значенням, що мінімізує (1), коли . Тоді, маючи інше значення , ми мусимо мінімізувати
- (2)
Це є ідентичним до (1), крім того, що було замінено на . Отже, вираз, що мінімізується, задається як , тому оптимальна оцінка має вигляд
Емпіричні баєсові оцінки
Детальніші відомості з цієї теми ви можете знайти в статті [en].
Баєсова оцінка, виведена [en], називається емпіри́чною ба́єсовою оці́нкою. Емпіричний баєсів метод дозволяє при побудові баєсової оцінки використовувати додаткові емпіричні дані зі спостережень пов'язаних параметрів. Це робиться із припущення, що оцінювані параметри отримуються зі спільного апріорного. Наприклад, якщо виконуються незалежні спостереження різних параметрів, то продуктивність оцінки певного параметру іноді може бути покращено за рахунок використання даних з інших спостережень.
Існують [en] та [en] підходи до емпіричної баєсової оцінки. Параметричному емпіричному Баєсові зазвичай віддається перевага, оскільки він є застосовнішим та точнішим на малих об'ємах даних.
Приклад
Далі наведено простий приклад параметричної емпіричної баєсової оцінки. При заданих спостереженнях , що мають умовний розподіл , потрібно оцінити на базі . Припустімо, що мають спільне апріорне , що залежить від невідомих параметрів. Наприклад, нехай є нормальним розподілом із невідомим середнім значенням та дисперсією Тоді ми можемо використовувати минулі спостереження для визначення середнього значення та дисперсії наступним чином.
Спочатку ми оцінюємо середнє значення та дисперсію відособленого розподілу за допомогою підходу максимальної правдоподібності:
Далі ми використовуємо відношення
де та є моментами умовного розподілу , що вважаються відомими. Зокрема, припустімо, що та ; тоді ми отримуємо
Нарешті, ми отримуємо оцінені моменти апріорного,
Наприклад, якщо , і якщо ми розглядаємо нормальне апріорне (що є спряженим апріорним у даному випадку), ми доходимо висновку, що , з чого може бути обчислено баєсову оцінку на базі .
Властивості
Прийнятність
Детальніші відомості з цієї теми ви можете знайти в статті [en].
Правила Баєса, що мають скінченний баєсів ризик, зазвичай є [en]. Далі наведено деякі конкретні приклади теорем прийнятності.
- Якщо баєсове правило є унікальним, то воно є прийнятним. Наприклад, як зазначено вище, за середньоквадратичної похибки (СКП) правило Баєса є унікальним, а відтак і прийнятним.
- Якщо θ належить до дискретної множини, то всі правила Баєса є прийнятними.
- Якщо θ належить до неперервної (не дискретної) множини, і якщо функція ризику R(θ,δ) є неперервною за θ для будь-якого δ, то всі правила Баєса є прийнятними.
На противагу до цього, узагальнені правила Баєса часто мають невизначений баєсів ризик у випадку некоректних апріорних. Ці правила часто є неприйнятними, і перевірка їхньої прийнятності може бути складною. Наприклад, узагальнена баєсова оцінка коефіцієнту зсуву θ на базі ґаусових вибірок (описаних у розділі Узагальнені баєсові оцінки вище) є неприйнятною для ; це є відомим як [en].
Асимптотична ефективність
Нехай θ буде невідомою випадковою змінною, та припустімо, що є незалежними однаково розподіленими пробами з густиною . Нехай буде послідовністю баєсових оцінок θ на базі збільшуваного числа вимірювань. Нас цікавить аналіз асимптотичної продуктивності цієї послідовності оцінок, тобто продуктивність для великих n.
Для цього прийнято вважати θ детермінованим параметром, чиїм справжнім значенням є . За особливих умов, для великих вибірок (великих значень n), апостеріорна густина θ є приблизно нормальною. Іншими словами, для великих n вплив апріорної ймовірності на апостеріорну є незначним. Більше того, якщо δ є баєсовою оцінкою за ризику СКП, то вона є асимптотично незміщеною та збігається за розподілом до нормального розподілу:
де I(θ0) є інформацією за Фішером θ0. Звідси випливає, що баєсова оцінка δn за СКП є [en].
Іншою оцінкою, що є асимптотично нормальною та ефективною, є оцінка максимальної правдоподібності (ОМП, англ. maximum likelihood estimator, MLE). Відношення між максимальною правдоподібністю та баєсовими оцінками можна показати на наступному простому прикладі.
Розгляньмо оцінку θ на базі біноміальної вибірки x~b(θ,n), де θ позначає ймовірність успіху. За припущення, що θ розподілене згідно спряженого апріорного, що в даному випадку є бета-розподілом B(a,b), відомо, що апріорним розподілом є B(a+x, b+n-x). Отже, баєсовою оцінкою за СКП є
ОМП у даному випадку є x/n, і тому ми отримуємо
Крайнє рівняння означає, що для n → ∞ баєсова оцінка (в описаній задачі) є близькою до ОМП.
З іншого боку, коли n є малим, апріорна інформація залишається доречною для задачі ухвалення рішення, і впливає на оцінку. Щоби побачити відносну вагу апріорної інформації, припустімо, що a=b; в такому випадку кожне вимірювання привносить 1 біт інформації; формула вище показує, що апостеріорна інформація має таку саму вагу, як a+b бітів нової інформації. На практиці про дрібні деталі апріорного розподілу часто відомо дуже мало; зокрема, нема резону припускати, що він збігається з B(a,b) точно. В такому разі однією з можливих інтерпретацій цього обчислення є: «існує не патологічний апріорний розподіл із середнім значенням 0.5 та стандартним відхиленням d, що дає вагу апріорної інформації, рівну 1/(4d2)-1 бітам нової інформації».
Іншим прикладом того ж явища є випадок, коли апріорна оцінка та вимірювання мають нормальні розподіли. Якщо апріорне відцентровано на B з відхиленням Σ, а вимірювання відцентровано на b із відхиленням σ, то апостеріорне відцентровано на , з вагами у цій зваженій сумі, що є α=σ², β=Σ². Більше того, квадратичним апостеріорним відхиленням є Σ²+σ². Іншими словами, апріорне поєднується з вимірюванням в точності таким же чином, як ніби воно є додатковим вимірюванням, що треба врахувати.
Наприклад, якщо Σ=σ/2, то відхилення поєднаних разом 4 вимірювань відповідає відхиленню апріорного (за припущення, що похибки вимірювань є незалежними). А ваги α,β у формулі апостеріорного відповідають такому: вага апріорного складає 4 ваги вимірювання. Поєднання цього апріорного з n вимірюваннями із середнім v призводить до апостеріорного, відцентрованого у ; зокрема, це апріорне відіграє таку ж роль, як і 4 вимірювання, зроблені завчасно. У загальному випадку апріорне має вагу (σ/Σ)² вимірювань.
Порівняйте це із прикладом біноміального розподілу: там апріорне має вагу (σ/Σ)²−1 вимірювань. Видно, що точна вага дійсно залежить від деталей розподілу, але при σ≫Σ відмінність стає малою.
Практичний приклад баєсових оцінок
Internet Movie Database використовує формулу для обчислення та порівняння рейтингів фільмів її користувачами, включно з їхніми 250 найрейтинговішими фільмами, що претендує на надання «справжньої баєсової оцінки». Початково для обчислення зваженого середнього балу найкращих 250 фільмів використовувалася наступна формула, хоча її відтоді було змінено:
де:
- = зважений рейтинг
- = зважений рейтинг фільму як число від 1 до 10 (середній) = (англ. Rating)
- = кількість голосів за фільм = (англ. votes)
- = вага, надана апріорній оцінці (що базується на розподілі середніх рейтингів серед усього фонду фільмів)
- = середній голос серед усього фонду (наразі 7.0)
Зауважте, що W є просто зваженим арифметичним середнім R та C з вектором ваг (v, m). Із переважанням кількості вимірів над m довіра до середнього рейтингу переважає довіру до апріорного знання, і зважений баєсів рейтинг (W) наближається до простого середнього (R). Що ближчим є v (кількість оцінок фільму) до нуля, то ближчим стає W до C, де W є зваженим рейтингом, а C є середнім рейтингом по всіх фільмах. Отже, простішими термінами, фільми із дуже нечисленними оцінками/голосами матимуть рейтинг, зважений в бік середнього по всіх фільмах, в той час як фільми з багатьма оцінками/голосами матимуть рейтинг, зважений в бік їхніх середніх оцінок.
Підхід IMDb гарантує, що фільм із лише декількома сотнями оцінок, всі по 10, не займе місце вище «Хрещеного батька», наприклад, із середнім 9.2 з понад 500 000 оцінок.
Див. також
- [en]
- Рекурсивне баєсове оцінювання
- [en]
- Спряжений апріорний розподіл
- [en]
Примітки
- Lehmann та Casella, 1998, теорема 4.1.1.
- Lehmann та Casella, 1998, визначення 4.2.9.
- Jaynes, E.T. (2007). Probability theory : the logic of science (вид. 5. print.). Cambridge [u.a.]: Cambridge Univ. Press. с. 172. ISBN . (англ.)
- Berger, 1980, розділ 4.5.
- Lehmann та Casella, 1998, теорема 5.2.4.
- Lehmann та Casella, 1998, розділ 6.8.
- IMDb Top 250 [ 2012-06-01 у Wayback Machine.] (англ.)
Джерела
Посилання
- Bayesian estimation on cnx.org [ 17 лютого 2012 у Wayback Machine.] (англ.)
- Hazewinkel, Michiel, ред. (2001), Bayesian estimator, Математична енциклопедія, , ISBN (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya mistit perelik posilan ale pohodzhennya tverdzhen u nij zalishayetsya nezrozumilim cherez praktichno povnu vidsutnist vnutrishnotekstovih dzherel vinosok Bud laska dopomozhit polipshiti cyu stattyu peretvorivshi dzherela z pereliku posilan na dzherela vinoski u samomu teksti statti cherven 2015 U teoriyi ocinyuvannya ta teoriyi rishen ba yesova oci nka abo ba yesova diya ye ocinkoyu abo en sho minimizuye aposteriorne matematichne spodivannya funkciyi vtrat tobto aposterio rni ochi kuvani vtra ti Rivnosilno vona maksimizuye aposteriorne matematichne spodivannya funkciyi korisnosti Alternativnim sposobom formulyuvannya ocinki v bayesovij statistici ye ocinka aposteriornogo maksimumu ViznachennyaPripustimo nam vidomo sho nevidomij parametr 8 maye apriornij rozpodil p displaystyle pi Nehaj 8 8 x displaystyle widehat theta widehat theta x bude ocinkoyu 8 na pidstavi pervnih vimiryuvan x ta nehaj L 8 8 displaystyle L theta widehat theta bude funkciyeyu vtrat napriklad kvadratichnoyu pohibkoyu Ba yesiv ri zik 8 displaystyle widehat theta viznachayut yak E p L 8 8 displaystyle E pi L theta widehat theta de beretsya matematichne spodivannya vid rozpodilu jmovirnosti 8 displaystyle theta ce viznachaye funkciyu riziku yak funkciyu vid 8 displaystyle widehat theta Pro ocinku 8 displaystyle widehat theta kazhut sho vona ye bayesovoyu ocinkoyu yaksho vona minimizuye bayesiv rizik sered usih ocinok Rivnocinno ocinka sho minimizuye aposteriorne matematichne spodivannya vtrat E L 8 8 x displaystyle E L theta widehat theta x dlya kozhnogo x takozh minimizuye j bayesiv rizik a otzhe ye bayesovoyu ocinkoyu Yaksho apriorne ye nekorektnim to ocinka sho minimizuye aposteriorne matematichne spodivannya vtrat dlya kozhnogo x nazivayetsya uzaga lnenoyu ba yesovoyu oci nkoyu PrikladiOcinka minimalnoyi serednokvadratichnoyi pohibki Detalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en Najposhirenishoyu funkciyeyu riziku sho zastosovuyetsya dlya bayesovoyi ocinki ye serednokvadratichna pohibka SKP angl mean square error MSE sho takozh nazivayut kvadratichnim rizikom pohibki SKP viznachayetsya yak M S E E 8 x 8 2 displaystyle mathrm MSE E left widehat theta x theta 2 right de matematichne spodivannya beretsya nad spilnim rozpodilom 8 displaystyle theta ta x displaystyle x Aposteriorne serednye Pri vikoristanni SKP yak riziku bayesova ocinka nevidomogo parametru ye prosto serednim znachennyam aposteriornogo rozpodilu 8 x E 8 x 8 p 8 x d 8 displaystyle widehat theta x E theta x int theta p theta x d theta Ce vidomo yak ocinka minimalnoyi serednokvadratichnoyi pohibki MSKP angl minimum mean square error MMSE Bayesiv rizik u comu vipadku ye aposteriornoyu dispersiyeyu Bayesovi ocinki dlya spryazhenih apriornih Detalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti Spryazhenij apriornij rozpodil Yaksho nemaye neusuvnoyi pidstavi viddavati perevagu odnomu apriornomu rozpodilovi pered inshim inodi dlya sproshennya obirayut spryazhenij apriornij rozpodil Spryazhenij apriornij rozpodil viznachayetsya yak apriornij rozpodil sho nalezhit do en dlya yakogo rezultatnij aposteriornij rozpodil takozh nalezhit do cogo zh simejstva Ce ye vazhlivoyu vlastivistyu oskilki bayesovu ocinku tak samo yak i yiyi statistichni vlastivosti dispersiyu dovirchij interval tosho mozhe buti vivedeno z aposteriornogo rozpodilu Spryazheni apriorni ye osoblivo zruchnimi dlya poslidovnogo ocinyuvannya koli aposteriorne potochnogo vimiryuvannya vikoristovuyetsya yak apriorne v nastupnomu vimiryuvanni U poslidovnomu ocinyuvanni yaksho ne vikoristovuyutsya spryazheni apriorni aposteriornij rozpodil tipovo staye skladnishim iz kozhnim dodanim vimiryuvannyam i bayesovu ocinku zazvichaj nemozhlivo obchislyuvati bez udavannya do chiselnih metodiv Nizhche navedeno deyaki prikladi spryazhenih apriornih Yaksho x 8 ye normalnim x 8 N 8 s2 ta apriorne ye normalnim 8 N m t2 todi aposteriorne takozh ye normalnim a bayesova ocinka pri SKP zadayetsya yak 8 x s 2 s 2 t 2 m t 2 s 2 t 2 x displaystyle widehat theta x frac sigma 2 sigma 2 tau 2 mu frac tau 2 sigma 2 tau 2 x Yaksho x1 xn ye nezalezhnimi odnakovo rozpodilenimi puassonivskimi vipadkovimi zminnimi xi 8 P 8 ta apriorne ye gamma rozpodilenim 8 G a b todi aposteriorne ye takozh gamma rozpodilenim a bayesova ocinka pri SKP zadayetsya yak 8 X n X a n 1 b displaystyle widehat theta X frac n overline X a n frac 1 b Yaksho x1 xn ye nezalezhnimi odnakovo rozpodilenimi neperervnimi rivnomirnimi xi 8 U 0 8 a apriorne ye paretivskim 8 Pa 80 a todi aposteriorne takozh maye rozpodil Pareto a bayesova ocinka pri SKP zadayetsya yak 8 X a n max 8 0 x 1 x n a n 1 displaystyle widehat theta X frac a n max theta 0 x 1 x n a n 1 Alternativni funkciyi riziku Funkciyi riziku obirayutsya v zalezhnosti vid sposobu vimiryuvannya vidstani mizh ocinkoyu ta nevidomim parametrom Najposhirenishoyu funkciyeyu riziku u vzhitku ye SKP golovno zavdyaki yiyi prostoti Prote inodi vikoristovuyutsya j alternativni funkciyi riziku Dali navedeno dekilka prikladiv takih alternativ Mi poznachayemo funkciyu aposteriornogo uzagalnenogo rozpodilu cherez F displaystyle F Aposteriorna mediana ta inshi kvantili Linijna funkciya vtrat z a gt 0 displaystyle a gt 0 sho vidaye yak bayesovu ocinku L 8 8 a 8 8 displaystyle L theta widehat theta a theta widehat theta F 8 x X 1 2 displaystyle F widehat theta x X tfrac 1 2 Insha linijna funkciya vtrat sho priznachaye riznu vagu a b gt 0 displaystyle a b gt 0 dlya pere ta nedoocinki Vona vidaye kvantil aposteriornogo rozpodilu i ye uzagalnennyam poperednoyi funkciyi vtrat L 8 8 a 8 8 for 8 8 0 b 8 8 for 8 8 lt 0 displaystyle L theta widehat theta begin cases a theta widehat theta amp mbox for theta widehat theta geq 0 b theta widehat theta amp mbox for theta widehat theta lt 0 end cases F 8 x X a a b displaystyle F widehat theta x X frac a a b Aposteriorna moda Nastupna funkciya vtrat ye hitrishoyu vona vidaye abo aposteriornu modu abo blizku do neyi tochku v zalezhnosti vid krivizni ta vlastivostej aposteriornogo rozpodilu Mali znachennya parametru K gt 0 displaystyle K gt 0 rekomenduyutsya dlya togo shobi vikoristovuvati cyu modu yak nablizhennya L gt 0 displaystyle L gt 0 L 8 8 0 for 8 8 lt K L for 8 8 K displaystyle L theta widehat theta begin cases 0 amp mbox for theta widehat theta lt K L amp mbox for theta widehat theta geq K end cases Mozhe buti zadumano j inshi funkciyi vtrat nezvazhayuchi na te sho serednokvadratichna pohibka ye najshirshe vzhivanoyu j perevirenoyu Uzagalneni bayesovi ocinkiDetalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en Apriornij rozpodil p displaystyle p dosi vvazhavsya pravilnim rozpodilom jmovirnosti v tomu sensi sho p 8 d 8 1 displaystyle int p theta d theta 1 Prote inodi ce mozhe buti obmezhuvalnoyu vimogoyu Napriklad ne isnuye rozpodilu sho pokrivaye mnozhinu R usih dijsnih chisel dlya yakogo bud yake dijsne chislo ye odnakovo jmovirnim She u pevnomu sensi takij rozpodil viglyadaye yak prirodnij vibir neinformativnogo apriornogo tobto takij apriornij rozpodil sho ne viddaye perevagi zhodnomu konkretnomu znachennyu nevidomogo parametra Vse she mozhna viznachiti funkciyu p 8 1 displaystyle p theta 1 ale vona vzhe ne bude korektnim apriornim rozpodilom jmovirnosti oskilki vona maye neskinchennu masu p 8 d 8 displaystyle int p theta d theta infty Taki miri p 8 displaystyle p theta sho ne ye rozpodilami jmovirnosti nazivayutsya nekorektnimi apriornimi Vikoristannya nekorektnogo apriornogo oznachaye sho bayesiv rizik ye neviznachenim oskilki apriorne ne ye rozpodilom jmovirnosti j mi ne mozhemo vzyati jogo matematichne spodivannya Yak naslidok vzhe nemaye sensu govoriti pro bayesovu ocinku sho minimizuye bayesiv rizik Tim ne mensh u bagatoh vipadkah mozhna viznachiti aposteriornij rozpodil p 8 x p x 8 p 8 p x 8 p 8 d 8 displaystyle p theta x frac p x theta p theta int p x theta p theta d theta Ce ye viznachennyam ale ne zastosuvannyam teoremi Bayesa oskilki teoremu Bayesa mozhna zastosovuvati lishe yaksho vsi rozpodili ye korektnimi Prote dlya rezultatnogo aposteriornogo ne ye nezvichnim buti chinnim rozpodilom jmovirnosti V takomu vipadku aposteriorni ochikuvani vtrati L 8 a p 8 x d 8 displaystyle int L theta a p theta x d theta ye dobre viznachenimi ta skinchennimi Nagadajmo sho dlya korektnogo apriornogo bayesova ocinka minimizuye aposteriorni ochikuvani vtrati Koli apriorne ye nekorektnim ocinka sho minimizuye aposteriorni ochikuvani vtrati nazivayetsya uzaga lnenoyu ba yesovoyu oci nkoyu Priklad Tipovim prikladom ye ocinyuvannya koeficiyentu zsuvu z funkciyeyu vtrat tipu L a 8 displaystyle L a theta Tut 8 displaystyle theta ye koeficiyentom zsuvu tobto p x 8 f x 8 displaystyle p x theta f x theta V takomu vipadku ye zvichnim zastosovuvati nekorektne apriorne p 8 1 displaystyle p theta 1 osoblivo yaksho niyakoyi inshoyi sub yektivnishoyi informaciyi nemaye v nayavnosti Ce daye p 8 x p x 8 p 8 p x f x 8 p x displaystyle p theta x frac p x theta p theta p x frac f x theta p x takim chinom aposteriorni ochikuvani vtrati dorivnyuyut E L a 8 x L a 8 p 8 x d 8 1 p x L a 8 f x 8 d 8 displaystyle E L a theta x int L a theta p theta x d theta frac 1 p x int L a theta f x theta d theta Uzagalnena bayesova ocinka ye znachennyam a x displaystyle a x sho minimizuye cej viraz dlya zadanogo x displaystyle x Ce ye ekvivalentnim minimizaciyi L a 8 f x 8 d 8 displaystyle int L a theta f x theta d theta dlya zadanogo x displaystyle x 1 V comu vipadku mozhe buti pokazano sho uzagalnenij bayesiv ocinyuvach mozhe mati viglyad x a 0 displaystyle x a 0 dlya deyakoyi staloyi a 0 displaystyle a 0 Shobi pobachiti ce nehaj a 0 displaystyle a 0 bude znachennyam sho minimizuye 1 koli x 0 displaystyle x 0 Todi mayuchi inshe znachennya x 1 displaystyle x 1 mi musimo minimizuvati L a 8 f x 1 8 d 8 L a x 1 8 f 8 d 8 displaystyle int L a theta f x 1 theta d theta int L a x 1 theta f theta d theta 2 Ce ye identichnim do 1 krim togo sho a displaystyle a bulo zamineno na a x 1 displaystyle a x 1 Otzhe viraz sho minimizuyetsya zadayetsya yak a x 1 a 0 displaystyle a x 1 a 0 tomu optimalna ocinka maye viglyad a x a 0 x displaystyle a x a 0 x Empirichni bayesovi ocinkiDetalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en Bayesova ocinka vivedena en nazivayetsya empiri chnoyu ba yesovoyu oci nkoyu Empirichnij bayesiv metod dozvolyaye pri pobudovi bayesovoyi ocinki vikoristovuvati dodatkovi empirichni dani zi sposterezhen pov yazanih parametriv Ce robitsya iz pripushennya sho ocinyuvani parametri otrimuyutsya zi spilnogo apriornogo Napriklad yaksho vikonuyutsya nezalezhni sposterezhennya riznih parametriv to produktivnist ocinki pevnogo parametru inodi mozhe buti pokrasheno za rahunok vikoristannya danih z inshih sposterezhen Isnuyut en ta en pidhodi do empirichnoyi bayesovoyi ocinki Parametrichnomu empirichnomu Bayesovi zazvichaj viddayetsya perevaga oskilki vin ye zastosovnishim ta tochnishim na malih ob yemah danih Priklad Dali navedeno prostij priklad parametrichnoyi empirichnoyi bayesovoyi ocinki Pri zadanih sposterezhennyah x 1 x n displaystyle x 1 ldots x n sho mayut umovnij rozpodil f x i 8 i displaystyle f x i theta i potribno ociniti 8 n 1 displaystyle theta n 1 na bazi x n 1 displaystyle x n 1 Pripustimo sho 8 i displaystyle theta i mayut spilne apriorne p displaystyle pi sho zalezhit vid nevidomih parametriv Napriklad nehaj p displaystyle pi ye normalnim rozpodilom iz nevidomim serednim znachennyam m p displaystyle mu pi ta dispersiyeyu s p displaystyle sigma pi Todi mi mozhemo vikoristovuvati minuli sposterezhennya dlya viznachennya serednogo znachennya ta dispersiyi p displaystyle pi nastupnim chinom Spochatku mi ocinyuyemo serednye znachennya m m displaystyle mu m ta dispersiyu s m displaystyle sigma m vidosoblenogo rozpodilu x 1 x n displaystyle x 1 ldots x n za dopomogoyu pidhodu maksimalnoyi pravdopodibnosti m m 1 n x i displaystyle widehat mu m frac 1 n sum x i s m 2 1 n x i m m 2 displaystyle widehat sigma m 2 frac 1 n sum x i widehat mu m 2 Dali mi vikoristovuyemo vidnoshennya m m E p m f 8 displaystyle mu m E pi mu f theta s m 2 E p s f 2 8 E p m f 8 m m displaystyle sigma m 2 E pi sigma f 2 theta E pi mu f theta mu m de m f 8 displaystyle mu f theta ta s f 8 displaystyle sigma f theta ye momentami umovnogo rozpodilu f x i 8 i displaystyle f x i theta i sho vvazhayutsya vidomimi Zokrema pripustimo sho m f 8 8 displaystyle mu f theta theta ta s f 2 8 K displaystyle sigma f 2 theta K todi mi otrimuyemo m p m m displaystyle mu pi mu m s p 2 s m 2 s f 2 s m 2 K displaystyle sigma pi 2 sigma m 2 sigma f 2 sigma m 2 K Nareshti mi otrimuyemo ocineni momenti apriornogo m p m m displaystyle widehat mu pi widehat mu m s p 2 s m 2 K displaystyle widehat sigma pi 2 widehat sigma m 2 K Napriklad yaksho x i 8 i N 8 i 1 displaystyle x i theta i sim N theta i 1 i yaksho mi rozglyadayemo normalne apriorne sho ye spryazhenim apriornim u danomu vipadku mi dohodimo visnovku sho 8 n 1 N m p s p 2 displaystyle theta n 1 sim N widehat mu pi widehat sigma pi 2 z chogo mozhe buti obchisleno bayesovu ocinku 8 n 1 displaystyle theta n 1 na bazi x n 1 displaystyle x n 1 VlastivostiPrijnyatnist Detalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en Pravila Bayesa sho mayut skinchennij bayesiv rizik zazvichaj ye en Dali navedeno deyaki konkretni prikladi teorem prijnyatnosti Yaksho bayesove pravilo ye unikalnim to vono ye prijnyatnim Napriklad yak zaznacheno vishe za serednokvadratichnoyi pohibki SKP pravilo Bayesa ye unikalnim a vidtak i prijnyatnim Yaksho 8 nalezhit do diskretnoyi mnozhini to vsi pravila Bayesa ye prijnyatnimi Yaksho 8 nalezhit do neperervnoyi ne diskretnoyi mnozhini i yaksho funkciya riziku R 8 d ye neperervnoyu za 8 dlya bud yakogo d to vsi pravila Bayesa ye prijnyatnimi Na protivagu do cogo uzagalneni pravila Bayesa chasto mayut neviznachenij bayesiv rizik u vipadku nekorektnih apriornih Ci pravila chasto ye neprijnyatnimi i perevirka yihnoyi prijnyatnosti mozhe buti skladnoyu Napriklad uzagalnena bayesova ocinka koeficiyentu zsuvu 8 na bazi gausovih vibirok opisanih u rozdili Uzagalneni bayesovi ocinki vishe ye neprijnyatnoyu dlya p gt 2 displaystyle p gt 2 ce ye vidomim yak en Asimptotichna efektivnist Nehaj 8 bude nevidomoyu vipadkovoyu zminnoyu ta pripustimo sho x 1 x 2 displaystyle x 1 x 2 ldots ye nezalezhnimi odnakovo rozpodilenimi probami z gustinoyu f x i 8 displaystyle f x i theta Nehaj d n d n x 1 x n displaystyle delta n delta n x 1 ldots x n bude poslidovnistyu bayesovih ocinok 8 na bazi zbilshuvanogo chisla vimiryuvan Nas cikavit analiz asimptotichnoyi produktivnosti ciyeyi poslidovnosti ocinok tobto produktivnist d n displaystyle delta n dlya velikih n Dlya cogo prijnyato vvazhati 8 determinovanim parametrom chiyim spravzhnim znachennyam ye 8 0 displaystyle theta 0 Za osoblivih umov dlya velikih vibirok velikih znachen n aposteriorna gustina 8 ye priblizno normalnoyu Inshimi slovami dlya velikih n vpliv apriornoyi jmovirnosti na aposteriornu ye neznachnim Bilshe togo yaksho d ye bayesovoyu ocinkoyu za riziku SKP to vona ye asimptotichno nezmishenoyu ta zbigayetsya za rozpodilom do normalnogo rozpodilu n d n 8 0 N 0 1 I 8 0 displaystyle sqrt n delta n theta 0 to N left 0 frac 1 I theta 0 right de I 80 ye informaciyeyu za Fisherom 80 Zvidsi viplivaye sho bayesova ocinka dn za SKP ye en Inshoyu ocinkoyu sho ye asimptotichno normalnoyu ta efektivnoyu ye ocinka maksimalnoyi pravdopodibnosti OMP angl maximum likelihood estimator MLE Vidnoshennya mizh maksimalnoyu pravdopodibnistyu ta bayesovimi ocinkami mozhna pokazati na nastupnomu prostomu prikladi Rozglyanmo ocinku 8 na bazi binomialnoyi vibirki x b 8 n de 8 poznachaye jmovirnist uspihu Za pripushennya sho 8 rozpodilene zgidno spryazhenogo apriornogo sho v danomu vipadku ye beta rozpodilom B a b vidomo sho apriornim rozpodilom ye B a x b n x Otzhe bayesovoyu ocinkoyu za SKP ye d n x E 8 x a x a b n displaystyle delta n x E theta x frac a x a b n OMP u danomu vipadku ye x n i tomu mi otrimuyemo d n x a b a b n E 8 n a b n d M L E displaystyle delta n x frac a b a b n E theta frac n a b n delta MLE Krajnye rivnyannya oznachaye sho dlya n bayesova ocinka v opisanij zadachi ye blizkoyu do OMP Z inshogo boku koli n ye malim apriorna informaciya zalishayetsya dorechnoyu dlya zadachi uhvalennya rishennya i vplivaye na ocinku Shobi pobachiti vidnosnu vagu apriornoyi informaciyi pripustimo sho a b v takomu vipadku kozhne vimiryuvannya privnosit 1 bit informaciyi formula vishe pokazuye sho aposteriorna informaciya maye taku samu vagu yak a b bitiv novoyi informaciyi Na praktici pro dribni detali apriornogo rozpodilu chasto vidomo duzhe malo zokrema nema rezonu pripuskati sho vin zbigayetsya z B a b tochno V takomu razi odniyeyu z mozhlivih interpretacij cogo obchislennya ye isnuye ne patologichnij apriornij rozpodil iz serednim znachennyam 0 5 ta standartnim vidhilennyam d sho daye vagu apriornoyi informaciyi rivnu 1 4d2 1 bitam novoyi informaciyi Inshim prikladom togo zh yavisha ye vipadok koli apriorna ocinka ta vimiryuvannya mayut normalni rozpodili Yaksho apriorne vidcentrovano na B z vidhilennyam S a vimiryuvannya vidcentrovano na b iz vidhilennyam s to aposteriorne vidcentrovano na a a b B b a b b displaystyle frac alpha alpha beta B frac beta alpha beta b z vagami u cij zvazhenij sumi sho ye a s b S Bilshe togo kvadratichnim aposteriornim vidhilennyam ye S s Inshimi slovami apriorne poyednuyetsya z vimiryuvannyam v tochnosti takim zhe chinom yak nibi vono ye dodatkovim vimiryuvannyam sho treba vrahuvati Napriklad yaksho S s 2 to vidhilennya poyednanih razom 4 vimiryuvan vidpovidaye vidhilennyu apriornogo za pripushennya sho pohibki vimiryuvan ye nezalezhnimi A vagi a b u formuli aposteriornogo vidpovidayut takomu vaga apriornogo skladaye 4 vagi vimiryuvannya Poyednannya cogo apriornogo z n vimiryuvannyami iz serednim v prizvodit do aposteriornogo vidcentrovanogo u 4 4 n V n 4 n v displaystyle frac 4 4 n V frac n 4 n v zokrema ce apriorne vidigraye taku zh rol yak i 4 vimiryuvannya zrobleni zavchasno U zagalnomu vipadku apriorne maye vagu s S vimiryuvan Porivnyajte ce iz prikladom binomialnogo rozpodilu tam apriorne maye vagu s S 1 vimiryuvan Vidno sho tochna vaga dijsno zalezhit vid detalej rozpodilu ale pri s S vidminnist staye maloyu Praktichnij priklad bayesovih ocinokInternet Movie Database vikoristovuye formulu dlya obchislennya ta porivnyannya rejtingiv filmiv yiyi koristuvachami vklyuchno z yihnimi 250 najrejtingovishimi filmami sho pretenduye na nadannya spravzhnoyi bayesovoyi ocinki Pochatkovo dlya obchislennya zvazhenogo serednogo balu najkrashih 250 filmiv vikoristovuvalasya nastupna formula hocha yiyi vidtodi bulo zmineno W R v C m v m displaystyle W Rv Cm over v m de W displaystyle W zvazhenij rejting R displaystyle R zvazhenij rejting filmu yak chislo vid 1 do 10 serednij angl Rating v displaystyle v kilkist golosiv za film angl votes m displaystyle m vaga nadana apriornij ocinci sho bazuyetsya na rozpodili serednih rejtingiv sered usogo fondu filmiv C displaystyle C serednij golos sered usogo fondu narazi 7 0 Zauvazhte sho W ye prosto zvazhenim arifmetichnim serednim R ta C z vektorom vag v m Iz perevazhannyam kilkosti vimiriv nad m dovira do serednogo rejtingu perevazhaye doviru do apriornogo znannya i zvazhenij bayesiv rejting W nablizhayetsya do prostogo serednogo R Sho blizhchim ye v kilkist ocinok filmu do nulya to blizhchim staye W do C de W ye zvazhenim rejtingom a C ye serednim rejtingom po vsih filmah Otzhe prostishimi terminami filmi iz duzhe nechislennimi ocinkami golosami matimut rejting zvazhenij v bik serednogo po vsih filmah v toj chas yak filmi z bagatma ocinkami golosami matimut rejting zvazhenij v bik yihnih serednih ocinok Pidhid IMDb garantuye sho film iz lishe dekilkoma sotnyami ocinok vsi po 10 ne zajme misce vishe Hreshenogo batka napriklad iz serednim 9 2 z ponad 500 000 ocinok Div takozh en Rekursivne bayesove ocinyuvannya en Spryazhenij apriornij rozpodil en PrimitkiLehmann ta Casella 1998 teorema 4 1 1 Lehmann ta Casella 1998 viznachennya 4 2 9 Jaynes E T 2007 Probability theory the logic of science vid 5 print Cambridge u a Cambridge Univ Press s 172 ISBN 978 0 521 59271 0 angl Berger 1980 rozdil 4 5 Lehmann ta Casella 1998 teorema 5 2 4 Lehmann ta Casella 1998 rozdil 6 8 IMDb Top 250 2012 06 01 u Wayback Machine angl DzherelaLehmann E L Casella G 1998 Theory of Point Estimation vid 2nd Springer ISBN 0 387 98502 6 angl 1985 Statistical decision theory and Bayesian Analysis vid 2nd New York Springer Verlag ISBN 0 387 96098 8 MR 0804611 angl PosilannyaBayesian estimation on cnx org 17 lyutogo 2012 u Wayback Machine angl Hazewinkel Michiel red 2001 Bayesian estimator Matematichna enciklopediya Springer ISBN 978 1 55608 010 4 angl