Ця стаття містить , але походження тверджень у ній через практично повну відсутність . (червень 2015) |
У баєсовому статистичному висновуванні апріо́рний розпо́діл ймові́рності (англ. prior probability distribution), що часто називають просто апріо́рне (англ. prior), деякої невизначеної кількості — це розподіл ймовірності p, що виражатиме чиєсь переконання про цю кількість перед врахуванням якогось свідчення. Наприклад, p може бути розподілом ймовірності пропорції виборців, що голосуватимуть за певного політика на майбутніх виборах. Він приписує цій кількості швидше невизначеність, ніж випадковість. Ця невідома кількість може бути параметром або латентною змінною.
Теорема Баєса застосовується шляхом множення апріорного на функцію правдоподібності з наступним нормуванням для отримання апостеріорного розподілу ймовірності, що є умовним розподілом цієї невизначеної кількості з урахуванням отриманих даних.
Апріорне часто є чисто суб'єктивною оцінкою досвідченого фахівця. Дехто при можливості обиратиме спряжений апріорний розподіл для спрощення обчислення апостеріорного розподілу.
Параметри апріорних розподілів називають гіперпараметрами, щоби відрізняти їх від параметрів моделі базових даних. Наприклад, якщо хтось використовує бета-розподіл для моделювання розподілу параметра p розподілу Бернуллі, то:
- p є параметром базової системи (розподілу Бернуллі), а
- α та β є параметрами апріорного розподілу (бета-розподілу), тобто гіперпараметрами.
Інформативні апріорні
Інформативне апріорне виражає характерну, чітку інформацію про змінну. Прикладом є апріорний розподіл температури завтра опівдні. Розсудливим підходом є прийняття як апріорного нормального розподілу з математичним сподіванням, що дорівнює сьогоднішній полуденній температурі, та дисперсією, що дорівнює одноденній дисперсії атмосферної температури, або розподілом температури для цього дня року.
Цей приклад має спільні властивості з багатьма апріорними, тобто, апостеріорне однієї задачі (сьогоднішньої температури) стає апріорним іншої задачі (завтрашня температура); більш раннє свідчення, що вже було враховано, є частиною апріорного і, по мірі акумулювання наступних свідчень, апріорне починає визначатися все більше свідченнями, ніж будь-яким початковим припущенням, за умови, що це початкове припущення узгоджувалося з можливістю того, що підказувало свідчення. Терміни «апріорне» та «апостеріорне» загалом є відносними до певної області визначення або спостереження.
Неінформативні апріорні
Неінформативне апріорне виражає невиразну або загальну інформацію про змінну. Термін «неінформативне апріорне» є почасти викривленням; часто таке апріорне можна було би назвати не дуже інформативним апріорним, або об'єктивним апріорним, тобто таким, що не було виявлено суб'єктивно. Неінформативні апріорні можуть виражати «об'єктивну» інформацію, таку як «ця змінна є додатною», або «ця змінна є меншою за певну межу».
Найпростішим та найстарішим правилом визначення неінформативного апріорного є [en], що приписує рівні ймовірності всім можливостям.
У задачах оцінки параметрів використання неінформативного апріорного зазвичай дає результати, що не надто відрізняються від звичайного статистичного аналізу, оскільки функція правдоподібності часто видає більше інформації, ніж неінформативне апріорне.
Робилися деякі спроби пошуку ймовірностей а пріорі, тобто розподілів ймовірності, що в певному сенсі логічно викликаються природою чийогось стану невпевненості; вони є предметом філософської суперечки, в якій баєсівці різко діляться на дві школи: «об'єктивні баєсівці», що переконані в існуванні таких апріорних для багатьох корисних ситуацій, та «суб'єктивні баєсівці», що переконані, що на практиці апріорні зазвичай представляють суб'єктивні судження думки, що не може бути суворо обґрунтовано. Можливо, найсильнішу аргументацію об'єктивного баєсизму було запропоновано [en], головним чином на підставі наслідків симетрії та [en].
Як приклад апріорного а пріорі, розгляньмо ситуацію, в якій відомо, що під одним із наперстків A, B та C сховано кульку, але інша інформація про її місцезнаходження відсутня. В цьому випадку рівномірне апріорне p(A) = p(B) = p(C) = 1/3 інтуїтивно здається єдиним розумним вибором. Формальніше, ми бачимо, що задача залишається такою ж, якщо ми переміняємо мітки («A», «B» та «C») наперстків. Відтак було би дивним обирати апріорне, для якого переміна міток спричинила би зміну в наших передбаченнях стосовно того, під яким із них знайдеться кулька; рівномірне апріорне є єдиним, що зберігає цю інваріантність. Якщо прийняти цей принцип інваріантності, то можна побачити, що рівномірне апріорне є логічно правильним апріорним для представлення цього стану знання. Варто зауважити, що це апріорне є «об'єктивним» у сенсі того, що воно є правильним вибором для представлення певного типу знання, але воно не є об'єктивним у сенсі того, щоби бути незалежною від спостерігача властивістю світу: в реальності кулька існує під певним наперстком, і в цій ситуації говорити про ймовірності має сенс лише якщо є спостерігач із обмеженим знанням про дану систему.
Як більш спірний приклад Джейнс опублікував аргументацію на основі груп Лі, яка підказує, що апріорне, що представляє повну невизначеність про ймовірність, повинне бути апріорним Голдейна p−1(1 − p)−1. Прикладом, що наводить Джейнс, є повторні експерименти із знаходження хімікату в лабораторії, й ставлення питання, чи розчиняється він у воді. Апріорне Голдейна дає щоразу більше ваги та , показуючи, що зразок або кожного разу розчинятиметься, або ніколи не розчинятиметься, з однаковою ймовірністю. Однак, якщо спостерігатимуться зразки хімікату, що розчиняється в одному експерименті, і не розчинятиметься в іншому, тоді апріорне уточнюватиметься до рівномірного розподілу на відрізку [0, 1]. Це отримується застосуванням теореми Баєса до набору даних, що складається з одного спостереження розчинення й одного не розчинення, з використанням наведеного вище апріорного. Апріорне Голдейна критикувалося[] на тій підставі, що воно видає некоректний апостеріорний розподіл, що розташовує 100% вмісту ймовірності або в p = 0, або в p = 1, якщо скінченна кількість спостережень видали однаковий результат. Тому перевага віддається[][en] (див. нижче).
Може бути побудовано апріорні, пропорційні мірі Хаара, якщо параметричний простір X має структуру природної групи, що залишає інваріантним наш баєсів стан знання. Це може розглядатися як узагальнення принципу інваріантності, що використовується для підтвердження рівномірного апріорного над трьома наперстками у наведеному вище прикладі. Наприклад, у фізиці ми можемо очікувати, що експеримент даватиме однакові результати незалежно від нашого вибору початку системи координат. Це спричиняє групову структуру групи трансляції на X, що визначатиме апріорну ймовірність як постійну некоректну апріорну ймовірність. Аналогічно, деякі вимірювання є природно інваріантними до вибору довільного масштабу (наприклад, чи використовуються сантиметри, чи дюйми, фізичні результати будуть однаковими). В такому випадку група масштабування є структурою природної групи, і відповідне апріорне на X є пропорційним до 1/x. Іноді має значення, чи ми використовуємо лівоінваріантну, чи правоінваріантну міру Хаара. Наприклад, ліво- та правоінваріантні міри Хаара на [en] не є рівними. Бергер доводить, що правильним вибором є право-інваріантна міра Хаара.
Іншою ідеєю, яку обстоює [en], є використання [en] (англ. MAXENT). Спонукою є те, що ентропія Шеннона розподілу ймовірності вимірює кількість інформації, що міститься в розподілі. Що більшою є ентропія, то менше інформації надається цим розподілом. Отже, максимізуючи ентропію над придатним набором розподілів ймовірностей на X, можна знайти розподіл, що є найменш інформативним у тому сенсі, що він містить найменше інформації, відповідної до обмежень, що визначають цей набір. Наприклад, апріорне з максимальною ентропією на дискретному просторі, якщо задано лише те, що ймовірність нормується до 1, є апріорним, що призначає рівні ймовірності кожному станові. А в неперервному випадку апріорне з максимальною ентропією, якщо задано, що щільність нормалізується з нульовим середнім та одиничною дисперсією, є нормальним розподілом. Принцип мінімальної перехресної ентропії (англ. MINXENT) узагальнює принцип максимальної ентропії до випадку «уточнення» довільного апріорного розподілу придатними обмеженнями у максимально-ентропійному сенсі.
Споріднену ідею, , було запропоновано [en]. Тут ідея в тому, щоби максимізувати очікувану відстань Кульбака — Лейблера апостеріорного розподілу відносно апріорного. Це максимізує очікувану апостеріорну інформацію про X, коли апріорною щільністю є p(x); отже, у певному сенсі, p(x) є «найменш інформативним» апріорним X. Референтне апріорне визначається в асимптотичній границі, тобто, розглядається границя апріорних, отриманих таким чином, що кількість точок даних прямує до нескінченності. Референтні апріорні часто обирають як об'єктивні апріорні у багатовимірних задачах, оскільки інші правила (наприклад, [en]) можуть призводити до апріорних із проблематичною поведінкою.
Об'єктивні апріорні розподіли можуть також виводитися з інших принципів, таких як теорії інформації та кодування (див., наприклад, мінімальну довжину опису) або частотна статистика (див. ). Такі методи застосовуються в [en].
Філософські проблеми, пов'язані з неінформативними апріорними, пов'язано з вибором відповідної метрики, або шкали вимірювання. Припустімо, нам потрібне апріорне швидкості невідомого нам бігуна. Ми могли би вказати, скажімо, нормальний розподіл як апріорне його швидкості, але з іншого боку ми могли би вказати нормальний розподіл часу, що він витрачає на подолання 100 метрів, що є пропорційним до величини, зворотної першому апріорному. Це є дуже різні апріорні, але не ясно, якому з них віддати перевагу. [en] Джейнса, що часто не беруть до уваги, в деяких випадках може давати відповідь на це питання.
Аналогічно, якщо стоїть питання оцінки розподілу невідомої пропорції між 0 та 1, ми могли би сказати, що всі пропорції є однаково правдоподібними, й скористатися рівномірним розподілом. З іншого боку, ми могли би сказати, що однаково правдоподібними є порядки величини пропорцій, логарифмічне апріорне, що є рівномірним апріорним логарифму пропорції. [en] намагається розв'язати цю задачу шляхом обчислення апріорного, що виражає однакове переконання не залежно від вживаної метрики. Апріорним Джеффріса для невідомої пропорції p є p−1/2(1 − p)−1/2, що відрізняється від рекомендації Джейнса.
Апріорні, засновані на поняттях [en], застосовуються в індуктивному висновуванні як база для індукції у дуже загальних умовах.
Практичні проблеми, пов'язані з неінформативними апріорними, включають вимогу того, щоби апостеріорний розподіл був коректним. Звичайні неінформативні апріорні на неперервних не обмежених змінних є некоректним. Це не повинне бути проблемою, якщо апостеріорний розподіл є коректним. Ще одна важлива проблема полягає в тому, що якщо неінформативне апріорне використовуватиметься регулярно, тобто, з багатьма різними наборами даних, то воно повинно мати добрі частотні властивості. Баєсової ймовірності ці проблеми зазвичай не стосуватимуться, але вони можуть бути важливими у даній ситуації. Наприклад, можна забажати, щоби правило рішення на базі апостеріорного розподілу було [en] за прийнятої функції втрат. На жаль, прийнятність часто важко перевірити, хоча деякі результати відомі. Ця проблема стоїть особливо гостро з ієрархічними баєсовими моделями; звичайні апріорні (наприклад, Джеффріса) можуть давати вкрай неприйнятні правила рішення, якщо застосовуватимуться на вищих рівнях ієрархії.
Некоректні апріорні
Нехай події є взаємовиключними та вичерпними. Якщо теорему Баєса записано як
то ясно, що такий самий результат було би отримано, якби всі апріорні ймовірності P(Ai) та P(Aj) було помножено на задану сталу; те саме справедливе для неперервної випадкової змінної. Якщо сума у знаменнику сходиться, то апостеріорні ймовірності так само даватимуть в сумі (або інтегралі) 1, навіть якщо апріорні значення цього не роблять, і таким чином апріорні можуть вимагати вказання лише в правильній пропорції. У розвиток цієї ідеї, в багатьох випадках сумі або інтегралові апріорних значень може навіть не бути потрібним бути скінченним для отримання змістовних відповідей для апостеріорних ймовірностей. У такому випадку апріорне називається некоре́ктним апріо́рним. Проте апостеріорний розподіл повинен бути коректним розподілом, якщо апріорний є некоректним. Це ясно з випадку, коли подія B не залежить від жодної з Aj.
Статистики іноді[] використовують некоректні апріорні як неінформативні. Наприклад, якщо їм потрібен апріорний розподіл для середнього значення та дисперсії випадкової змінної, вони можуть розглядати p(m, v) ~ 1/v (для v > 0), що пропонуватиме «однакову правдоподібність» для всіх середніх значень, та те, що додатна дисперсія стає «менш правдоподібною» у зворотній пропорції до її значення. Багато авторів[] застерігають про небезпеку переінтерпретації цих апріорних, оскільки вони не є густинами ймовірності. Єдина їхня доречність знаходиться у відповідному апостеріорному, допоки воно є однозначним для всіх спостережень. (Типовим контрприкладом є апріорне Голдейна.[: ком.][])
Приклади
Приклади некоректних апріорних включають:
- Β(0,0), бета-розподіл для α=0, β=0.
- Рівномірний розподіл на нескінченному інтервалі (тобто, половина або вся дійсна пряма).
- Логарифмічне апріорне на додатних дійсних числах[]
Інші апріорні
Концепція [en] забезпечує шлях для визначення апріорних ймовірностей на підставі відносної складності альтернативних моделей, що розглядаються.
Посилання
- Williamson, 2010.
- Jaynes, 2003.
- Jaynes, 1968.
- Haldane, 1932.
- Haldane, 1948.
- Berger, 1985, с. 413.
- Bernardo, 1979.
- Jaynes, 2003, розділ 12 (зауважте, що розділ 12 не доступний в електронному препринті, але його можна бачити в попередньому перегляді у Google Books).
- Berger та Strawderman, 1996.
- Lindley, 1973.
- De Groot, 1937.
- Kass та Wasserman, 1996.
Література
- Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (2013). (вид. III). CRC Press. ISBN . Архів оригіналу за 26 червня 2015. Процитовано 26 червня 2015. (англ.)
- Berger, James O. (1985). Statistical decision theory and Bayesian analysis. Berlin: Springer-Verlag. ISBN . MR 0804611. (англ.)
- Berger, James O.; Strawderman, William E. (1996). Choice of hierarchical priors: admissibility in estimation of normal means. [en]. 24 (3): 931—951. doi:10.1214/aos/1032526950. MR 1401831. Zbl 0865.62004. (англ.)
- Bernardo, Jose M. (1979). Reference Posterior Distributions for Bayesian Inference. [en], Series B. 41 (2): 113—147. JSTOR 2985028. MR 0547240. (англ.)
- ; ; Dongchu Sun (2009). The formal definition of reference priors. Annals of Statistics. 37 (2): 905—938. arXiv:0904.0156. doi:10.1214/07-AOS587. (англ.)
- (Sep 1968). (PDF). IEEE Transactions on Systems Science and Cybernetics. 4 (3): 227—241. doi:10.1109/TSSC.1968.300117. Архів оригіналу (PDF) за 20 липня 2011. Процитовано 27 березня 2009. (англ.)
- Reprinted in Rosenkrantz, Roger D. (1989). E. T. Jaynes: papers on probability, statistics, and statistical physics. Boston: Kluwer Academic Publishers. с. 116—130. ISBN . (англ.)
- (2003). . Cambridge University Press. ISBN . Архів оригіналу за 8 листопада 2020. (англ.)
- Williamson, Jon (2010). (PDF). Philosophia Mathematica. 18 (1): 130—135. doi:10.1093/philmat/nkp019. Архів оригіналу (PDF) за 9 червня 2011. Процитовано 2 липня 2010. (англ.)
- Haldane, J.B.S. (1932). . Mathematical Proceedings of the Cambridge Philosophical Society. 28: 55—61. doi:10.1017/s0305004100010495. Архів оригіналу за 23 червня 2015. Процитовано 23 червня 2015. (англ.)
- Haldane, J.B.S. (1948). The precision of observed values of small frequencies. Biometrika. 35: 297—300. doi:10.2307/2332350. (англ.)
- Lindley, Dennis Victor (1973). Making decisions. London: Wiley. (англ.)
- Kass, Robert E.; Wasserman, Larry (1996). The Selection of Prior Distributions by Formal Rules. Journal of the American Statistical Association. 91 (435): 1343—1370. doi:10.1080/01621459.1996.10477003. (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya mistit perelik posilan ale pohodzhennya tverdzhen u nij zalishayetsya nezrozumilim cherez praktichno povnu vidsutnist vnutrishnotekstovih dzherel vinosok Bud laska dopomozhit polipshiti cyu stattyu peretvorivshi dzherela z pereliku posilan na dzherela vinoski u samomu teksti statti cherven 2015 U bayesovomu statistichnomu visnovuvanni aprio rnij rozpo dil jmovi rnosti angl prior probability distribution sho chasto nazivayut prosto aprio rne angl prior deyakoyi neviznachenoyi kilkosti ce rozpodil jmovirnosti p sho virazhatime chiyes perekonannya pro cyu kilkist pered vrahuvannyam yakogos svidchennya Napriklad p mozhe buti rozpodilom jmovirnosti proporciyi viborciv sho golosuvatimut za pevnogo politika na majbutnih viborah Vin pripisuye cij kilkosti shvidshe neviznachenist nizh vipadkovist Cya nevidoma kilkist mozhe buti parametrom abo latentnoyu zminnoyu Teorema Bayesa zastosovuyetsya shlyahom mnozhennya apriornogo na funkciyu pravdopodibnosti z nastupnim normuvannyam dlya otrimannya aposteriornogo rozpodilu jmovirnosti sho ye umovnim rozpodilom ciyeyi neviznachenoyi kilkosti z urahuvannyam otrimanih danih Apriorne chasto ye chisto sub yektivnoyu ocinkoyu dosvidchenogo fahivcya Dehto pri mozhlivosti obiratime spryazhenij apriornij rozpodil dlya sproshennya obchislennya aposteriornogo rozpodilu Parametri apriornih rozpodiliv nazivayut giperparametrami shobi vidriznyati yih vid parametriv modeli bazovih danih Napriklad yaksho htos vikoristovuye beta rozpodil dlya modelyuvannya rozpodilu parametra p rozpodilu Bernulli to p ye parametrom bazovoyi sistemi rozpodilu Bernulli a a ta b ye parametrami apriornogo rozpodilu beta rozpodilu tobto giperparametrami Informativni apriorniInformativne apriorne virazhaye harakternu chitku informaciyu pro zminnu Prikladom ye apriornij rozpodil temperaturi zavtra opivdni Rozsudlivim pidhodom ye prijnyattya yak apriornogo normalnogo rozpodilu z matematichnim spodivannyam sho dorivnyuye sogodnishnij poludennij temperaturi ta dispersiyeyu sho dorivnyuye odnodennij dispersiyi atmosfernoyi temperaturi abo rozpodilom temperaturi dlya cogo dnya roku Cej priklad maye spilni vlastivosti z bagatma apriornimi tobto aposteriorne odniyeyi zadachi sogodnishnoyi temperaturi staye apriornim inshoyi zadachi zavtrashnya temperatura bilsh rannye svidchennya sho vzhe bulo vrahovano ye chastinoyu apriornogo i po miri akumulyuvannya nastupnih svidchen apriorne pochinaye viznachatisya vse bilshe svidchennyami nizh bud yakim pochatkovim pripushennyam za umovi sho ce pochatkove pripushennya uzgodzhuvalosya z mozhlivistyu togo sho pidkazuvalo svidchennya Termini apriorne ta aposteriorne zagalom ye vidnosnimi do pevnoyi oblasti viznachennya abo sposterezhennya Neinformativni apriorniNeinformativne apriorne virazhaye neviraznu abo zagalnu informaciyu pro zminnu Termin neinformativne apriorne ye pochasti vikrivlennyam chasto take apriorne mozhna bulo bi nazvati ne duzhe informativnim apriornim abo ob yektivnim apriornim tobto takim sho ne bulo viyavleno sub yektivno Neinformativni apriorni mozhut virazhati ob yektivnu informaciyu taku yak cya zminna ye dodatnoyu abo cya zminna ye menshoyu za pevnu mezhu Najprostishim ta najstarishim pravilom viznachennya neinformativnogo apriornogo ye en sho pripisuye rivni jmovirnosti vsim mozhlivostyam U zadachah ocinki parametriv vikoristannya neinformativnogo apriornogo zazvichaj daye rezultati sho ne nadto vidriznyayutsya vid zvichajnogo statistichnogo analizu oskilki funkciya pravdopodibnosti chasto vidaye bilshe informaciyi nizh neinformativne apriorne Robilisya deyaki sprobi poshuku jmovirnostej a priori tobto rozpodiliv jmovirnosti sho v pevnomu sensi logichno viklikayutsya prirodoyu chijogos stanu nevpevnenosti voni ye predmetom filosofskoyi superechki v yakij bayesivci rizko dilyatsya na dvi shkoli ob yektivni bayesivci sho perekonani v isnuvanni takih apriornih dlya bagatoh korisnih situacij ta sub yektivni bayesivci sho perekonani sho na praktici apriorni zazvichaj predstavlyayut sub yektivni sudzhennya dumki sho ne mozhe buti suvoro obgruntovano Mozhlivo najsilnishu argumentaciyu ob yektivnogo bayesizmu bulo zaproponovano en golovnim chinom na pidstavi naslidkiv simetriyi ta en Yak priklad apriornogo a priori rozglyanmo situaciyu v yakij vidomo sho pid odnim iz naperstkiv A B ta C shovano kulku ale insha informaciya pro yiyi misceznahodzhennya vidsutnya V comu vipadku rivnomirne apriorne p A p B p C 1 3 intuyitivno zdayetsya yedinim rozumnim viborom Formalnishe mi bachimo sho zadacha zalishayetsya takoyu zh yaksho mi pereminyayemo mitki A B ta C naperstkiv Vidtak bulo bi divnim obirati apriorne dlya yakogo peremina mitok sprichinila bi zminu v nashih peredbachennyah stosovno togo pid yakim iz nih znajdetsya kulka rivnomirne apriorne ye yedinim sho zberigaye cyu invariantnist Yaksho prijnyati cej princip invariantnosti to mozhna pobachiti sho rivnomirne apriorne ye logichno pravilnim apriornim dlya predstavlennya cogo stanu znannya Varto zauvazhiti sho ce apriorne ye ob yektivnim u sensi togo sho vono ye pravilnim viborom dlya predstavlennya pevnogo tipu znannya ale vono ne ye ob yektivnim u sensi togo shobi buti nezalezhnoyu vid sposterigacha vlastivistyu svitu v realnosti kulka isnuye pid pevnim naperstkom i v cij situaciyi govoriti pro jmovirnosti maye sens lishe yaksho ye sposterigach iz obmezhenim znannyam pro danu sistemu Yak bilsh spirnij priklad Dzhejns opublikuvav argumentaciyu na osnovi grup Li yaka pidkazuye sho apriorne sho predstavlyaye povnu neviznachenist pro jmovirnist povinne buti apriornim Goldejna p 1 1 p 1 Prikladom sho navodit Dzhejns ye povtorni eksperimenti iz znahodzhennya himikatu v laboratoriyi j stavlennya pitannya chi rozchinyayetsya vin u vodi Apriorne Goldejna daye shorazu bilshe vagi p 0 displaystyle p 0 ta p 1 displaystyle p 1 pokazuyuchi sho zrazok abo kozhnogo razu rozchinyatimetsya abo nikoli ne rozchinyatimetsya z odnakovoyu jmovirnistyu Odnak yaksho sposterigatimutsya zrazki himikatu sho rozchinyayetsya v odnomu eksperimenti i ne rozchinyatimetsya v inshomu todi apriorne utochnyuvatimetsya do rivnomirnogo rozpodilu na vidrizku 0 1 Ce otrimuyetsya zastosuvannyam teoremi Bayesa do naboru danih sho skladayetsya z odnogo sposterezhennya rozchinennya j odnogo ne rozchinennya z vikoristannyam navedenogo vishe apriornogo Apriorne Goldejna kritikuvalosya kim na tij pidstavi sho vono vidaye nekorektnij aposteriornij rozpodil sho roztashovuye 100 vmistu jmovirnosti abo v p 0 abo v p 1 yaksho skinchenna kilkist sposterezhen vidali odnakovij rezultat Tomu perevaga viddayetsya kim en div nizhche Mozhe buti pobudovano apriorni proporcijni miri Haara yaksho parametrichnij prostir X maye strukturu prirodnoyi grupi sho zalishaye invariantnim nash bayesiv stan znannya Ce mozhe rozglyadatisya yak uzagalnennya principu invariantnosti sho vikoristovuyetsya dlya pidtverdzhennya rivnomirnogo apriornogo nad troma naperstkami u navedenomu vishe prikladi Napriklad u fizici mi mozhemo ochikuvati sho eksperiment davatime odnakovi rezultati nezalezhno vid nashogo viboru pochatku sistemi koordinat Ce sprichinyaye grupovu strukturu grupi translyaciyi na X sho viznachatime apriornu jmovirnist yak postijnu nekorektnu apriornu jmovirnist Analogichno deyaki vimiryuvannya ye prirodno invariantnimi do viboru dovilnogo masshtabu napriklad chi vikoristovuyutsya santimetri chi dyujmi fizichni rezultati budut odnakovimi V takomu vipadku grupa masshtabuvannya ye strukturoyu prirodnoyi grupi i vidpovidne apriorne na X ye proporcijnim do 1 x Inodi maye znachennya chi mi vikoristovuyemo livoinvariantnu chi pravoinvariantnu miru Haara Napriklad livo ta pravoinvariantni miri Haara na en ne ye rivnimi Berger dovodit sho pravilnim viborom ye pravo invariantna mira Haara Inshoyu ideyeyu yaku obstoyuye en ye vikoristannya en angl MAXENT Sponukoyu ye te sho entropiya Shennona rozpodilu jmovirnosti vimiryuye kilkist informaciyi sho mistitsya v rozpodili Sho bilshoyu ye entropiya to menshe informaciyi nadayetsya cim rozpodilom Otzhe maksimizuyuchi entropiyu nad pridatnim naborom rozpodiliv jmovirnostej na X mozhna znajti rozpodil sho ye najmensh informativnim u tomu sensi sho vin mistit najmenshe informaciyi vidpovidnoyi do obmezhen sho viznachayut cej nabir Napriklad apriorne z maksimalnoyu entropiyeyu na diskretnomu prostori yaksho zadano lishe te sho jmovirnist normuyetsya do 1 ye apriornim sho priznachaye rivni jmovirnosti kozhnomu stanovi A v neperervnomu vipadku apriorne z maksimalnoyu entropiyeyu yaksho zadano sho shilnist normalizuyetsya z nulovim serednim ta odinichnoyu dispersiyeyu ye normalnim rozpodilom Princip minimalnoyi perehresnoyi entropiyi angl MINXENT uzagalnyuye princip maksimalnoyi entropiyi do vipadku utochnennya dovilnogo apriornogo rozpodilu pridatnimi obmezhennyami u maksimalno entropijnomu sensi Sporidnenu ideyu bulo zaproponovano en Tut ideya v tomu shobi maksimizuvati ochikuvanu vidstan Kulbaka Lejblera aposteriornogo rozpodilu vidnosno apriornogo Ce maksimizuye ochikuvanu aposteriornu informaciyu pro X koli apriornoyu shilnistyu ye p x otzhe u pevnomu sensi p x ye najmensh informativnim apriornim X Referentne apriorne viznachayetsya v asimptotichnij granici tobto rozglyadayetsya granicya apriornih otrimanih takim chinom sho kilkist tochok danih pryamuye do neskinchennosti Referentni apriorni chasto obirayut yak ob yektivni apriorni u bagatovimirnih zadachah oskilki inshi pravila napriklad en mozhut prizvoditi do apriornih iz problematichnoyu povedinkoyu Ob yektivni apriorni rozpodili mozhut takozh vivoditisya z inshih principiv takih yak teoriyi informaciyi ta koduvannya div napriklad minimalnu dovzhinu opisu abo chastotna statistika div Taki metodi zastosovuyutsya v en Filosofski problemi pov yazani z neinformativnimi apriornimi pov yazano z viborom vidpovidnoyi metriki abo shkali vimiryuvannya Pripustimo nam potribne apriorne shvidkosti nevidomogo nam biguna Mi mogli bi vkazati skazhimo normalnij rozpodil yak apriorne jogo shvidkosti ale z inshogo boku mi mogli bi vkazati normalnij rozpodil chasu sho vin vitrachaye na podolannya 100 metriv sho ye proporcijnim do velichini zvorotnoyi pershomu apriornomu Ce ye duzhe rizni apriorni ale ne yasno yakomu z nih viddati perevagu en Dzhejnsa sho chasto ne berut do uvagi v deyakih vipadkah mozhe davati vidpovid na ce pitannya Analogichno yaksho stoyit pitannya ocinki rozpodilu nevidomoyi proporciyi mizh 0 ta 1 mi mogli bi skazati sho vsi proporciyi ye odnakovo pravdopodibnimi j skoristatisya rivnomirnim rozpodilom Z inshogo boku mi mogli bi skazati sho odnakovo pravdopodibnimi ye poryadki velichini proporcij logarifmichne apriorne sho ye rivnomirnim apriornim logarifmu proporciyi en namagayetsya rozv yazati cyu zadachu shlyahom obchislennya apriornogo sho virazhaye odnakove perekonannya ne zalezhno vid vzhivanoyi metriki Apriornim Dzheffrisa dlya nevidomoyi proporciyi p ye p 1 2 1 p 1 2 sho vidriznyayetsya vid rekomendaciyi Dzhejnsa Apriorni zasnovani na ponyattyah en zastosovuyutsya v induktivnomu visnovuvanni yak baza dlya indukciyi u duzhe zagalnih umovah Praktichni problemi pov yazani z neinformativnimi apriornimi vklyuchayut vimogu togo shobi aposteriornij rozpodil buv korektnim Zvichajni neinformativni apriorni na neperervnih ne obmezhenih zminnih ye nekorektnim Ce ne povinne buti problemoyu yaksho aposteriornij rozpodil ye korektnim She odna vazhliva problema polyagaye v tomu sho yaksho neinformativne apriorne vikoristovuvatimetsya regulyarno tobto z bagatma riznimi naborami danih to vono povinno mati dobri chastotni vlastivosti Bayesovoyi jmovirnosti ci problemi zazvichaj ne stosuvatimutsya ale voni mozhut buti vazhlivimi u danij situaciyi Napriklad mozhna zabazhati shobi pravilo rishennya na bazi aposteriornogo rozpodilu bulo en za prijnyatoyi funkciyi vtrat Na zhal prijnyatnist chasto vazhko pereviriti hocha deyaki rezultati vidomi Cya problema stoyit osoblivo gostro z iyerarhichnimi bayesovimi modelyami zvichajni apriorni napriklad Dzheffrisa mozhut davati vkraj neprijnyatni pravila rishennya yaksho zastosovuvatimutsya na vishih rivnyah iyerarhiyi Nekorektni apriorniNehaj podiyi A1 A2 An displaystyle A 1 A 2 ldots A n ye vzayemoviklyuchnimi ta vicherpnimi Yaksho teoremu Bayesa zapisano yak P Ai B P B Ai P Ai jP B Aj P Aj displaystyle P A i B frac P B A i P A i sum j P B A j P A j to yasno sho takij samij rezultat bulo bi otrimano yakbi vsi apriorni jmovirnosti P Ai ta P Aj bulo pomnozheno na zadanu stalu te same spravedlive dlya neperervnoyi vipadkovoyi zminnoyi Yaksho suma u znamenniku shoditsya to aposteriorni jmovirnosti tak samo davatimut v sumi abo integrali 1 navit yaksho apriorni znachennya cogo ne roblyat i takim chinom apriorni mozhut vimagati vkazannya lishe v pravilnij proporciyi U rozvitok ciyeyi ideyi v bagatoh vipadkah sumi abo integralovi apriornih znachen mozhe navit ne buti potribnim buti skinchennim dlya otrimannya zmistovnih vidpovidej dlya aposteriornih jmovirnostej U takomu vipadku apriorne nazivayetsya nekore ktnim aprio rnim Prote aposteriornij rozpodil povinen buti korektnim rozpodilom yaksho apriornij ye nekorektnim Ce yasno z vipadku koli podiya B ne zalezhit vid zhodnoyi z Aj Statistiki inodi dzherelo vikoristovuyut nekorektni apriorni yak neinformativni Napriklad yaksho yim potriben apriornij rozpodil dlya serednogo znachennya ta dispersiyi vipadkovoyi zminnoyi voni mozhut rozglyadati p m v 1 v dlya v gt 0 sho proponuvatime odnakovu pravdopodibnist dlya vsih serednih znachen ta te sho dodatna dispersiya staye mensh pravdopodibnoyu u zvorotnij proporciyi do yiyi znachennya Bagato avtoriv dzherelo zasterigayut pro nebezpeku pereinterpretaciyi cih apriornih oskilki voni ne ye gustinami jmovirnosti Yedina yihnya dorechnist znahoditsya u vidpovidnomu aposteriornomu dopoki vono ye odnoznachnim dlya vsih sposterezhen Tipovim kontrprikladom ye apriorne Goldejna proyasniti kom dzherelo Prikladi Prikladi nekorektnih apriornih vklyuchayut B 0 0 beta rozpodil dlya a 0 b 0 Rivnomirnij rozpodil na neskinchennomu intervali tobto polovina abo vsya dijsna pryama Logarifmichne apriorne na dodatnih dijsnih chislah dzherelo Inshi apriorniKoncepciya en zabezpechuye shlyah dlya viznachennya apriornih jmovirnostej na pidstavi vidnosnoyi skladnosti alternativnih modelej sho rozglyadayutsya PosilannyaWilliamson 2010 Jaynes 2003 Jaynes 1968 Haldane 1932 Haldane 1948 Berger 1985 s 413 Bernardo 1979 Jaynes 2003 rozdil 12 zauvazhte sho rozdil 12 ne dostupnij v elektronnomu preprinti ale jogo mozhna bachiti v poperednomu pereglyadi u Google Books Berger ta Strawderman 1996 Lindley 1973 De Groot 1937 Kass ta Wasserman 1996 LiteraturaGelman Andrew Carlin John B Stern Hal S Dunson David B Vehtari Aki Rubin Donald B 2013 vid III CRC Press ISBN 978 1439840955 Arhiv originalu za 26 chervnya 2015 Procitovano 26 chervnya 2015 angl Berger James O 1985 Statistical decision theory and Bayesian analysis Berlin Springer Verlag ISBN 0 387 96098 8 MR 0804611 angl Berger James O Strawderman William E 1996 Choice of hierarchical priors admissibility in estimation of normal means en 24 3 931 951 doi 10 1214 aos 1032526950 MR 1401831 Zbl 0865 62004 angl Bernardo Jose M 1979 Reference Posterior Distributions for Bayesian Inference en Series B 41 2 113 147 JSTOR 2985028 MR 0547240 angl Dongchu Sun 2009 The formal definition of reference priors Annals of Statistics 37 2 905 938 arXiv 0904 0156 doi 10 1214 07 AOS587 angl Sep 1968 PDF IEEE Transactions on Systems Science and Cybernetics 4 3 227 241 doi 10 1109 TSSC 1968 300117 Arhiv originalu PDF za 20 lipnya 2011 Procitovano 27 bereznya 2009 angl Reprinted in Rosenkrantz Roger D 1989 E T Jaynes papers on probability statistics and statistical physics Boston Kluwer Academic Publishers s 116 130 ISBN 90 277 1448 7 angl 2003 Cambridge University Press ISBN 0 521 59271 2 Arhiv originalu za 8 listopada 2020 angl Williamson Jon 2010 PDF Philosophia Mathematica 18 1 130 135 doi 10 1093 philmat nkp019 Arhiv originalu PDF za 9 chervnya 2011 Procitovano 2 lipnya 2010 angl Haldane J B S 1932 Mathematical Proceedings of the Cambridge Philosophical Society 28 55 61 doi 10 1017 s0305004100010495 Arhiv originalu za 23 chervnya 2015 Procitovano 23 chervnya 2015 angl Haldane J B S 1948 The precision of observed values of small frequencies Biometrika 35 297 300 doi 10 2307 2332350 angl Lindley Dennis Victor 1973 Making decisions London Wiley angl Kass Robert E Wasserman Larry 1996 The Selection of Prior Distributions by Formal Rules Journal of the American Statistical Association 91 435 1343 1370 doi 10 1080 01621459 1996 10477003 angl