Прибли́зне ба́єсове обчи́слення (ПБО, англ. Approximate Bayesian computation, ABC) складає клас [en], що беруть свої корені з баєсової статистики. В усіх методах статистичного висновування на основі моделей центральне значення має функція правдоподібності, оскільки вона виражає ймовірність спостережуваних даних згідно певної статистичної моделі, і таким чином кількісно оцінює дані, що підтримують певні значення параметрів та обирання серед різних моделей. Для простих моделей формулу функції правдоподібності зазвичай може бути виведено аналітично. Однак для складніших моделей аналітична формула може бути невиразною, або оцінка функції правдоподібності може бути дуже витратною обчислювально.
Методи ПБО уникають обчислення функції правдоподібності. Таким чином, методи ПБО розширюють сферу моделей, для яких може розглядатися статистичне висновування. Методи ПБО є математично обґрунтованими, але вони неминуче роблять припущення та наближення, що потребують ретельної оцінки. Крім того, ширша область застосування ПБО посилює проблеми оцінки параметрів та обирання моделі.
Останніми роками ПБО швидко завоювало популярність, зокрема для аналізу складних задач, що виникають в біологічних науках, наприклад, в популяційній генетиці, екології, епідеміології та системній біології.
Історія
Перші ідеї, пов'язані з ПБО, сходять до 1980-х років. [en] (англ. Donald Rubin), обговорюючи інтерпретацію баєсових викладів у 1984 році, описав гіпотетичний механізм вибірки, що дає вибірку з апостеріорного розподілу. Ця схема була більше концептуальним уявним експериментом для демонстрації, якого типу маніпуляції здійснюються при отримуванні висновків про апостеріорні розподіли параметрів. Опис цього механізму вибірки в точності збігається зі схемою ПБО-відхилення, і цю статтю можна розглядати як перший опис приблизного баєсового обчислення. Проте двоетапний [en] було побудовано Френсісом Гальтоном (англ. Francis Galton) у пізніх 1800-х, що можна побачити як фізичну реалізацію схеми ПБО-відхилення для одного невідомого (параметра) та одного спостереження — див. мал. 5 у S. Stigler 2010. Інше передбачення було зроблено Рубіним, коли він переконував, що прикладні статистики не повинні обмежуватися в баєсовому висновуванні лише тими моделями, що піддаються аналітичній обробці, а натомість розглядати обчислювальні методи, що дозволяють їм оцінювати потрібний апостеріорний розподіл. Таким чином може розглядатися ширший спектр моделей. Ці аргументи є особливо актуальними в контексті ПБО.
У 1984 році [en] (англ. Peter Diggle) та Річард Греттон (англ. Richard Gratton) запропонували застосовувати схему систематичної симуляції для наближення функції правдоподібності, коли її аналітична форма є непіддатливою. Їхній метод ґрунтувався на визначенні ґратки в просторі параметрів та використанні її для наближення правдоподібності шляхом виконання декількох симуляцій для кожної з точок ґратки. Наближення потім покращувалося застосуванням згладжувальних прийомів до виходів цих симуляцій. І хоча ідея використання симуляцій для перевірки гіпотез не була новою, Дігл та Греттон, очевидно, запропонували першу процедуру використання симуляції для здійснення статистичного висновування за умов, коли правдоподібність є непіддатливою.
Хоча підхід Дігла та Греттона й відкрив нові обрії, їхній метод не був повністю ідентичним тому, що тепер відоме як ПБО, оскільки його спрямовано на наближення правдоподібності, замість апостеріорного розподілу. Стаття [en] (англ. Simon Tavaré) та ін. була першою, в якій було запропоновано алгоритм ПБО для апостеріорного висновування. В їхній новаторській праці розглядалося висновування стосовно генеалогії даних послідовностей ДНК, зокрема задача визначення апостеріорного розподілу часу до останнього спільного предка вибраних особин. Таке висновування є аналітично непіддатливим для багатьох демографічних моделей, але автори представили шляхи симуляції зрощених дерев згідно передбачуваних моделей. Вибірку з апостеріорного розподілу параметрів моделі було отримувано шляхом прийняття/відхилення припущень на підставі порівняння кількості відокремлених популяцій у синтетичних та реальних даних. За цією працею послідувало прикладне дослідження [en] (англ. Jonathan K. Pritchard) та ін. моделювання варіацій в людській Y-хромосомі із застосуванням методу ПБО. Нарешті, термін «приблизне баєсове обчислення» започаткували Марк Бомон (англ. Mark Beaumont) та ін., додатково розширивши методологію ПБО, та конкретніше обговоривши придатність підходу ПБО для задач у популяційній генетиці. Відтоді ПБО набуло поширення в застосуваннях за межами популяційної генетики, таких як системна біологія, епідеміологія або [en].
Метод
Обґрунтування
Поширене втілення теореми Баєса ставить у відповідність умовну ймовірність (або густину) певного значення параметра при заданих даних до ймовірності при заданому за правилом:
- ,
де позначає апостеріорне, — правдоподібність, — апріорне, а — свідчення (що також називають відособленою правдоподібністю, або апріорною передбачуваною правдоподібністю даних).
Апріорне представляє переконання про до того, як стало доступним , і його часто вказують, обираючи певний розподіл з набору добре відомих та піддатливих сімейств розподілів, так, щоби як обчислення апріорних ймовірностей, так і випадкова генерація значень були відносно безпосередніми. Для деяких різновидів моделей прагматичніше вказувати апріорне , застосовуючи розклад спільного розподілу всіх елементів в термінах послідовності їхніх умовних розподілів. Якщо цікавлять лише відносні ймовірності різних значень , то свідченням можна знехтувати, оскільки воно складає [en], що скасовується для будь-якого відношення апостеріорних імовірностей. Залишається, однак, необхідність обрахунку правдоподібності та апріорного . Для численних застосувань обрахунок правдоподібності є обчислювально витратним або й зовсім непіддатливим, що спонукає до застосування ПБО для обходу цієї проблеми.
Алгоритм відхилення ПБО
Всі методи на основі ПБО наближують функцію правдоподібності шляхом симуляцій, виходи яких порівнюють зі спостережуваними даними. Конкретніше, в алгоритмі відхилення ПБО, найбазовішій формі ПБО, спочатку вибирається набір точок параметрів з апріорного розподілу. Потім для заданої вибраної точки параметру симулюється набір даних згідно статистичної моделі , визначеної параметрами . Якщо ці згенеровані надто відрізняються від спостережуваних даних , то вибране значення параметру відхиляється. У точніших термінах, приймається з допуском , якщо:
- ,
де міра відстані визначає рівень розбіжності між та на основі заданої метрики (наприклад, евклідової відстані). Як правило, потрібен суворо додатній допуск, оскільки ймовірність того, що вихід симуляції точно збіжиться з даними (подія ) є незначною для всіх застосувань ПБО, крім найпримітивніших, що на практиці вело би до відхилення майже всіх вибраних точок параметрів. Виходом алгоритму відхилення ПБО є вибірка значень параметрів, розподілена приблизно відповідно до бажаного апостеріорного розподілу, та, найголовніше, отримана без потреби явного обчислення функції правдоподібності (мал. 1).
Зведена статистика
Ймовірність генерування набору даних з малою відстанню до зазвичай зменшується з ростом розмірності даних. Це призводить до суттєвого зменшення обчислювальної ефективності наведеного вище базового алгоритму відхилення ПБО. Загальним підходом до зменшення цієї проблеми є заміна набором зведеної статистики з меншою розмірністю, який обирається таким чином, щоби охопити доречну інформацію в . Критерій прийнятності в алгоритмі відхилення ПБО стає таким:
- .
Якщо зведена статистика є достатньою по відношенню до параметрів моделі , то отримуване таким чином підвищення ефективності не привносить жодних помилок. Дійсно, за визначенням, достатність означає, що всю інформацію в про охоплено в .
Як деталізовано нижче, ідентифікувати скінченномірний набір зведеної статистики за межами [en] зазвичай неможливо. Тим не менш, у випадках, коли висновування здійснюється методами ПБО, часто застосовуються інформативні, але, можливо, не достатні зведені статистики.
Приклад
Ілюстративним прикладом є бістабільна система, яку може бути охарактеризовано прихованою марковською моделлю (ПММ) в умовах зашумлених вимірювань (Мал. 2). Такі моделі використовують для багатьох біологічних систем: наприклад, їх можуть застосовувати до еволюції, сигнальних систем клітин, активації/деактивації, логічної обробки та нерівноважної термодинаміки. Наприклад, поведінка фактора транскрипції сигнального білка (англ. Sonic hedgehog, Shh) у чорночеревій дрозофілі може моделюватися за допомогою ПММ. (Біологічна) динамічна модель складається з двох станів: A та B. Якщо ймовірність переходу з одного стану до іншого визначається як в обох напрямках, то ймовірністю залишитися в тому ж стані на кожному такті є 1-. Ймовірністю виміряти стан правильно є (і навпаки, ймовірністю неправильного вимірювання є 1-).
Через умовні залежності між станами в різні моменти часу обчислення правдоподібності даних часових рядів є дещо нудним, що ілюструє спонукання до застосування ПБО. Обчислювальною проблемою для базового ПБО є велика розмірність даних у застосуваннях на кшталт цього. Її може бути зменшено застосуванням зведеної статистики S, що є частотою перемикань між двома станами. Як метрика відстані застосовується абсолютна відстань у поєднанні з допуском . Апостеріорне висновування стосовно параметра може бути здійснено шляхом п'ятьох кроків, представлених на мал. 1:
Крок 1: Припустімо, що спостережувані дані є послідовністю станів AAAABAABBAAAAAABAAAA, що було згенеровано з використанням та . Пов'язаною зведеною статистикою, кількістю перемикань між станами, в експериментальних даних є .
Крок 2: Виходячи з припущення, що про не відомо нічого, застосовується рівномірний апріорний розподіл на проміжку . Параметр вважається відомим та фіксованим у значенні, з яким генерувалися дані (), але в загальному випадку його може бути оцінено зі спостережень. З апріорного береться n точок параметрів, і модель симулюється для кожної з точок параметрів , що дає в результаті послідовностей симульованих даних. В цьому прикладі n=5, а кожен взятий параметр та симульований запис набору даних містяться в стовпчиках 2-3 таблиці 1. На практиці для отримання придатної інформації n повинно бути набагато більшим.
i | Симульовані набори даних (крок 2) | Зведена статистика (крок 3) | Відстань (крок 4) | Вихід (крок 4) | |
---|---|---|---|---|---|
1 | 0.08 | AABAAAABAABAAABAAAAA | 8 | 2 | прийнято |
2 | 0.68 | AABBABABAAABBABABBAB | 13 | 7 | відхилено |
3 | 0.87 | BBBABBABBBBABABBBBBA | 9 | 3 | відхилено |
4 | 0.43 | AABAAAAABBABBBBBBBBA | 6 | 0 | прийнято |
5 | 0.53 | ABBBBBAABBABBABAABBB | 9 | 3 | відхилено |
Крок 3: Зведена статистика обчислюється для кожної послідовності симульованих даних, (стовпчик 4 таблиці 1).
Крок 4: Відстані між спостережуваними та симульованими послідовностями переходів обчислюються для всіх точок параметрів (стовпчик 5 таблиці 1). Точки параметрів, для яких відстань є меншою або рівною , приймаються як приблизні приклади з апостеріорного (стовпчик 6 таблиці 1).
Крок 5: Апостеріорний розподіл наближується прийнятими точками параметрів. Апостеріорний розподіл повинен мати не-незначну ймовірність значень параметрів в області навколо істинного значення в системі, якщо дані є достатньо інформативними. В цьому прикладі масу апостеріорної ймовірності рівномірно поділено між значеннями 0.08 та 0.43.
Малюнок 3 показує апостеріорні ймовірності, отримані за допомогою ПБО та великого n з використанням або зведеної статистики у поєднанні з ( та ), або повної послідовності даних. Вони порівнюються зі справжнім апостеріорним, що може бути обчислено точно та ефективно за допомогою алгоритму Вітербі. Використана зведена статистика не є достатньою, і це видно з того, що навіть при відхилення від теоретичного апостеріорного є значним. Слід зазначити, що для отримання апостеріорного, що буде зосереджено навколо справжнього значення (), знадобиться значно довша послідовність даних спостережень.
Цей приклад застосування ПБО використовує спрощення для ілюстративних цілей. Ряд оглядових статей пропонують посилання на реалістичніші застосування ПБО.
Порівняння моделей за допомогою ПБО
Крім оцінки параметрів, модель ПБО може застосовуватися для обчислення апостеріорних імовірностей різних моделей-кандидатів. У таких застосуваннях однією з можливостей є застосування відхилення-вибірки в ієрархічному порядку. Спершу з апріорного розподілу моделей береться модель; потім, для взятої моделі, параметри моделі вибираються з апріорного розподілу, що відповідає цій моделі. Нарешті, симуляція виконується так, як в одномодельному ПБО. Тепер відносні частоти прийняття для різних моделей наближують апостеріорний розподіл для цих моделей. Знову ж таки, пропонувалися обчислювальні вдосконалення ПБО у просторі моделей, такі як побудова [en] в сукупному просторі моделей та параметрів.
Щойно оцінено апостеріорні ймовірності моделей, можна повною мірою скористатися методиками баєсового порівняння моделей. Наприклад, для порівняння відносних імовірностей двох моделей та можна обчислювати їхнє апостеріорне відношення, що пов'язане з коефіцієнтом Баєса :
- .
Якщо апріорні моделей є однаковими (), коефіцієнт Баєса дорівнює відношенню апостеріорних.
На практиці, як обговорюється нижче, ці заходи можуть бути дуже чутливими до вибору параметрів апріорних розподілів та зведеної статистики, і, таким чином, висновки з порівняння моделей слід робити з обережністю.
Пастки, та засоби подолання
Джерело помилки | Потенційна проблема | Розв'язання | Розділ |
---|---|---|---|
Ненульовий допуск ε | Неточність вносить відхилення до обчислюваного апостеріорного розподілу. | Теоретичні/практичні дослідження чутливості апостеріорного розподілу до допуску. Зашумлене ПБО. | #Наближення апостеріорного |
Не достатня зведена статистика | Втрата інформації призводить до роздування ймовірних інтервалів. | Автоматичний вибір / напівавтоматична ідентифікація достатньої статистики. Перевірки достовірності моделі (напр., Темплтон, 2009). | #Вибір та достатність зведеної статистикиВибір та достатність зведеної статистики |
Мала кількість моделей / Невірно вказані моделі | Досліджувані моделі не є репрезентативними / брак передбачувальної сили. | Ретельний відбір моделей. Оцінка передбачувальної сили. | #Мала кількість моделей |
Апріорні та діапазони параметрів | Висновки можуть бути чутливими до вибору апріорних. Вибір моделі може бути безглуздим. | Перевіряти чутливість коефіцієнтів Баєса до вибору апріорних. Доступні деякі теоретичні результати стосовно вибору апріорних. Використовувати альтернативні методи перевірки достовірності моделей. | #Апріорний розподіл та діапазони параметрів |
Прокляття розмірності | Низький темп прийняття параметрів. Помилки моделей неможливо відрізнити від недостатньої дослідженості простору параметрів. Ризик перенавчання. | Методи зменшення моделей, якщо вони застосовні. Методи для прискорення дослідження параметрів. Контроль якості для виявлення перенавчання. | #Прокляття розмірності |
Ранжування моделей зі зведеною статистикою | Розрахунок коефіцієнтів Баєса на зведеній статистиці може не відповідати коефіцієнтам Баєса на вихідних даних, що може призводити до видачі безглуздих результатів. | Використовувати лише такі зведені статистики, що задовольняють необхідні та достатні вимоги для отримання несуперечливого баєсового вибору моделі. Застосовувати альтернативні методи перевірки достовірності моделі. | #Коефіцієнт Баєса з ПБО та зведеною статистикою |
Реалізація | Низький захист загальних припущень у процесах симуляції та висновування. | Перевірка працездатності за результатами. Стандартизація програмного забезпечення. | #Обов'язкові перевірки якості |
Як і для всіх статистичних методів, для застосування методів на основі ПБО до реальних задач моделювання є обов'язково необхідним ряд припущень та наближень. Наприклад, встановлення параметра допуску в нуль забезпечує точний результат, але зазвичай робить обчислення занадто витратним. Тому на практиці застосовуються значення більше нуля, що вносить відхилення. Також, достатні зведені статистики зазвичай не є доступними, і натомість застосовуються інші зведені статистики, що привносить додаткове відхилення в силу втрати інформації. Додаткові джерела відхилення, наприклад, у контексті вибору моделі, можуть бути витонченішими.
В той же час, деякі з критичних зауважень, спрямовані на методи ПБО, зокрема в галузі [en], стосуються не особливостей ПБО, а всіх баєсових методів, або навіть всіх статистичних методів (наприклад, вибір апріорного розподілу та діапазонів параметрів). Тим не менш, через здатність методів ПБО мати справу із значно складнішими моделями, деякі з цих загальних пасток мають особливе значення в контексті аналізу ПБО.
В цьому розділі обговорюються ці потенційні ризики, та робиться огляд можливих шляхів їхнього подолання (таблиця 2).
Наближення апостеріорного
Не-незначний дається такою ціною, що вибірка робиться з замість справжнього апостеріорного . За достатньо малого допуску та чутливої метрики відстані, отримуваний в результаті розподіл повинен часто наближувати справжній цільовий розподіл достатньо добре. З іншого боку, настільки великий допуск, що кожна з точок простору параметрів стає прийнятою, видасть дублікат апріорного розподілу. Існують емпіричні дослідження різниці між та як функції від , та теоретичні результати для верхньої межі помилки оцінок параметрів у залежності від . Також було досліджено точність апостеріорного (визначену як очікувані квадратичні втрати), що породжує ПБО, як функцію від . Тим не менш, збіжність розподілів при наближенні до нуля та її залежність від застосовуваної метрики відстані є важливою темою, що ще має бути досліджено докладніше. Зокрема, залишається складним відокремити помилки, внесені цим наближенням, від помилок через неправильне визначення моделі.
Як спроба виправлення деяких із помилок, спричинених ненульовим , було запропоновано використання з ПБО локальної зваженої лінійної регресії, щоби зменшити розбіжність апостеріорних оцінок. Цей метод призначає вагові коефіцієнти параметрам у відповідності до того, наскільки добре симульовані підсумки відповідають спостережуваним, і виконує лінійну регресію між підсумками та зваженими параметрами в околі спостережуваних підсумків. Отримувані коефіцієнти регресії використовуються для коригування параметрів, що обираються, в напрямку спостережуваних підсумків. Було запропоновано вдосконалення у вигляді нелінійної регресії із застосуванням штучної нейронної мережі прямого поширення. Проте, було показано, що апостеріорні розподіли, отримані із застосуванням цих підходів, не завжди конзистентні з апріорним розподілом, і відтак запропоновано переформулювання налаштувань регресії, яке бере до уваги апріорний розподіл.
Нарешті, статистичне висновування із застосуванням ПБО з ненульовим допуском не є властиво вадливим: за припущення наявності помилок вимірювання може бути фактично показано, що оптимальний є не нульовим. Дійсно, відхилення, спричинене ненульовим допуском, може бути характеризовано та компенсовано введенням певного виду шуму до зведеної статистики. Було встановлено асимптотичну конзистентність такого «зашумленого ПБО», а також формули асимптотичної дисперсії оцінок параметрів для фіксованого допуску.
Вибір та достатність зведеної статистики
Зведена статистика може застосовуватися для збільшення темпу прийняття ПБО для даних високої розмірності. Для цієї мети оптимальною є достатня зведена статистика невисокої розмірності, оскільки вона охоплює всю доречну інформацію, що є в даних, у найпростішому вигляді з можливих. Однак, достатні статистики низької розмірності зазвичай є недосяжними для тих статистичних моделей, для яких висновування на основі ПБО є найдоречнішим, і тому для знаходження зведених статистик невеликої розмірності зазвичай потрібна певна евристика. Використання набору погано обраної зведеної статистики часто призводить до роздування ймовірних інтервалів з причини закладеної втрати інформації, що також може вносити відхилення й до розрізнення моделей. Існує огляд методів обрання зведених статистик, що може слугувати гарним керівництвом на практиці.
Одним з підходів для охоплення якомога більше наявної в даних інформації було би використання багатьох статистик, але виявляється, що точність та стабільність ПБО швидко знижуються зі збільшенням числа зведених статистик. Натомість кращою стратегією є фокусуватися лише на доречних статистиках — доречність відносно проблеми висновування в цілому, використовуваної моделі, та даних, що є в розпорядженні.
Було запропоновано алгоритм ідентифікації репрезентативної підмножини зведених статистик шляхом оцінювання, чи привносить додаткова статистика значущу зміну до апостеріорного. Однією з проблем тут є те, що велика помилка наближення ПБО може сильно вплинути на висновки про корисність статистики на будь-якому кроці цієї процедури. Інший метод розкладається на два основних кроки. Спершу будується контрольне апостеріорне шляхом мінімізації ентропії. Потім набори-кандидати статистик оцінюються шляхом порівняння наближених за допомогою ПБО апостеріорних із контрольним апостеріорним.
За обох цих стратегій підмножина статистик обирається з більшого набору статистик-кандидатів. Натомість, підхід [en] використовує інформацію з усіх статистик-кандидатів, кожної з відповідним ваговим коефіцієнтом. Останнім часом значний інтерес привернув метод побудови зведених статистик напівавтоматичним способом. Цей метод засновано на спостереженні, що оптимальний вибір зведених статистик при мінімізації квадратичних втрат оцінок точок параметрів може бути отримано через апостеріорне середнє параметрів, яке наближується виконанням лінійної регресії на основі симульованих даних.
Істотне значення матимуть методи ідентифікації зведених статистик, що могли би також одночасно оцінювати вплив на наближення апостеріорного. Причина в тому, що вибір зведених статистик та вибір допуску складають два джерела помилки в отримуваному в результаті апостеріорному розподілі. Ці помилки можуть спотворювати ранжування моделей, а також можуть призводити до неточних передбачень моделей. Дійсно, жоден із наведених вище методів не оцінює вибір зведених статистик з метою вибору моделі.
Коефіцієнт Баєса з ПБО та зведеною статистикою
Було показано, що поєднання не достатньої зведеної статистики та ПБО може бути проблематичним для вибору моделі. Справді, якщо позначити коефіцієнт Баєса на основі зведеної статистики як , то співвідношення між та набуває такого вигляду:
- .
Отже, зведена статистика є достатньою для порівняння двох моделей та якщо і лише якщо
- ,
що дає в результаті . З наведеного вище рівняння також ясно, що може існувати величезна різниця між та , якщо ця умова не задовольняється, що може бути показано на іграшкових прикладах. Врешті-решт було показано, що достатність для або по одному, або для обох моделей, не гарантує достатності для ранжування моделей. Проте, також було показано, що будь-яка достатня зведена статистика для моделі , в якій обидві моделі та є [en], є чинною для ранжування [en].
Обчислення коефіцієнтів Баєса на може відтак бути оманливим для цілей вибору моделі, якщо відношення між коефіцієнтами Баєса на та не буде відомим, або хоча б не буде достатньо добре наближуваним. Крім того, нещодавно було отримано необхідні та достатні умови на зведену статистику для стійкого баєсового вибору моделі, що можуть слугувати корисним керівництвом.
Тим не менш, це питання має відношення лише до такого вибору моделі, коли розмірність даних було зменшено. Висновування на основі ПБО, в якому порівнюються безпосередньо справжні набори даних, як у деяких застосуваннях в системній біології (наприклад, див.), уникає цієї проблеми.
Обов'язкові перевірки якості
Як стає зрозумілим із попереднього обговорення, будь-який ПБО-аналіз вимагає здійснення вибору та компромісів, що можуть мати значний вплив на його результати. А саме, вибір альтернативних моделей/гіпотез, кількості симуляцій, вибір зведеної статистики або порогового допуску наразі не можуть ґрунтуватися на загальних правилах; вплив цього вибору має оцінюватись і перевірятись у кожному дослідженні.
Було запропоновано ряд евристичних підходів до контролю якості ПБО, таких як кількісне вираження частки дисперсії параметру, що пояснюється зведеною статистикою. Звичайний клас методів націлено на визначення того, чи видає висновування вірні результати, не залежно від фактично спостережуваних даних. Наприклад, для заданого набору значень параметру, що зазвичай вибирається з апріорного або апостеріорного розподілів моделі, можна згенерувати велику кількість штучних наборів даних. Таким чином, якість та надійність висновування ПБО може бути оцінено в контрольованих умовах, шляхом здійснення замірів, наскільки добре обране висновування ПБО виявляє справжні значення параметру, а також моделює, чи декілька структурно відмінних моделей розглядаються одночасно.
Інший клас методів визначає, чи було висновування успішним у світлі заданих спостережуваних даних, наприклад, шляхом порівняння [en] зведеної статистики зі спостережуваною зведеною статистикою. Крім того, перспективні майбутні стратегії оцінки стабільності висновувань ПБО та їхньої передбачувальної достовірності за межами вибірки представляють методики перехресного затверджування та [en]. Це особливо важливо при моделюванні великих масивів даних, оскільки в такому випадку апостеріорна підтримка певної моделі може видаватися надзвичайно переконливою, хоча всі запропоновані моделі фактично є поганим представленням стохастичної системи, що стоїть за спостережуваними даними. Передбачувальні перевірки за межами вибірки можуть виявляти потенційні систематичні відхилення в межах моделі й пропонувати ключ до того, як вдосконалити її структуру або параметризацію.
Цікаво, що нещодавно було запропоновано принципово нові підходи для вибору моделі, що включають контроль якості як невід'ємний крок процесу. ПБО за своєю будовою дозволяє оцінювати розбіжності між спостережуваними даними та передбаченнями моделі по відношенню до вичерпного набору статистик. Ці статистики не обов'язково є такими ж, як ті, що застосовуються в критерії прийняття. Отримувані розподіли розбіжностей застосовувались для вибору моделей, що узгоджуються з багатьма аспектами даних одночасно, і суперечність моделі виявляється з конфліктних та співзалежних зведених статистик. Інший метод вибору моделі на основі контролю якості залучає ПБО для наближення ефективної кількості параметрів моделі та відхилень передбачуваних апостеріорних розподілів зведених статистик та параметрів. Потім застосовується [en] як міра придатності моделі. Також було показано, що моделі, яким віддано перевагу за цим критерієм, можуть конфліктувати з тими, які підтримуються коефіцієнтами Баєса. З цієї причини корисно комбінувати різні методи вибору моделей для отримання правильних висновків.
Перевірки якості є досяжними, й дійсно виконуються в багатьох працях, що ґрунтуються на ПБО, але для деяких задач оцінка впливу пов'язаних із методом параметрів може бути складним завданням. Тим не менш, можна очікувати, що використання ПБО, яке швидко зростає, забезпечить глибше розуміння обмежень та застосовності цього методу.
Загальні ризики статистичного висновування, що загострюються в ПБО
В цьому розділі зроблено огляд ризиків, що, суворо кажучи, не є характерними саме для ПБО, а стосуються так само й інших статистичних методів. Проте гнучкість, яку пропонує ПБО для аналізу дуже складних моделей, робить їхнє обговорення тут дуже доречним.
Апріорний розподіл та діапазони параметрів
Специфікація діапазонів та апріорного розподілу параметрів сильно виграє від попередніх знань про властивості системи. Одним із критичних зауважень було те, що в деяких дослідженнях «діапазони та розподіли параметрів всього лише вгадуються на підставі суб'єктивної думки дослідників», що пов'язано із класичними запереченнями баєсових підходів.
За будь-якого обчислювального методу зазвичай необхідно обмежити досліджувані діапазони параметрів. Ці діапазони параметрів повинні за можливості визначатися на підставі відомих властивостей досліджуваної системи, але для практичних застосувань можуть робити необхідним освічене припущення. Тим не менш, доступні теоретичні результати стосовно об'єктивних апріорних, що можуть наприклад ґрунтуватися на [en] або [en]. З іншого боку, автоматизовані або напівавтоматизовані методи вибору апріорного розподілу часто видають некоректні густини. Оскільки більшість процедур ПБО вимагають генерування вибірок з апріорного, некоректні апріорні не є безпосередньо застосовними в ПБО.
При виборі апріорного розподілу слід також мати на увазі мету аналізу. В принципі, неінформативні та пласкі апріорні, що підкреслюють наше суб'єктивне незнання про параметри, все ж таки можуть видавати прийнятні оцінки параметрів. Проте коефіцієнти Баєса є дуже чутливими до апріорного розподілу параметрів. Висновки про вибір моделі на підставі коефіцієнтів Баєса можуть виявитися оманливими, якщо не обміркувати ретельно чутливість висновків до вибору апріорних.
Мала кількість моделей
Методи на основі моделей піддавалися критиці через не вичерпне покриття простору гіпотез. Дійсно, дослідження на основі моделей обертаються навколо невеликої кількості моделей, і з причини високих обчислювальних витрат на оцінку однієї моделі в деяких випадках може бути складно покрити велику частину простору гіпотез.
Верхня межа кількості моделей-кандидатів, що розглядаються, зазвичай встановлюється значними зусиллями, необхідними для визначення моделей та для вибору між багатьма альтернативними варіантами. Не існує загальноприйнятої процедури побудови моделі саме для ПБО, тому натомість застосовуються досвід та попередні знання. Хоч надійніша процедура для апріорного вибору моделі та формулювання й була би корисною, універсальної стратегії розробки моделі в статистиці не існує: чутливі характеристики складних систем завжди робитимуть необхідною велику кількість детективної праці та використання експертних знань з предметної області.
Деякі опоненти ПБО стверджують, що оскільки реалістично можуть розглядатися лише декілька моделей, суб'єктивно вибрані та ймовірно всі неправильні, то аналіз ПБО пропонує лише обмежене розуміння. Проте існує важлива відмінність між ідентифікацією правдоподібної нульової гіпотези, та оцінкою відносної придатності альтернативних гіпотез. Оскільки в контексті складних моделей вкрай рідко може бути висунуто корисні нульові гіпотези, що є потенційно справедливими, то передбачувальна здатність статистичних моделей як пояснення складних явищ є набагато важливішою за перевірку статистичних нульових гіпотез у цьому контексті. Також для отримування висновків про особливості моделі (наприклад, значень параметрів) та здійснення передбачень є звичним робити усереднення досліджуваних моделей, зважених на підставі їхньої відносної правдоподібності.
Великі набори даних
Великі набори даних можуть утворювати обчислювальне вузьке місце для методів на основі моделей. Було, наприклад, вказано, що в деяких аналізах на основі ПБО частину даних має бути опущено. Ряд авторів стверджують, що великі набори даних не становлять практичного обмеження, хоча суворість цієї проблеми сильно залежить від характеристик моделей. Деякі аспекти задачі моделювання, такі як розмір вибірки, кількість спостережуваних змінних або властивостей, часова або просторова роздільна здатність тощо, можуть сприяти обчислювальній складності. Проте зі збільшенням обчислювальних потужностей ця проблема потенційно ставатиме менш важливою.
Замість вибирання параметрів для кожної симуляції з апріорного, як альтернативу було запропоновано поєднувати з ПБО алгоритм Метрополіса — Гастінгса, що, як було повідомлено, дає вищий темп прийняття, ніж чисте ПБО. Природно, такий підхід успадковує загальні обтяження методів МКМЛ, такі як складність оцінювання збіжності, кореляцію серед вибірок з апостеріорного та відносно слабку розпаралелюваність.
Так само для середовища ПБО було адаптовано [en] (англ. sequential Monte Carlo, SMC) та сукупнісний (англ. population Monte Carlo, PMC) методи Монте-Карло. Загальна ідея полягає в ітеративному підході до апостеріорного з апріорного через послідовність цільових розподілів. Перевагою таких методів у порівнянні з ПБО-МКМЛ є те, що вибірки з отримуваного в результаті апостеріорного є незалежними. На додачу, послідовні методи не вимагають вказання рівнів допуску до початку аналізу, вони регулюються адаптивно.
Розпаралелювання ряду кроків алгоритмів ПБО на основі відхилювальної вибірки та [en] є відносно простим. Також було продемонстровано, що паралельні алгоритми можуть привносити суттєве прискорення до висновування на основі МКМЛ у філогенетиці, і вони можуть бути придатним підходом також і для методів на основі ПБО. Крім того, адекватна модель складної системи, швидше за все, вимагатиме інтенсивних обчислень не залежно від обраного методу висновування, і це користувачеві обирати метод, що буде придатним для певного застосування, що розглядається.
Прокляття розмірності
Для отримання прийнятного рівня точності висновування апостеріорного набори даних високої розмірності та простори параметрів високої розмірності можуть вимагати симуляції в дослідженні на основі ПБО надзвичайно великої кількості точок параметрів. В таких ситуаціях обчислювальні витрати сильно зростають, і здатні в найгіршому випадку зробити обчислювальний аналіз непіддатливим. Вони є прикладами добре відомих явищ, що позначають узагальнювальним терміном «прокляття розмірності».
Для оцінки того, наскільки серйозно розмірність даних впливає на аналіз у контексті ПБО, було виведено аналітичні формули помилки оцінювачів ПБО як функції від розмірності зведеної статистики. Крім того, Блум (англ. Blum) та Франсуа (англ. François) дослідили, як розмірність зведеної статистики пов'язана із середньоквадратичною помилкою для різних коригувань помилки оцінювачів ПБО. Було також відзначено, що методики зменшення розмірності є корисними для уникання прокляття розмірності через те, що базова структура зведеної статистики потенційно має меншу розмірність. Керуючись мінімізацією квадратичних втрат оцінювачів ПБО, Фіернхед (англ. Fearnhead) та Пренгл (англ. Prangle) запропонували схему проектування даних (можливо, великої розмірності) на оцінки апостеріорних середніх значень параметрів; цей засіб, що тепер має ту ж розмірність, що й параметри, потім використовується як зведена статистика для ПБО.
ПБО може застосовуватися для задач висновування в параметричних просторах високої розмірності, хоча слід брати до уваги можливість перенавчання (наприклад, див. методи вибору моделі в та). Тим не менш, імовірність прийняття симульованих значень параметрів за заданого допуску в алгоритмі відхилення ПБО, як правило, зменшується експоненційно зі збільшенням розмірності простору параметрів (через глобальний критерій прийняття). Хоча жоден обчислювальний метод (чи то на основі ПБО, чи ні) не видається здатним до подолання прокляття розмірності, нещодавно було розроблено методи, щоби впоруватися з просторами параметрів високої розмірності за певних припущень (наприклад, на основі поліноміального наближення розріджених ґраток, що потенційно може сильно зменшувати час симуляції для ПБО). Тим не менше, застосовність цих методів залежить від задачі, і недооцінювати складність дослідження простору параметрів у загальному випадку не можна. Наприклад, введення детерміністського глобального оцінювання параметрів призвело до повідомлень, що глобальні оптимуми, отримані в декількох попередніх дослідженнях задач низької розмірності, були неправильними. Тому для деяких задач може бути складно зрозуміти, чи є неправильною модель, як обговорювалося вище, чи досліджена область простору параметрів є невідповідною. Прагматичнішим підходом може бути скорочення масштабів задачі шляхом скорочення моделі.
Програмне забезпечення
В даний час доступний ряд програмних пакетів для застосування ПБО до певних класів статистичних моделей. В таблиці 3 представлено добірку програмного забезпечення на основі ПБО.
Програма | Ключові слова та властивості | Посилання |
---|---|---|
DIY-ABC | Програма для підгонки генетичних даних до складних ситуацій. Порівняння моделей-конкурентів. Оцінювання параметрів. Обчислення мір відхилення та точності для заданої моделі та відомих значень параметрів. | |
abc R package | Декілька алгоритмів ПБО для виконання оцінки параметрів та вибору моделі. Методи нелінійної гетероскедастичної регресії для ПБО. Інструмент перехресної перевірки. | |
EasyABC R package | Декілька алгоритмів для виконання ефективних схем вибірки ПБО, включно з 4 послідовними схемами вибірки та 3 схемами МКМЛ. | |
ABC-SysBio | Пакет Python. Отримування висновків про параметри та обирання моделі для динамічних систем. Поєднує вибірку ПБО з відхиленням, [en] ПБО для отримування висновків про параметри та ПМК ПБО для вибору моделі. Сумісний з моделями, написаним мовою [en] (SBML). Детерміновані та стохастичні моделі. | |
ABCtoolbox | Відкрита програма з багатьма алгоритмами ПБО, включно з вибіркою з відхиленням, МКМЛ без правдоподібності, вибіркою на базі частинок та ЗЛМ-ПБО. Сумісність з багатьма програмами симуляції та обчислення зведених статистик. | |
msBayes | Відкритий програмний пакет, що складається з кількох програм C та R, що запускаються інтерфейсною програмою Perl. Ієрархічні зрощені моделі. Дані популяційної генетики з кількох співрозповсюджених видів. | |
PopABC | Програмний пакет для отримування висновків про схему демографічної розбіжності. Зрощена симуляція. Баєсове обирання моделі. | |
ONeSAMP | Вебпрограма для оцінки ефективного розміру популяції з вибірки мікросателітних генотипів. Оцінки ефективного розміру популяції, разом з 95-відсотковими ймовірними інтервалами. | |
Програмне забезпечення для оцінки [en] для домінантних даних. | ||
2-подійна баєсова [en] (Bayesian ADmixture). Програмне забезпечення, що підтримує до двох незалежних подій домішки й до трьох батьківських популяцій. Оцінка декількох параметрів (домішка, ефективні розміри тощо). Порівняння пар домішкових моделей. |
Придатність окремих програмних пакетів залежить від конкретних програм, що є в розпорядженні, комп'ютерного середовища, та потрібних алгоритмів.
Див. також
- Методи Монте-Карло марковських ланцюгів
- [en]
- [en]
Примітки
Ця стаття містить текст із журналу PLoS Computational Biology під ліцензією Creative Commons Attribution 2.5.
- Rubin DB (1984) Bayesianly Justifiable and Relevant Frequency Calculations for the Applies Statistician. The Annals of Statistics 12: pp. 1151—1172. (англ.)
- Diggle PJ, J. GR. (1984) Monte Carlo Methods of Inference for Implicit Statistical Models. Journal of the Royal Statistical Society, Series B 46:193-227. (англ.)
- Bartlett MS (1963) The spectral analysis of point processes. Journal of the Royal Statistical Society, Series B 25:264-296 (англ.)
- Hoel DG, Mitchell TJ (1971) The simulation, fitting and testing of a stochastic cellular proliferation model. Biometrics, 27, 191—199. (англ.)
- Tavare S, Balding DJ, Griffiths RC et al. (1997) Inferring Coalescence Times From DNA Sequence Data, Genetics 145:505-518. (англ.)
- Pritchard JK, Seielstad MT, Perez-Lezaun A et al. (1999) Population Growth of Human Y Chromosomes: A Study of Y Chromosome Microsatellites, Molecular Biology and Evolution 16:1791-1798. (англ.)
- Beaumont MA, Zhang W, Balding DJ (2002) Approximate Bayesian Computation in Population Genetics. Genetics 162: 2025—2035. (англ.)
- Busetto A.G., Buhmann J. Stable Bayesian Parameter Estimation for Biological Dynamical Systems.; 2009. IEEE Computer Society Press pp. 148—157. (англ.)
- Beaumont MA (2010) Approximate Bayesian Computation in Evolution and Ecology. Annual Review of Ecology, Evolution, and Systematics 41: 379-406. (англ.)
- Bertorelle G, Benazzo A, Mona S (2010) ABC as a flexible framework to estimate demography over space and time: some cons, many pros. Molecular Ecology 19: 2609—2625. (англ.)
- Csilléry K, Blum MGB, Gaggiotti OE, François O (2010) Approximate Bayesian Computation (ABC) in practice. Trends in Ecology & Evolution 25: 410—418. (англ.)
- Didelot X, Everitt RG, Johansen AM, Lawson DJ (2011) Likelihood-free estimation of model evidence. Bayesian Analysis 6: 49-76. (англ.)
- Lai K, Robertson MJ, Schaffer DV (2004) The sonic hedgehog signaling system as a bistable genetic switch., Biophys J.: 86,2748-2757. (англ.)
- Marin JM, Pudlo P, Robert CP, Ryder RJ (2012) Approximate Bayesian computational methods, Statistics and Computing, 22(6), 1167—1180 (англ.)
- Wilkinson, R. G. (2007). Bayesian Estimation of Primate Divergence Times, Ph.D. thesis, University of Cambridge. (англ.)
- Grelaud A, Marin J-M, Robert C, Rodolphe F, Tally F (2009) Likelihood-free methods for model choice in Gibbs random fields. Bayesian Analysis 3: 427—442. (англ.)
- Toni T, Stumpf MPH (2010). Simulation-based model selection for dynamical systems in systems and population biology, Bioinformatics 26 (1):104–10. (англ.)
- [en] (2009) Why does a method that fails continue to be used? The answer. Evolution 63: 807—812. (англ.)
- Robert CP, Cornuet J-M, Marin J-M, Pillai NS (2011) Lack of confidence in approximate Bayesian computation model choice. Proc Natl Acad Sci U S A 108: 15112-15117. (англ.)
- Templeton AR (2008) Nested clade analysis: an extensively validated method for strong phylogeographic inference. Molecular Ecology 17: 1877—1880. (англ.)
- Templeton AR (2009) Statistical hypothesis testing in intraspecific phylogeography: nested clade phylogeographical analysis vs. approximate Bayesian computation. Molecular Ecology 18: 319—331. (англ.)
- Berger JO, Fienberg SE, Raftery AE, Robert CP (2010) Incoherent phylogeographic inference. Proceedings of the National Academy of Sciences of the United States of America 107: E157-E157. (англ.)
- Sisson SA, Fan Y, Tanaka MM (2007) Sequential Monte Carlo without likelihoods. Proc Natl Acad Sci U S A 104: 1760—1765.
- Dean TA, Singh SS, Jasra A, Peters GW (2011) Parameter estimation for hidden markov models with intractable likelihoods. arXiv:11035399v1 [mathST] 28 Mar 2011. (англ.)
- Fearnhead P, Prangle D (2011) Constructing Summary Statistics for Approximate Bayesian Computation: Semi-automatic ABC. ArXiv:10041112v2 [statME] 13 Apr 2011.
- Blum M, Francois O (2010) Non-linear regression models for approximate Bayesian computation. Stat Comp 20: 63-73. (англ.)
- Leuenberger C, Wegmann D (2009) Bayesian Computation and Model Selection Without Likelihoods. Genetics 184: 243—252. (англ.)
- Wilkinson RD (2009) Approximate Bayesian computation (ABC) gives exact results under the assumption of model error. arXiv:08113355. (англ.)
- Blum MGB, Nunes MA, Prangle D, Sisson SA (2012) A comparative review of dimension reduction methods in approximate Bayesian computation. arxiv.org/abs/1202.3819 (англ.)
- Nunes MA, Balding DJ (2010) On optimal selection of summary statistics for approximate Bayesian computation. Stat Appl Genet Mol Biol 9: Article 34. (англ.)
- Joyce P, Marjoram P (2008) Approximately sufficient statistics and bayesian computation. Stat Appl Genet Mol Biol 7: Article 26. (англ.)
- Wegmann D, Leuenberger C, Excoffier L (2009) Efficient approximate Bayesian computation coupled with Markov chain Monte Carlo without likelihood. Genetics 182: 1207—1218. (англ.)
- Marjoram P, Molitor J, Plagnol V, Tavare S (2003) Markov chain Monte Carlo without likelihoods. Proc Natl Acad Sci U S A 100: 15324-15328. (англ.)
- Marin J-M, Pillai NS, Robert CP, Rousseau J (2011) Relevant statistics for Bayesian model choice. ArXiv:11104700v1 [mathST] 21 Oct 2011: 1-24. (англ.)
- Toni T, Welch D, Strelkowa N, Ipsen A, Stumpf M (2007) Approximate Bayesian computation scheme for parameter inference and model selection in dynamical systems. J R Soc Interface 6: 187—202. (англ.)
- Arlot S, Celisse A (2010) A survey of cross-validation procedures for model selection. Statistical surveys 4: 40-79. (англ.)
- Dawid A Present position and potential developments: Some personal views: Statistical theory: The prequential approach. Journal of the Royal Statistical Society, Series A 1984: 278—292. (англ.)
- Vehtari A, Lampinen J (2002) Bayesian model assessment and comparison using cross-validation predictive densities. Neural Computation 14: 2439—2468. (англ.)
- Ratmann O, Andrieu C, Wiuf C, Richardson S (2009) Model criticism based on likelihood-free inference, with an application to protein network evolution. Proceedings of the National Academy of Sciences of the United States of America 106: 10576-10581. (англ.)
- Francois O, Laval G (2011) Deviance Information Criteria for Model Selection in Approximate Bayesian Computation. Stat Appl Genet Mol Biol 10: Article 33. (англ.)
- Templeton AR (2010) Coherent and incoherent inference in phylogeography and human evolution. Proceedings of the National Academy of Sciences of the United States of America 107: 6376-6381. (англ.)
- Beaumont MA, Nielsen R, Robert C, Hey J, Gaggiotti O, et al. (2010) In defence of model-based inference in phylogeography. Molecular Ecology 19: 436—446. (англ.)
- Jaynes ET (1968) Prior Probabilities. IEEE Transactions on Systems Science and Cybernetics 4. (англ.)
- Berger, J. O. (2006). The case for objective Bayesian analysis. Bayesian Analysis 1 385—402 and 457—464. (англ.)
- Beaumont MA, Cornuet J-M, Marin J-M, Robert CP (2009) Adaptive approximate Bayesian computation. Biometrika 96: 983—990. (англ.)
- Del Moral P, Doucet A, Jasra A (2011 (in press)) An adaptive sequential Monte Carlo method for approximate Bayesian computation. Statistics and computing. (англ.)
- Feng X, Buell DA, Rose JR, Waddellb PJ (2003) Parallel Algorithms for Bayesian Phylogenetic Inference. Journal of Parallel and Distributed Computing 63: 707—718. (англ.)
- Bellman R (1961) Adaptive Control Processes: A Guided Tour: Princeton University Press. (англ.)
- Blum MGB (2010) Approximate Bayesian Computation: a nonparametric perspective, Journal of the American Statistical Association (105): 1178—1187 (англ.)
- Fearnhead P, Prangle D (2012) Constructing summary statistics for approximate Bayesian computation: semi-automatic approximate Bayesian computation, Journal of the Royal Statistical Society, Series B 74(3): 419—474. (англ.)
- Gerstner T, Griebel M (2003) Dimension-Adaptive Tensor-Product Quadrature. Computing 71: 65-87. (англ.)
- Singer AB, Taylor JW, Barton PI, Green WH (2006) Global dynamic optimization for parameter estimation in chemical kinetics. J Phys Chem A 110: 971—976. (англ.)
- Cornuet J-M, Santos F, Beaumont M, et al. (2008) Inferring population history with DIY ABC: a user-friendly approach to approximate Bayesian computation, Bioinformatics, 24(23): 2713—2719 (англ.)
- Csilléry K, François O, Blum MGB (2012), abc: an R package for approximate Bayesian computation (ABC) Methods in Ecology and Evolution, 3: 475—479 (англ.)
- Csillery, K; Francois, O; Blum, MGB (21 лютого 2012). Approximate Bayesian Computation (ABC) in R: A Vignette (PDF). Процитовано 10 May 2013.
- Jabot, F; Faure, T; Dumoulin, N. EasyABC: performing efficient approximate Bayesian computation sampling schemes using R. Methods in Ecology and Evolution, 4: 684–687.
- Jabot, F; Faure, T; Dumoulin, N (3 червня 2013). (PDF). Архів оригіналу (PDF) за 18 серпня 2016. Процитовано 3 серпня 2016.
- Liepe J, Barnes C, Cule E, Erguler K, Kirk P, Toni T, Stumpf MP (2010) ABC-SysBio—approximate Bayesian computation in Python with GPU support, Bioinformatics, 26: 1797—1799 (англ.)
- Wegmann D, Leuenberger C, Neuenschwander S, Excoffier L (2010) ABCtoolbox: a versatile toolkit for approximate Bayesian computations. BMC Bioinformatics 11: 116. (англ.)
- Hickerson MJ, Stahl E, Takebayashi N (2007) msBayes: Pipeline for testing comparative phylogeographic histories using hierarchical approximate Bayesian computation, BMC Bioinformatics, 8, 268: 1471—2105 (англ.)
- Lopes JS, Balding D, Beaumont MA (2009) PopABC: a program to infer historical demographic parameters, Bioinformatics, 25: 2747—2749 (англ.)
- Tallmon DA, Koyuk A, Luikart G, Beaumont MA (2008) COMPUTER PROGRAMS: onesamp: a program to estimate effective population size using approximate Bayesian computation, Molecular Ecology Resources, 8: 299—301 (англ.)
- Foll M, Baumont MA, Gaggiotti OE (2008) An Approximate Bayesian Computation approach to overcome biases that arise when using AFLP markers to study population structure, Genetics, 179: 927—939 (англ.)
- Bray TC, Sousa VC, Parreira B, Bruford MW, Chikhi L (2010) 2BAD: an application to estimate the parental contributions during two independent admisture events, Molecular Ecology Resources, 10(3): 538—541 (англ.)
Посилання
- Darren Wilkinson (31 березня 2013). Introduction to Approximate Bayesian Computation. Процитовано 31 березня 2013.
{{}}
: Cite має пустий невідомий параметр:|1=
() (англ.) - Rasmus Bååth (20 жовтня 2014). Tiny Data, Approximate Bayesian Computation and the Socks of Karl Broman. Процитовано 22 січня 2015.
{{}}
: Cite має пустий невідомий параметр:|1=
() (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Pribli zne ba yesove obchi slennya PBO angl Approximate Bayesian computation ABC skladaye klas en sho berut svoyi koreni z bayesovoyi statistiki V usih metodah statistichnogo visnovuvannya na osnovi modelej centralne znachennya maye funkciya pravdopodibnosti oskilki vona virazhaye jmovirnist sposterezhuvanih danih zgidno pevnoyi statistichnoyi modeli i takim chinom kilkisno ocinyuye dani sho pidtrimuyut pevni znachennya parametriv ta obirannya sered riznih modelej Dlya prostih modelej formulu funkciyi pravdopodibnosti zazvichaj mozhe buti vivedeno analitichno Odnak dlya skladnishih modelej analitichna formula mozhe buti neviraznoyu abo ocinka funkciyi pravdopodibnosti mozhe buti duzhe vitratnoyu obchislyuvalno Metodi PBO unikayut obchislennya funkciyi pravdopodibnosti Takim chinom metodi PBO rozshiryuyut sferu modelej dlya yakih mozhe rozglyadatisya statistichne visnovuvannya Metodi PBO ye matematichno obgruntovanimi ale voni neminuche roblyat pripushennya ta nablizhennya sho potrebuyut retelnoyi ocinki Krim togo shirsha oblast zastosuvannya PBO posilyuye problemi ocinki parametriv ta obirannya modeli Ostannimi rokami PBO shvidko zavoyuvalo populyarnist zokrema dlya analizu skladnih zadach sho vinikayut v biologichnih naukah napriklad v populyacijnij genetici ekologiyi epidemiologiyi ta sistemnij biologiyi IstoriyaPershi ideyi pov yazani z PBO shodyat do 1980 h rokiv en angl Donald Rubin obgovoryuyuchi interpretaciyu bayesovih vikladiv u 1984 roci opisav gipotetichnij mehanizm vibirki sho daye vibirku z aposteriornogo rozpodilu Cya shema bula bilshe konceptualnim uyavnim eksperimentom dlya demonstraciyi yakogo tipu manipulyaciyi zdijsnyuyutsya pri otrimuvanni visnovkiv pro aposteriorni rozpodili parametriv Opis cogo mehanizmu vibirki v tochnosti zbigayetsya zi shemoyu PBO vidhilennya i cyu stattyu mozhna rozglyadati yak pershij opis pribliznogo bayesovogo obchislennya Prote dvoetapnij en bulo pobudovano Frensisom Galtonom angl Francis Galton u piznih 1800 h sho mozhna pobachiti yak fizichnu realizaciyu shemi PBO vidhilennya dlya odnogo nevidomogo parametra ta odnogo sposterezhennya div mal 5 u S Stigler 2010 Inshe peredbachennya bulo zrobleno Rubinim koli vin perekonuvav sho prikladni statistiki ne povinni obmezhuvatisya v bayesovomu visnovuvanni lishe timi modelyami sho piddayutsya analitichnij obrobci a natomist rozglyadati obchislyuvalni metodi sho dozvolyayut yim ocinyuvati potribnij aposteriornij rozpodil Takim chinom mozhe rozglyadatisya shirshij spektr modelej Ci argumenti ye osoblivo aktualnimi v konteksti PBO U 1984 roci en angl Peter Diggle ta Richard Gretton angl Richard Gratton zaproponuvali zastosovuvati shemu sistematichnoyi simulyaciyi dlya nablizhennya funkciyi pravdopodibnosti koli yiyi analitichna forma ye nepiddatlivoyu Yihnij metod gruntuvavsya na viznachenni gratki v prostori parametriv ta vikoristanni yiyi dlya nablizhennya pravdopodibnosti shlyahom vikonannya dekilkoh simulyacij dlya kozhnoyi z tochok gratki Nablizhennya potim pokrashuvalosya zastosuvannyam zgladzhuvalnih prijomiv do vihodiv cih simulyacij I hocha ideya vikoristannya simulyacij dlya perevirki gipotez ne bula novoyu Digl ta Gretton ochevidno zaproponuvali pershu proceduru vikoristannya simulyaciyi dlya zdijsnennya statistichnogo visnovuvannya za umov koli pravdopodibnist ye nepiddatlivoyu Hocha pidhid Digla ta Grettona j vidkriv novi obriyi yihnij metod ne buv povnistyu identichnim tomu sho teper vidome yak PBO oskilki jogo spryamovano na nablizhennya pravdopodibnosti zamist aposteriornogo rozpodilu Stattya en angl Simon Tavare ta in bula pershoyu v yakij bulo zaproponovano algoritm PBO dlya aposteriornogo visnovuvannya V yihnij novatorskij praci rozglyadalosya visnovuvannya stosovno genealogiyi danih poslidovnostej DNK zokrema zadacha viznachennya aposteriornogo rozpodilu chasu do ostannogo spilnogo predka vibranih osobin Take visnovuvannya ye analitichno nepiddatlivim dlya bagatoh demografichnih modelej ale avtori predstavili shlyahi simulyaciyi zroshenih derev zgidno peredbachuvanih modelej Vibirku z aposteriornogo rozpodilu parametriv modeli bulo otrimuvano shlyahom prijnyattya vidhilennya pripushen na pidstavi porivnyannya kilkosti vidokremlenih populyacij u sintetichnih ta realnih danih Za ciyeyu praceyu posliduvalo prikladne doslidzhennya en angl Jonathan K Pritchard ta in modelyuvannya variacij v lyudskij Y hromosomi iz zastosuvannyam metodu PBO Nareshti termin priblizne bayesove obchislennya zapochatkuvali Mark Bomon angl Mark Beaumont ta in dodatkovo rozshirivshi metodologiyu PBO ta konkretnishe obgovorivshi pridatnist pidhodu PBO dlya zadach u populyacijnij genetici Vidtodi PBO nabulo poshirennya v zastosuvannyah za mezhami populyacijnoyi genetiki takih yak sistemna biologiya epidemiologiya abo en MetodObgruntuvannya Poshirene vtilennya teoremi Bayesa stavit u vidpovidnist umovnu jmovirnist abo gustinu pevnogo znachennya parametra 8 displaystyle theta pri zadanih danih D displaystyle D do jmovirnosti D displaystyle D pri zadanomu 8 displaystyle theta za pravilom p 8 D p D 8 p 8 p D displaystyle p theta D frac p D theta p theta p D de p 8 D displaystyle p theta D poznachaye aposteriorne p D 8 displaystyle p D theta pravdopodibnist p 8 displaystyle p theta apriorne a p D displaystyle p D svidchennya sho takozh nazivayut vidosoblenoyu pravdopodibnistyu abo apriornoyu peredbachuvanoyu pravdopodibnistyu danih Apriorne predstavlyaye perekonannya pro 8 displaystyle theta do togo yak stalo dostupnim D displaystyle D i jogo chasto vkazuyut obirayuchi pevnij rozpodil z naboru dobre vidomih ta piddatlivih simejstv rozpodiliv tak shobi yak obchislennya apriornih jmovirnostej tak i vipadkova generaciya znachen 8 displaystyle theta buli vidnosno bezposerednimi Dlya deyakih riznovidiv modelej pragmatichnishe vkazuvati apriorne p 8 displaystyle p theta zastosovuyuchi rozklad spilnogo rozpodilu vsih elementiv 8 displaystyle theta v terminah poslidovnosti yihnih umovnih rozpodiliv Yaksho cikavlyat lishe vidnosni jmovirnosti riznih znachen 8 displaystyle theta to svidchennyam p D displaystyle p D mozhna znehtuvati oskilki vono skladaye en sho skasovuyetsya dlya bud yakogo vidnoshennya aposteriornih imovirnostej Zalishayetsya odnak neobhidnist obrahunku pravdopodibnosti p D 8 displaystyle p D theta ta apriornogo p 8 displaystyle p theta Dlya chislennih zastosuvan obrahunok pravdopodibnosti ye obchislyuvalno vitratnim abo j zovsim nepiddatlivim sho sponukaye do zastosuvannya PBO dlya obhodu ciyeyi problemi Algoritm vidhilennya PBOVsi metodi na osnovi PBO nablizhuyut funkciyu pravdopodibnosti shlyahom simulyacij vihodi yakih porivnyuyut zi sposterezhuvanimi danimi Konkretnishe v algoritmi vidhilennya PBO najbazovishij formi PBO spochatku vibirayetsya nabir tochok parametriv z apriornogo rozpodilu Potim dlya zadanoyi vibranoyi tochki parametru 8 displaystyle hat theta simulyuyetsya nabir danih D displaystyle hat D zgidno statistichnoyi modeli M displaystyle M viznachenoyi parametrami 8 displaystyle theta Yaksho ci zgenerovani D displaystyle hat D nadto vidriznyayutsya vid sposterezhuvanih danih D displaystyle D to vibrane znachennya parametru vidhilyayetsya U tochnishih terminah D displaystyle hat D prijmayetsya z dopuskom ϵ 0 displaystyle epsilon geq 0 yaksho r D D ϵ displaystyle rho hat D D leq epsilon de mira vidstani r D D displaystyle rho hat D D viznachaye riven rozbizhnosti mizh D displaystyle hat D ta D displaystyle D na osnovi zadanoyi metriki napriklad evklidovoyi vidstani Yak pravilo potriben suvoro dodatnij dopusk oskilki jmovirnist togo sho vihid simulyaciyi tochno zbizhitsya z danimi podiya D D displaystyle hat D D ye neznachnoyu dlya vsih zastosuvan PBO krim najprimitivnishih sho na praktici velo bi do vidhilennya majzhe vsih vibranih tochok parametriv Vihodom algoritmu vidhilennya PBO ye vibirka znachen parametriv rozpodilena priblizno vidpovidno do bazhanogo aposteriornogo rozpodilu ta najgolovnishe otrimana bez potrebi yavnogo obchislennya funkciyi pravdopodibnosti mal 1 Mal 1 Ocinka parametriv pribliznim bayesovim obchislennyam konceptualnij oglyadZvedena statistika Jmovirnist generuvannya naboru danih D displaystyle hat D z maloyu vidstannyu do D displaystyle D zazvichaj zmenshuyetsya z rostom rozmirnosti danih Ce prizvodit do suttyevogo zmenshennya obchislyuvalnoyi efektivnosti navedenogo vishe bazovogo algoritmu vidhilennya PBO Zagalnim pidhodom do zmenshennya ciyeyi problemi ye zamina D displaystyle D naborom zvedenoyi statistiki S D displaystyle S D z menshoyu rozmirnistyu yakij obirayetsya takim chinom shobi ohopiti dorechnu informaciyu v D displaystyle D Kriterij prijnyatnosti v algoritmi vidhilennya PBO staye takim r S D S D ϵ displaystyle rho S hat D S D leq epsilon Yaksho zvedena statistika ye dostatnoyu po vidnoshennyu do parametriv modeli 8 displaystyle theta to otrimuvane takim chinom pidvishennya efektivnosti ne privnosit zhodnih pomilok Dijsno za viznachennyam dostatnist oznachaye sho vsyu informaciyu v D displaystyle D pro 8 displaystyle theta ohopleno v S D displaystyle S D Yak detalizovano nizhche identifikuvati skinchennomirnij nabir zvedenoyi statistiki za mezhami en zazvichaj nemozhlivo Tim ne mensh u vipadkah koli visnovuvannya zdijsnyuyetsya metodami PBO chasto zastosovuyutsya informativni ale mozhlivo ne dostatni zvedeni statistiki PrikladMalyunok 2 Dinamichna bistabilna prihovana markovska model Ilyustrativnim prikladom ye bistabilna sistema yaku mozhe buti oharakterizovano prihovanoyu markovskoyu modellyu PMM v umovah zashumlenih vimiryuvan Mal 2 Taki modeli vikoristovuyut dlya bagatoh biologichnih sistem napriklad yih mozhut zastosovuvati do evolyuciyi signalnih sistem klitin aktivaciyi deaktivaciyi logichnoyi obrobki ta nerivnovazhnoyi termodinamiki Napriklad povedinka faktora transkripciyi signalnogo bilka angl Sonic hedgehog Shh u chornocherevij drozofili mozhe modelyuvatisya za dopomogoyu PMM Biologichna dinamichna model skladayetsya z dvoh staniv A ta B Yaksho jmovirnist perehodu z odnogo stanu do inshogo viznachayetsya yak 8 displaystyle theta v oboh napryamkah to jmovirnistyu zalishitisya v tomu zh stani na kozhnomu takti ye 1 8 displaystyle theta Jmovirnistyu vimiryati stan pravilno ye g displaystyle gamma i navpaki jmovirnistyu nepravilnogo vimiryuvannya ye 1 g displaystyle gamma Cherez umovni zalezhnosti mizh stanami v rizni momenti chasu obchislennya pravdopodibnosti danih chasovih ryadiv ye desho nudnim sho ilyustruye sponukannya do zastosuvannya PBO Obchislyuvalnoyu problemoyu dlya bazovogo PBO ye velika rozmirnist danih u zastosuvannyah na kshtalt cogo Yiyi mozhe buti zmensheno zastosuvannyam zvedenoyi statistiki S sho ye chastotoyu peremikan mizh dvoma stanami Yak metrika vidstani r displaystyle rho cdot cdot zastosovuyetsya absolyutna vidstan u poyednanni z dopuskom ϵ 2 displaystyle epsilon 2 Aposteriorne visnovuvannya stosovno parametra 8 displaystyle theta mozhe buti zdijsneno shlyahom p yatoh krokiv predstavlenih na mal 1 Krok 1 Pripustimo sho sposterezhuvani dani ye poslidovnistyu staniv AAAABAABBAAAAAABAAAA sho bulo zgenerovano z vikoristannyam 8 0 25 displaystyle theta 0 25 ta g 0 8 displaystyle gamma 0 8 Pov yazanoyu zvedenoyu statistikoyu kilkistyu peremikan mizh stanami v eksperimentalnih danih ye wE 6 displaystyle omega E 6 Krok 2 Vihodyachi z pripushennya sho pro 8 displaystyle theta ne vidomo nichogo zastosovuyetsya rivnomirnij apriornij rozpodil na promizhku 0 1 displaystyle 0 1 Parametr g displaystyle gamma vvazhayetsya vidomim ta fiksovanim u znachenni z yakim generuvalisya dani g 0 8 displaystyle gamma 0 8 ale v zagalnomu vipadku jogo mozhe buti ocineno zi sposterezhen Z apriornogo beretsya n tochok parametriv i model simulyuyetsya dlya kozhnoyi z tochok parametriv 8i i 1 n displaystyle theta i i 1 ldots n sho daye v rezultati n displaystyle n poslidovnostej simulovanih danih V comu prikladi n 5 a kozhen vzyatij parametr ta simulovanij zapis naboru danih mistyatsya v stovpchikah 2 3 tablici 1 Na praktici dlya otrimannya pridatnoyi informaciyi n povinno buti nabagato bilshim Tablicya 1 Priklad algoritmu vidhilennya PBO i 8i displaystyle theta i Simulovani nabori danih krok 2 Zvedena statistika wS i displaystyle omega S i krok 3 Vidstan r wS i wE displaystyle rho omega S i omega E krok 4 Vihid krok 4 1 0 08 AABAAAABAABAAABAAAAA 8 2 prijnyato2 0 68 AABBABABAAABBABABBAB 13 7 vidhileno3 0 87 BBBABBABBBBABABBBBBA 9 3 vidhileno4 0 43 AABAAAAABBABBBBBBBBA 6 0 prijnyato5 0 53 ABBBBBAABBABBABAABBB 9 3 vidhileno Krok 3 Zvedena statistika obchislyuyetsya dlya kozhnoyi poslidovnosti simulovanih danih wS i i 1 n displaystyle omega S i i 1 ldots n stovpchik 4 tablici 1 Krok 4 Vidstani mizh sposterezhuvanimi ta simulovanimi poslidovnostyami perehodiv r wS i wE wS i wE displaystyle rho omega S i omega E omega S i omega E obchislyuyutsya dlya vsih tochok parametriv stovpchik 5 tablici 1 Tochki parametriv dlya yakih vidstan ye menshoyu abo rivnoyu ϵ displaystyle epsilon prijmayutsya yak priblizni prikladi z aposteriornogo stovpchik 6 tablici 1 Malyunok 3 Aposteriorne 8 displaystyle theta otrimane z prikladu chervone u porivnyanni zi spravzhnim aposteriornim rozpodilom chornij ta simulyaciyami PBO z velikimi n Vikoristannya nedostatnoyi zvedenoyi statistiki w displaystyle omega vnosit vidhilennya navit za vimogi ϵ 0 displaystyle epsilon 0 svitlo zelenij Krok 5 Aposteriornij rozpodil nablizhuyetsya prijnyatimi tochkami parametriv Aposteriornij rozpodil povinen mati ne neznachnu jmovirnist znachen parametriv v oblasti navkolo istinnogo znachennya 8 displaystyle theta v sistemi yaksho dani ye dostatno informativnimi V comu prikladi masu aposteriornoyi jmovirnosti rivnomirno podileno mizh znachennyami 0 08 ta 0 43 Malyunok 3 pokazuye aposteriorni jmovirnosti otrimani za dopomogoyu PBO ta velikogo n z vikoristannyam abo zvedenoyi statistiki u poyednanni z ϵ 0 displaystyle epsilon 0 ta ϵ 2 displaystyle epsilon 2 abo povnoyi poslidovnosti danih Voni porivnyuyutsya zi spravzhnim aposteriornim sho mozhe buti obchisleno tochno ta efektivno za dopomogoyu algoritmu Viterbi Vikoristana zvedena statistika ne ye dostatnoyu i ce vidno z togo sho navit pri ϵ 0 displaystyle epsilon 0 vidhilennya vid teoretichnogo aposteriornogo ye znachnim Slid zaznachiti sho dlya otrimannya aposteriornogo sho bude zoseredzheno navkolo spravzhnogo znachennya 8 displaystyle theta 8 0 25 displaystyle theta 0 25 znadobitsya znachno dovsha poslidovnist danih sposterezhen Cej priklad zastosuvannya PBO vikoristovuye sproshennya dlya ilyustrativnih cilej Ryad oglyadovih statej proponuyut posilannya na realistichnishi zastosuvannya PBO Porivnyannya modelej za dopomogoyu PBOKrim ocinki parametriv model PBO mozhe zastosovuvatisya dlya obchislennya aposteriornih imovirnostej riznih modelej kandidativ U takih zastosuvannyah odniyeyu z mozhlivostej ye zastosuvannya vidhilennya vibirki v iyerarhichnomu poryadku Spershu z apriornogo rozpodilu modelej beretsya model potim dlya vzyatoyi modeli parametri modeli vibirayutsya z apriornogo rozpodilu sho vidpovidaye cij modeli Nareshti simulyaciya vikonuyetsya tak yak v odnomodelnomu PBO Teper vidnosni chastoti prijnyattya dlya riznih modelej nablizhuyut aposteriornij rozpodil dlya cih modelej Znovu zh taki proponuvalisya obchislyuvalni vdoskonalennya PBO u prostori modelej taki yak pobudova en v sukupnomu prostori modelej ta parametriv Shojno ocineno aposteriorni jmovirnosti modelej mozhna povnoyu miroyu skoristatisya metodikami bayesovogo porivnyannya modelej Napriklad dlya porivnyannya vidnosnih imovirnostej dvoh modelej M1 displaystyle M 1 ta M2 displaystyle M 2 mozhna obchislyuvati yihnye aposteriorne vidnoshennya sho pov yazane z koeficiyentom Bayesa B1 2 displaystyle B 1 2 p M1 D p M2 D p D M1 p D M2 p M1 p M2 B1 2p M1 p M2 displaystyle frac p M 1 D p M 2 D frac p D M 1 p D M 2 frac p M 1 p M 2 B 1 2 frac p M 1 p M 2 Yaksho apriorni modelej ye odnakovimi p M1 p M2 displaystyle p M 1 p M 2 koeficiyent Bayesa dorivnyuye vidnoshennyu aposteriornih Na praktici yak obgovoryuyetsya nizhche ci zahodi mozhut buti duzhe chutlivimi do viboru parametriv apriornih rozpodiliv ta zvedenoyi statistiki i takim chinom visnovki z porivnyannya modelej slid robiti z oberezhnistyu Pastki ta zasobi podolannyaTablicya 2 Potencialni riziki ta pastki v statistichnomu visnovuvanni na osnovi PBO Dzherelo pomilki Potencijna problema Rozv yazannya RozdilNenulovij dopusk e Netochnist vnosit vidhilennya do obchislyuvanogo aposteriornogo rozpodilu Teoretichni praktichni doslidzhennya chutlivosti aposteriornogo rozpodilu do dopusku Zashumlene PBO Nablizhennya aposteriornogoNe dostatnya zvedena statistika Vtrata informaciyi prizvodit do rozduvannya jmovirnih intervaliv Avtomatichnij vibir napivavtomatichna identifikaciya dostatnoyi statistiki Perevirki dostovirnosti modeli napr Templton 2009 Vibir ta dostatnist zvedenoyi statistikiVibir ta dostatnist zvedenoyi statistikiMala kilkist modelej Nevirno vkazani modeli Doslidzhuvani modeli ne ye reprezentativnimi brak peredbachuvalnoyi sili Retelnij vidbir modelej Ocinka peredbachuvalnoyi sili Mala kilkist modelejApriorni ta diapazoni parametriv Visnovki mozhut buti chutlivimi do viboru apriornih Vibir modeli mozhe buti bezgluzdim Pereviryati chutlivist koeficiyentiv Bayesa do viboru apriornih Dostupni deyaki teoretichni rezultati stosovno viboru apriornih Vikoristovuvati alternativni metodi perevirki dostovirnosti modelej Apriornij rozpodil ta diapazoni parametrivProklyattya rozmirnosti Nizkij temp prijnyattya parametriv Pomilki modelej nemozhlivo vidrizniti vid nedostatnoyi doslidzhenosti prostoru parametriv Rizik perenavchannya Metodi zmenshennya modelej yaksho voni zastosovni Metodi dlya priskorennya doslidzhennya parametriv Kontrol yakosti dlya viyavlennya perenavchannya Proklyattya rozmirnostiRanzhuvannya modelej zi zvedenoyu statistikoyu Rozrahunok koeficiyentiv Bayesa na zvedenij statistici mozhe ne vidpovidati koeficiyentam Bayesa na vihidnih danih sho mozhe prizvoditi do vidachi bezgluzdih rezultativ Vikoristovuvati lishe taki zvedeni statistiki sho zadovolnyayut neobhidni ta dostatni vimogi dlya otrimannya nesuperechlivogo bayesovogo viboru modeli Zastosovuvati alternativni metodi perevirki dostovirnosti modeli Koeficiyent Bayesa z PBO ta zvedenoyu statistikoyuRealizaciya Nizkij zahist zagalnih pripushen u procesah simulyaciyi ta visnovuvannya Perevirka pracezdatnosti za rezultatami Standartizaciya programnogo zabezpechennya Obov yazkovi perevirki yakosti Yak i dlya vsih statistichnih metodiv dlya zastosuvannya metodiv na osnovi PBO do realnih zadach modelyuvannya ye obov yazkovo neobhidnim ryad pripushen ta nablizhen Napriklad vstanovlennya parametra dopusku ϵ displaystyle epsilon v nul zabezpechuye tochnij rezultat ale zazvichaj robit obchislennya zanadto vitratnim Tomu na praktici zastosovuyutsya znachennya ϵ displaystyle epsilon bilshe nulya sho vnosit vidhilennya Takozh dostatni zvedeni statistiki zazvichaj ne ye dostupnimi i natomist zastosovuyutsya inshi zvedeni statistiki sho privnosit dodatkove vidhilennya v silu vtrati informaciyi Dodatkovi dzherela vidhilennya napriklad u konteksti viboru modeli mozhut buti vitonchenishimi V toj zhe chas deyaki z kritichnih zauvazhen spryamovani na metodi PBO zokrema v galuzi en stosuyutsya ne osoblivostej PBO a vsih bayesovih metodiv abo navit vsih statistichnih metodiv napriklad vibir apriornogo rozpodilu ta diapazoniv parametriv Tim ne mensh cherez zdatnist metodiv PBO mati spravu iz znachno skladnishimi modelyami deyaki z cih zagalnih pastok mayut osoblive znachennya v konteksti analizu PBO V comu rozdili obgovoryuyutsya ci potencijni riziki ta robitsya oglyad mozhlivih shlyahiv yihnogo podolannya tablicya 2 Nablizhennya aposteriornogo Ne neznachnij ϵ displaystyle epsilon dayetsya takoyu cinoyu sho vibirka robitsya z p 8 r D D ϵ displaystyle p theta rho hat D D leq epsilon zamist spravzhnogo aposteriornogo p 8 D displaystyle p theta D Za dostatno malogo dopusku ta chutlivoyi metriki vidstani otrimuvanij v rezultati rozpodil p 8 r D D ϵ displaystyle p theta rho hat D D leq epsilon povinen chasto nablizhuvati spravzhnij cilovij rozpodil p 8 D displaystyle p theta D dostatno dobre Z inshogo boku nastilki velikij dopusk sho kozhna z tochok prostoru parametriv staye prijnyatoyu vidast dublikat apriornogo rozpodilu Isnuyut empirichni doslidzhennya riznici mizh p 8 r D D ϵ displaystyle p theta rho hat D D leq epsilon ta p 8 D displaystyle p theta D yak funkciyi vid ϵ displaystyle epsilon ta teoretichni rezultati dlya verhnoyi mezhi pomilki ocinok parametriv u zalezhnosti vid ϵ displaystyle epsilon Takozh bulo doslidzheno tochnist aposteriornogo viznachenu yak ochikuvani kvadratichni vtrati sho porodzhuye PBO yak funkciyu vid ϵ displaystyle epsilon Tim ne mensh zbizhnist rozpodiliv pri nablizhenni ϵ displaystyle epsilon do nulya ta yiyi zalezhnist vid zastosovuvanoyi metriki vidstani ye vazhlivoyu temoyu sho she maye buti doslidzheno dokladnishe Zokrema zalishayetsya skladnim vidokremiti pomilki vneseni cim nablizhennyam vid pomilok cherez nepravilne viznachennya modeli Yak sproba vipravlennya deyakih iz pomilok sprichinenih nenulovim ϵ displaystyle epsilon bulo zaproponovano vikoristannya z PBO lokalnoyi zvazhenoyi linijnoyi regresiyi shobi zmenshiti rozbizhnist aposteriornih ocinok Cej metod priznachaye vagovi koeficiyenti parametram u vidpovidnosti do togo naskilki dobre simulovani pidsumki vidpovidayut sposterezhuvanim i vikonuye linijnu regresiyu mizh pidsumkami ta zvazhenimi parametrami v okoli sposterezhuvanih pidsumkiv Otrimuvani koeficiyenti regresiyi vikoristovuyutsya dlya koriguvannya parametriv sho obirayutsya v napryamku sposterezhuvanih pidsumkiv Bulo zaproponovano vdoskonalennya u viglyadi nelinijnoyi regresiyi iz zastosuvannyam shtuchnoyi nejronnoyi merezhi pryamogo poshirennya Prote bulo pokazano sho aposteriorni rozpodili otrimani iz zastosuvannyam cih pidhodiv ne zavzhdi konzistentni z apriornim rozpodilom i vidtak zaproponovano pereformulyuvannya nalashtuvan regresiyi yake bere do uvagi apriornij rozpodil Nareshti statistichne visnovuvannya iz zastosuvannyam PBO z nenulovim dopuskom ϵ displaystyle epsilon ne ye vlastivo vadlivim za pripushennya nayavnosti pomilok vimiryuvannya mozhe buti faktichno pokazano sho optimalnij ϵ displaystyle epsilon ye ne nulovim Dijsno vidhilennya sprichinene nenulovim dopuskom mozhe buti harakterizovano ta kompensovano vvedennyam pevnogo vidu shumu do zvedenoyi statistiki Bulo vstanovleno asimptotichnu konzistentnist takogo zashumlenogo PBO a takozh formuli asimptotichnoyi dispersiyi ocinok parametriv dlya fiksovanogo dopusku Vibir ta dostatnist zvedenoyi statistiki Zvedena statistika mozhe zastosovuvatisya dlya zbilshennya tempu prijnyattya PBO dlya danih visokoyi rozmirnosti Dlya ciyeyi meti optimalnoyu ye dostatnya zvedena statistika nevisokoyi rozmirnosti oskilki vona ohoplyuye vsyu dorechnu informaciyu sho ye v danih u najprostishomu viglyadi z mozhlivih Odnak dostatni statistiki nizkoyi rozmirnosti zazvichaj ye nedosyazhnimi dlya tih statistichnih modelej dlya yakih visnovuvannya na osnovi PBO ye najdorechnishim i tomu dlya znahodzhennya zvedenih statistik nevelikoyi rozmirnosti zazvichaj potribna pevna evristika Vikoristannya naboru pogano obranoyi zvedenoyi statistiki chasto prizvodit do rozduvannya jmovirnih intervaliv z prichini zakladenoyi vtrati informaciyi sho takozh mozhe vnositi vidhilennya j do rozriznennya modelej Isnuye oglyad metodiv obrannya zvedenih statistik sho mozhe sluguvati garnim kerivnictvom na praktici Odnim z pidhodiv dlya ohoplennya yakomoga bilshe nayavnoyi v danih informaciyi bulo bi vikoristannya bagatoh statistik ale viyavlyayetsya sho tochnist ta stabilnist PBO shvidko znizhuyutsya zi zbilshennyam chisla zvedenih statistik Natomist krashoyu strategiyeyu ye fokusuvatisya lishe na dorechnih statistikah dorechnist vidnosno problemi visnovuvannya v cilomu vikoristovuvanoyi modeli ta danih sho ye v rozporyadzhenni Bulo zaproponovano algoritm identifikaciyi reprezentativnoyi pidmnozhini zvedenih statistik shlyahom ocinyuvannya chi privnosit dodatkova statistika znachushu zminu do aposteriornogo Odniyeyu z problem tut ye te sho velika pomilka nablizhennya PBO mozhe silno vplinuti na visnovki pro korisnist statistiki na bud yakomu kroci ciyeyi proceduri Inshij metod rozkladayetsya na dva osnovnih kroki Spershu buduyetsya kontrolne aposteriorne shlyahom minimizaciyi entropiyi Potim nabori kandidati statistik ocinyuyutsya shlyahom porivnyannya nablizhenih za dopomogoyu PBO aposteriornih iz kontrolnim aposteriornim Za oboh cih strategij pidmnozhina statistik obirayetsya z bilshogo naboru statistik kandidativ Natomist pidhid en vikoristovuye informaciyu z usih statistik kandidativ kozhnoyi z vidpovidnim vagovim koeficiyentom Ostannim chasom znachnij interes privernuv metod pobudovi zvedenih statistik napivavtomatichnim sposobom Cej metod zasnovano na sposterezhenni sho optimalnij vibir zvedenih statistik pri minimizaciyi kvadratichnih vtrat ocinok tochok parametriv mozhe buti otrimano cherez aposteriorne serednye parametriv yake nablizhuyetsya vikonannyam linijnoyi regresiyi na osnovi simulovanih danih Istotne znachennya matimut metodi identifikaciyi zvedenih statistik sho mogli bi takozh odnochasno ocinyuvati vpliv na nablizhennya aposteriornogo Prichina v tomu sho vibir zvedenih statistik ta vibir dopusku skladayut dva dzherela pomilki v otrimuvanomu v rezultati aposteriornomu rozpodili Ci pomilki mozhut spotvoryuvati ranzhuvannya modelej a takozh mozhut prizvoditi do netochnih peredbachen modelej Dijsno zhoden iz navedenih vishe metodiv ne ocinyuye vibir zvedenih statistik z metoyu viboru modeli Koeficiyent Bayesa z PBO ta zvedenoyu statistikoyu Bulo pokazano sho poyednannya ne dostatnoyi zvedenoyi statistiki ta PBO mozhe buti problematichnim dlya viboru modeli Spravdi yaksho poznachiti koeficiyent Bayesa na osnovi zvedenoyi statistiki S D displaystyle S D yak B1 2s displaystyle B 1 2 s to spivvidnoshennya mizh B1 2 displaystyle B 1 2 ta B1 2s displaystyle B 1 2 s nabuvaye takogo viglyadu B1 2 p D M1 p D M2 p D S D M1 p D S D M2 p S D M1 p S D M2 p D S D M1 p D S D M2 B1 2s displaystyle B 1 2 frac p D M 1 p D M 2 frac p D S D M 1 p D S D M 2 frac p S D M 1 p S D M 2 frac p D S D M 1 p D S D M 2 B 1 2 s Otzhe zvedena statistika S D displaystyle S D ye dostatnoyu dlya porivnyannya dvoh modelej M1 displaystyle M 1 ta M2 displaystyle M 2 yaksho i lishe yaksho p D S D M1 p D S D M2 displaystyle p D S D M 1 p D S D M 2 sho daye v rezultati B1 2 B1 2s displaystyle B 1 2 B 1 2 s Z navedenogo vishe rivnyannya takozh yasno sho mozhe isnuvati velichezna riznicya mizh B1 2 displaystyle B 1 2 ta B1 2s displaystyle B 1 2 s yaksho cya umova ne zadovolnyayetsya sho mozhe buti pokazano na igrashkovih prikladah Vreshti resht bulo pokazano sho dostatnist dlya M1 displaystyle M 1 abo M2 displaystyle M 2 po odnomu abo dlya oboh modelej ne garantuye dostatnosti dlya ranzhuvannya modelej Prote takozh bulo pokazano sho bud yaka dostatnya zvedena statistika dlya modeli M displaystyle M v yakij obidvi modeli M1 displaystyle M 1 ta M2 displaystyle M 2 ye en ye chinnoyu dlya ranzhuvannya en Obchislennya koeficiyentiv Bayesa na S D displaystyle S D mozhe vidtak buti omanlivim dlya cilej viboru modeli yaksho vidnoshennya mizh koeficiyentami Bayesa na D displaystyle D ta S D displaystyle S D ne bude vidomim abo hocha b ne bude dostatno dobre nablizhuvanim Krim togo neshodavno bulo otrimano neobhidni ta dostatni umovi na zvedenu statistiku dlya stijkogo bayesovogo viboru modeli sho mozhut sluguvati korisnim kerivnictvom Tim ne mensh ce pitannya maye vidnoshennya lishe do takogo viboru modeli koli rozmirnist danih bulo zmensheno Visnovuvannya na osnovi PBO v yakomu porivnyuyutsya bezposeredno spravzhni nabori danih yak u deyakih zastosuvannyah v sistemnij biologiyi napriklad div unikaye ciyeyi problemi Obov yazkovi perevirki yakosti Yak staye zrozumilim iz poperednogo obgovorennya bud yakij PBO analiz vimagaye zdijsnennya viboru ta kompromisiv sho mozhut mati znachnij vpliv na jogo rezultati A same vibir alternativnih modelej gipotez kilkosti simulyacij vibir zvedenoyi statistiki abo porogovogo dopusku narazi ne mozhut gruntuvatisya na zagalnih pravilah vpliv cogo viboru maye ocinyuvatis i pereviryatis u kozhnomu doslidzhenni Bulo zaproponovano ryad evristichnih pidhodiv do kontrolyu yakosti PBO takih yak kilkisne virazhennya chastki dispersiyi parametru sho poyasnyuyetsya zvedenoyu statistikoyu Zvichajnij klas metodiv nacileno na viznachennya togo chi vidaye visnovuvannya virni rezultati ne zalezhno vid faktichno sposterezhuvanih danih Napriklad dlya zadanogo naboru znachen parametru sho zazvichaj vibirayetsya z apriornogo abo aposteriornogo rozpodiliv modeli mozhna zgeneruvati veliku kilkist shtuchnih naboriv danih Takim chinom yakist ta nadijnist visnovuvannya PBO mozhe buti ocineno v kontrolovanih umovah shlyahom zdijsnennya zamiriv naskilki dobre obrane visnovuvannya PBO viyavlyaye spravzhni znachennya parametru a takozh modelyuye chi dekilka strukturno vidminnih modelej rozglyadayutsya odnochasno Inshij klas metodiv viznachaye chi bulo visnovuvannya uspishnim u svitli zadanih sposterezhuvanih danih napriklad shlyahom porivnyannya en zvedenoyi statistiki zi sposterezhuvanoyu zvedenoyu statistikoyu Krim togo perspektivni majbutni strategiyi ocinki stabilnosti visnovuvan PBO ta yihnoyi peredbachuvalnoyi dostovirnosti za mezhami vibirki predstavlyayut metodiki perehresnogo zatverdzhuvannya ta en Ce osoblivo vazhlivo pri modelyuvanni velikih masiviv danih oskilki v takomu vipadku aposteriorna pidtrimka pevnoyi modeli mozhe vidavatisya nadzvichajno perekonlivoyu hocha vsi zaproponovani modeli faktichno ye poganim predstavlennyam stohastichnoyi sistemi sho stoyit za sposterezhuvanimi danimi Peredbachuvalni perevirki za mezhami vibirki mozhut viyavlyati potencijni sistematichni vidhilennya v mezhah modeli j proponuvati klyuch do togo yak vdoskonaliti yiyi strukturu abo parametrizaciyu Cikavo sho neshodavno bulo zaproponovano principovo novi pidhodi dlya viboru modeli sho vklyuchayut kontrol yakosti yak nevid yemnij krok procesu PBO za svoyeyu budovoyu dozvolyaye ocinyuvati rozbizhnosti mizh sposterezhuvanimi danimi ta peredbachennyami modeli po vidnoshennyu do vicherpnogo naboru statistik Ci statistiki ne obov yazkovo ye takimi zh yak ti sho zastosovuyutsya v kriteriyi prijnyattya Otrimuvani rozpodili rozbizhnostej zastosovuvalis dlya viboru modelej sho uzgodzhuyutsya z bagatma aspektami danih odnochasno i superechnist modeli viyavlyayetsya z konfliktnih ta spivzalezhnih zvedenih statistik Inshij metod viboru modeli na osnovi kontrolyu yakosti zaluchaye PBO dlya nablizhennya efektivnoyi kilkosti parametriv modeli ta vidhilen peredbachuvanih aposteriornih rozpodiliv zvedenih statistik ta parametriv Potim zastosovuyetsya en yak mira pridatnosti modeli Takozh bulo pokazano sho modeli yakim viddano perevagu za cim kriteriyem mozhut konfliktuvati z timi yaki pidtrimuyutsya koeficiyentami Bayesa Z ciyeyi prichini korisno kombinuvati rizni metodi viboru modelej dlya otrimannya pravilnih visnovkiv Perevirki yakosti ye dosyazhnimi j dijsno vikonuyutsya v bagatoh pracyah sho gruntuyutsya na PBO ale dlya deyakih zadach ocinka vplivu pov yazanih iz metodom parametriv mozhe buti skladnim zavdannyam Tim ne mensh mozhna ochikuvati sho vikoristannya PBO yake shvidko zrostaye zabezpechit glibshe rozuminnya obmezhen ta zastosovnosti cogo metodu Zagalni riziki statistichnogo visnovuvannya sho zagostryuyutsya v PBO V comu rozdili zrobleno oglyad rizikiv sho suvoro kazhuchi ne ye harakternimi same dlya PBO a stosuyutsya tak samo j inshih statistichnih metodiv Prote gnuchkist yaku proponuye PBO dlya analizu duzhe skladnih modelej robit yihnye obgovorennya tut duzhe dorechnim Apriornij rozpodil ta diapazoni parametriv Specifikaciya diapazoniv ta apriornogo rozpodilu parametriv silno vigraye vid poperednih znan pro vlastivosti sistemi Odnim iz kritichnih zauvazhen bulo te sho v deyakih doslidzhennyah diapazoni ta rozpodili parametriv vsogo lishe vgaduyutsya na pidstavi sub yektivnoyi dumki doslidnikiv sho pov yazano iz klasichnimi zaperechennyami bayesovih pidhodiv Za bud yakogo obchislyuvalnogo metodu zazvichaj neobhidno obmezhiti doslidzhuvani diapazoni parametriv Ci diapazoni parametriv povinni za mozhlivosti viznachatisya na pidstavi vidomih vlastivostej doslidzhuvanoyi sistemi ale dlya praktichnih zastosuvan mozhut robiti neobhidnim osvichene pripushennya Tim ne mensh dostupni teoretichni rezultati stosovno ob yektivnih apriornih sho mozhut napriklad gruntuvatisya na en abo en Z inshogo boku avtomatizovani abo napivavtomatizovani metodi viboru apriornogo rozpodilu chasto vidayut nekorektni gustini Oskilki bilshist procedur PBO vimagayut generuvannya vibirok z apriornogo nekorektni apriorni ne ye bezposeredno zastosovnimi v PBO Pri vibori apriornogo rozpodilu slid takozh mati na uvazi metu analizu V principi neinformativni ta plaski apriorni sho pidkreslyuyut nashe sub yektivne neznannya pro parametri vse zh taki mozhut vidavati prijnyatni ocinki parametriv Prote koeficiyenti Bayesa ye duzhe chutlivimi do apriornogo rozpodilu parametriv Visnovki pro vibir modeli na pidstavi koeficiyentiv Bayesa mozhut viyavitisya omanlivimi yaksho ne obmirkuvati retelno chutlivist visnovkiv do viboru apriornih Mala kilkist modelej Metodi na osnovi modelej piddavalisya kritici cherez ne vicherpne pokrittya prostoru gipotez Dijsno doslidzhennya na osnovi modelej obertayutsya navkolo nevelikoyi kilkosti modelej i z prichini visokih obchislyuvalnih vitrat na ocinku odniyeyi modeli v deyakih vipadkah mozhe buti skladno pokriti veliku chastinu prostoru gipotez Verhnya mezha kilkosti modelej kandidativ sho rozglyadayutsya zazvichaj vstanovlyuyetsya znachnimi zusillyami neobhidnimi dlya viznachennya modelej ta dlya viboru mizh bagatma alternativnimi variantami Ne isnuye zagalnoprijnyatoyi proceduri pobudovi modeli same dlya PBO tomu natomist zastosovuyutsya dosvid ta poperedni znannya Hoch nadijnisha procedura dlya apriornogo viboru modeli ta formulyuvannya j bula bi korisnoyu universalnoyi strategiyi rozrobki modeli v statistici ne isnuye chutlivi harakteristiki skladnih sistem zavzhdi robitimut neobhidnoyu veliku kilkist detektivnoyi praci ta vikoristannya ekspertnih znan z predmetnoyi oblasti Deyaki oponenti PBO stverdzhuyut sho oskilki realistichno mozhut rozglyadatisya lishe dekilka modelej sub yektivno vibrani ta jmovirno vsi nepravilni to analiz PBO proponuye lishe obmezhene rozuminnya Prote isnuye vazhliva vidminnist mizh identifikaciyeyu pravdopodibnoyi nulovoyi gipotezi ta ocinkoyu vidnosnoyi pridatnosti alternativnih gipotez Oskilki v konteksti skladnih modelej vkraj ridko mozhe buti visunuto korisni nulovi gipotezi sho ye potencijno spravedlivimi to peredbachuvalna zdatnist statistichnih modelej yak poyasnennya skladnih yavish ye nabagato vazhlivishoyu za perevirku statistichnih nulovih gipotez u comu konteksti Takozh dlya otrimuvannya visnovkiv pro osoblivosti modeli napriklad znachen parametriv ta zdijsnennya peredbachen ye zvichnim robiti userednennya doslidzhuvanih modelej zvazhenih na pidstavi yihnoyi vidnosnoyi pravdopodibnosti Veliki nabori danih Veliki nabori danih mozhut utvoryuvati obchislyuvalne vuzke misce dlya metodiv na osnovi modelej Bulo napriklad vkazano sho v deyakih analizah na osnovi PBO chastinu danih maye buti opusheno Ryad avtoriv stverdzhuyut sho veliki nabori danih ne stanovlyat praktichnogo obmezhennya hocha suvorist ciyeyi problemi silno zalezhit vid harakteristik modelej Deyaki aspekti zadachi modelyuvannya taki yak rozmir vibirki kilkist sposterezhuvanih zminnih abo vlastivostej chasova abo prostorova rozdilna zdatnist tosho mozhut spriyati obchislyuvalnij skladnosti Prote zi zbilshennyam obchislyuvalnih potuzhnostej cya problema potencijno stavatime mensh vazhlivoyu Zamist vibirannya parametriv dlya kozhnoyi simulyaciyi z apriornogo yak alternativu bulo zaproponovano poyednuvati z PBO algoritm Metropolisa Gastingsa sho yak bulo povidomleno daye vishij temp prijnyattya nizh chiste PBO Prirodno takij pidhid uspadkovuye zagalni obtyazhennya metodiv MKML taki yak skladnist ocinyuvannya zbizhnosti korelyaciyu sered vibirok z aposteriornogo ta vidnosno slabku rozparalelyuvanist Tak samo dlya seredovisha PBO bulo adaptovano en angl sequential Monte Carlo SMC ta sukupnisnij angl population Monte Carlo PMC metodi Monte Karlo Zagalna ideya polyagaye v iterativnomu pidhodi do aposteriornogo z apriornogo cherez poslidovnist cilovih rozpodiliv Perevagoyu takih metodiv u porivnyanni z PBO MKML ye te sho vibirki z otrimuvanogo v rezultati aposteriornogo ye nezalezhnimi Na dodachu poslidovni metodi ne vimagayut vkazannya rivniv dopusku do pochatku analizu voni regulyuyutsya adaptivno Rozparalelyuvannya ryadu krokiv algoritmiv PBO na osnovi vidhilyuvalnoyi vibirki ta en ye vidnosno prostim Takozh bulo prodemonstrovano sho paralelni algoritmi mozhut privnositi suttyeve priskorennya do visnovuvannya na osnovi MKML u filogenetici i voni mozhut buti pridatnim pidhodom takozh i dlya metodiv na osnovi PBO Krim togo adekvatna model skladnoyi sistemi shvidshe za vse vimagatime intensivnih obchislen ne zalezhno vid obranogo metodu visnovuvannya i ce koristuvachevi obirati metod sho bude pridatnim dlya pevnogo zastosuvannya sho rozglyadayetsya Proklyattya rozmirnosti Dlya otrimannya prijnyatnogo rivnya tochnosti visnovuvannya aposteriornogo nabori danih visokoyi rozmirnosti ta prostori parametriv visokoyi rozmirnosti mozhut vimagati simulyaciyi v doslidzhenni na osnovi PBO nadzvichajno velikoyi kilkosti tochok parametriv V takih situaciyah obchislyuvalni vitrati silno zrostayut i zdatni v najgirshomu vipadku zrobiti obchislyuvalnij analiz nepiddatlivim Voni ye prikladami dobre vidomih yavish sho poznachayut uzagalnyuvalnim terminom proklyattya rozmirnosti Dlya ocinki togo naskilki serjozno rozmirnist danih vplivaye na analiz u konteksti PBO bulo vivedeno analitichni formuli pomilki ocinyuvachiv PBO yak funkciyi vid rozmirnosti zvedenoyi statistiki Krim togo Blum angl Blum ta Fransua angl Francois doslidili yak rozmirnist zvedenoyi statistiki pov yazana iz serednokvadratichnoyu pomilkoyu dlya riznih koriguvan pomilki ocinyuvachiv PBO Bulo takozh vidznacheno sho metodiki zmenshennya rozmirnosti ye korisnimi dlya unikannya proklyattya rozmirnosti cherez te sho bazova struktura zvedenoyi statistiki potencijno maye menshu rozmirnist Keruyuchis minimizaciyeyu kvadratichnih vtrat ocinyuvachiv PBO Fiernhed angl Fearnhead ta Prengl angl Prangle zaproponuvali shemu proektuvannya danih mozhlivo velikoyi rozmirnosti na ocinki aposteriornih serednih znachen parametriv cej zasib sho teper maye tu zh rozmirnist sho j parametri potim vikoristovuyetsya yak zvedena statistika dlya PBO PBO mozhe zastosovuvatisya dlya zadach visnovuvannya v parametrichnih prostorah visokoyi rozmirnosti hocha slid brati do uvagi mozhlivist perenavchannya napriklad div metodi viboru modeli v ta Tim ne mensh imovirnist prijnyattya simulovanih znachen parametriv za zadanogo dopusku v algoritmi vidhilennya PBO yak pravilo zmenshuyetsya eksponencijno zi zbilshennyam rozmirnosti prostoru parametriv cherez globalnij kriterij prijnyattya Hocha zhoden obchislyuvalnij metod chi to na osnovi PBO chi ni ne vidayetsya zdatnim do podolannya proklyattya rozmirnosti neshodavno bulo rozrobleno metodi shobi vporuvatisya z prostorami parametriv visokoyi rozmirnosti za pevnih pripushen napriklad na osnovi polinomialnogo nablizhennya rozridzhenih gratok sho potencijno mozhe silno zmenshuvati chas simulyaciyi dlya PBO Tim ne menshe zastosovnist cih metodiv zalezhit vid zadachi i nedoocinyuvati skladnist doslidzhennya prostoru parametriv u zagalnomu vipadku ne mozhna Napriklad vvedennya deterministskogo globalnogo ocinyuvannya parametriv prizvelo do povidomlen sho globalni optimumi otrimani v dekilkoh poperednih doslidzhennyah zadach nizkoyi rozmirnosti buli nepravilnimi Tomu dlya deyakih zadach mozhe buti skladno zrozumiti chi ye nepravilnoyu model yak obgovoryuvalosya vishe chi doslidzhena oblast prostoru parametriv ye nevidpovidnoyu Pragmatichnishim pidhodom mozhe buti skorochennya masshtabiv zadachi shlyahom skorochennya modeli Programne zabezpechennyaV danij chas dostupnij ryad programnih paketiv dlya zastosuvannya PBO do pevnih klasiv statistichnih modelej V tablici 3 predstavleno dobirku programnogo zabezpechennya na osnovi PBO Tablicya 3 Programne zabezpechennya sho vklyuchaye PBO Programa Klyuchovi slova ta vlastivosti PosilannyaDIY ABC Programa dlya pidgonki genetichnih danih do skladnih situacij Porivnyannya modelej konkurentiv Ocinyuvannya parametriv Obchislennya mir vidhilennya ta tochnosti dlya zadanoyi modeli ta vidomih znachen parametriv abc R package Dekilka algoritmiv PBO dlya vikonannya ocinki parametriv ta viboru modeli Metodi nelinijnoyi geteroskedastichnoyi regresiyi dlya PBO Instrument perehresnoyi perevirki EasyABC R package Dekilka algoritmiv dlya vikonannya efektivnih shem vibirki PBO vklyuchno z 4 poslidovnimi shemami vibirki ta 3 shemami MKML ABC SysBio Paket Python Otrimuvannya visnovkiv pro parametri ta obirannya modeli dlya dinamichnih sistem Poyednuye vibirku PBO z vidhilennyam en PBO dlya otrimuvannya visnovkiv pro parametri ta PMK PBO dlya viboru modeli Sumisnij z modelyami napisanim movoyu en SBML Determinovani ta stohastichni modeli ABCtoolbox Vidkrita programa z bagatma algoritmami PBO vklyuchno z vibirkoyu z vidhilennyam MKML bez pravdopodibnosti vibirkoyu na bazi chastinok ta ZLM PBO Sumisnist z bagatma programami simulyaciyi ta obchislennya zvedenih statistik msBayes Vidkritij programnij paket sho skladayetsya z kilkoh program C ta R sho zapuskayutsya interfejsnoyu programoyu Perl Iyerarhichni zrosheni modeli Dani populyacijnoyi genetiki z kilkoh spivrozpovsyudzhenih vidiv PopABC Programnij paket dlya otrimuvannya visnovkiv pro shemu demografichnoyi rozbizhnosti Zroshena simulyaciya Bayesove obirannya modeli ONeSAMP Vebprograma dlya ocinki efektivnogo rozmiru populyaciyi z vibirki mikrosatelitnih genotipiv Ocinki efektivnogo rozmiru populyaciyi razom z 95 vidsotkovimi jmovirnimi intervalami Programne zabezpechennya dlya ocinki en dlya dominantnih danih 2 podijna bayesova en Bayesian ADmixture Programne zabezpechennya sho pidtrimuye do dvoh nezalezhnih podij domishki j do troh batkivskih populyacij Ocinka dekilkoh parametriv domishka efektivni rozmiri tosho Porivnyannya par domishkovih modelej Pridatnist okremih programnih paketiv zalezhit vid konkretnih program sho ye v rozporyadzhenni komp yuternogo seredovisha ta potribnih algoritmiv Div takozhMetodi Monte Karlo markovskih lancyugiv en en Primitki Cya stattya mistit tekst iz zhurnalu PLoS Computational Biology pid licenziyeyu Creative Commons Attribution 2 5 Rubin DB 1984 Bayesianly Justifiable and Relevant Frequency Calculations for the Applies Statistician The Annals of Statistics 12 pp 1151 1172 angl Diggle PJ J GR 1984 Monte Carlo Methods of Inference for Implicit Statistical Models Journal of the Royal Statistical Society Series B 46 193 227 angl Bartlett MS 1963 The spectral analysis of point processes Journal of the Royal Statistical Society Series B 25 264 296 angl Hoel DG Mitchell TJ 1971 The simulation fitting and testing of a stochastic cellular proliferation model Biometrics 27 191 199 angl Tavare S Balding DJ Griffiths RC et al 1997 Inferring Coalescence Times From DNA Sequence Data Genetics 145 505 518 angl Pritchard JK Seielstad MT Perez Lezaun A et al 1999 Population Growth of Human Y Chromosomes A Study of Y Chromosome Microsatellites Molecular Biology and Evolution 16 1791 1798 angl Beaumont MA Zhang W Balding DJ 2002 Approximate Bayesian Computation in Population Genetics Genetics 162 2025 2035 angl Busetto A G Buhmann J Stable Bayesian Parameter Estimation for Biological Dynamical Systems 2009 IEEE Computer Society Press pp 148 157 angl Beaumont MA 2010 Approximate Bayesian Computation in Evolution and Ecology Annual Review of Ecology Evolution and Systematics 41 379 406 angl Bertorelle G Benazzo A Mona S 2010 ABC as a flexible framework to estimate demography over space and time some cons many pros Molecular Ecology 19 2609 2625 angl Csillery K Blum MGB Gaggiotti OE Francois O 2010 Approximate Bayesian Computation ABC in practice Trends in Ecology amp Evolution 25 410 418 angl Didelot X Everitt RG Johansen AM Lawson DJ 2011 Likelihood free estimation of model evidence Bayesian Analysis 6 49 76 angl Lai K Robertson MJ Schaffer DV 2004 The sonic hedgehog signaling system as a bistable genetic switch Biophys J 86 2748 2757 angl Marin JM Pudlo P Robert CP Ryder RJ 2012 Approximate Bayesian computational methods Statistics and Computing 22 6 1167 1180 angl Wilkinson R G 2007 Bayesian Estimation of Primate Divergence Times Ph D thesis University of Cambridge angl Grelaud A Marin J M Robert C Rodolphe F Tally F 2009 Likelihood free methods for model choice in Gibbs random fields Bayesian Analysis 3 427 442 angl Toni T Stumpf MPH 2010 Simulation based model selection for dynamical systems in systems and population biology Bioinformatics 26 1 104 10 angl en 2009 Why does a method that fails continue to be used The answer Evolution 63 807 812 angl Robert CP Cornuet J M Marin J M Pillai NS 2011 Lack of confidence in approximate Bayesian computation model choice Proc Natl Acad Sci U S A 108 15112 15117 angl Templeton AR 2008 Nested clade analysis an extensively validated method for strong phylogeographic inference Molecular Ecology 17 1877 1880 angl Templeton AR 2009 Statistical hypothesis testing in intraspecific phylogeography nested clade phylogeographical analysis vs approximate Bayesian computation Molecular Ecology 18 319 331 angl Berger JO Fienberg SE Raftery AE Robert CP 2010 Incoherent phylogeographic inference Proceedings of the National Academy of Sciences of the United States of America 107 E157 E157 angl Sisson SA Fan Y Tanaka MM 2007 Sequential Monte Carlo without likelihoods Proc Natl Acad Sci U S A 104 1760 1765 Dean TA Singh SS Jasra A Peters GW 2011 Parameter estimation for hidden markov models with intractable likelihoods arXiv 11035399v1 mathST 28 Mar 2011 angl Fearnhead P Prangle D 2011 Constructing Summary Statistics for Approximate Bayesian Computation Semi automatic ABC ArXiv 10041112v2 statME 13 Apr 2011 Blum M Francois O 2010 Non linear regression models for approximate Bayesian computation Stat Comp 20 63 73 angl Leuenberger C Wegmann D 2009 Bayesian Computation and Model Selection Without Likelihoods Genetics 184 243 252 angl Wilkinson RD 2009 Approximate Bayesian computation ABC gives exact results under the assumption of model error arXiv 08113355 angl Blum MGB Nunes MA Prangle D Sisson SA 2012 A comparative review of dimension reduction methods in approximate Bayesian computation arxiv org abs 1202 3819 angl Nunes MA Balding DJ 2010 On optimal selection of summary statistics for approximate Bayesian computation Stat Appl Genet Mol Biol 9 Article 34 angl Joyce P Marjoram P 2008 Approximately sufficient statistics and bayesian computation Stat Appl Genet Mol Biol 7 Article 26 angl Wegmann D Leuenberger C Excoffier L 2009 Efficient approximate Bayesian computation coupled with Markov chain Monte Carlo without likelihood Genetics 182 1207 1218 angl Marjoram P Molitor J Plagnol V Tavare S 2003 Markov chain Monte Carlo without likelihoods Proc Natl Acad Sci U S A 100 15324 15328 angl Marin J M Pillai NS Robert CP Rousseau J 2011 Relevant statistics for Bayesian model choice ArXiv 11104700v1 mathST 21 Oct 2011 1 24 angl Toni T Welch D Strelkowa N Ipsen A Stumpf M 2007 Approximate Bayesian computation scheme for parameter inference and model selection in dynamical systems J R Soc Interface 6 187 202 angl Arlot S Celisse A 2010 A survey of cross validation procedures for model selection Statistical surveys 4 40 79 angl Dawid A Present position and potential developments Some personal views Statistical theory The prequential approach Journal of the Royal Statistical Society Series A 1984 278 292 angl Vehtari A Lampinen J 2002 Bayesian model assessment and comparison using cross validation predictive densities Neural Computation 14 2439 2468 angl Ratmann O Andrieu C Wiuf C Richardson S 2009 Model criticism based on likelihood free inference with an application to protein network evolution Proceedings of the National Academy of Sciences of the United States of America 106 10576 10581 angl Francois O Laval G 2011 Deviance Information Criteria for Model Selection in Approximate Bayesian Computation Stat Appl Genet Mol Biol 10 Article 33 angl Templeton AR 2010 Coherent and incoherent inference in phylogeography and human evolution Proceedings of the National Academy of Sciences of the United States of America 107 6376 6381 angl Beaumont MA Nielsen R Robert C Hey J Gaggiotti O et al 2010 In defence of model based inference in phylogeography Molecular Ecology 19 436 446 angl Jaynes ET 1968 Prior Probabilities IEEE Transactions on Systems Science and Cybernetics 4 angl Berger J O 2006 The case for objective Bayesian analysis Bayesian Analysis 1 385 402 and 457 464 angl Beaumont MA Cornuet J M Marin J M Robert CP 2009 Adaptive approximate Bayesian computation Biometrika 96 983 990 angl Del Moral P Doucet A Jasra A 2011 in press An adaptive sequential Monte Carlo method for approximate Bayesian computation Statistics and computing angl Feng X Buell DA Rose JR Waddellb PJ 2003 Parallel Algorithms for Bayesian Phylogenetic Inference Journal of Parallel and Distributed Computing 63 707 718 angl Bellman R 1961 Adaptive Control Processes A Guided Tour Princeton University Press angl Blum MGB 2010 Approximate Bayesian Computation a nonparametric perspective Journal of the American Statistical Association 105 1178 1187 angl Fearnhead P Prangle D 2012 Constructing summary statistics for approximate Bayesian computation semi automatic approximate Bayesian computation Journal of the Royal Statistical Society Series B 74 3 419 474 angl Gerstner T Griebel M 2003 Dimension Adaptive Tensor Product Quadrature Computing 71 65 87 angl Singer AB Taylor JW Barton PI Green WH 2006 Global dynamic optimization for parameter estimation in chemical kinetics J Phys Chem A 110 971 976 angl Cornuet J M Santos F Beaumont M et al 2008 Inferring population history with DIY ABC a user friendly approach to approximate Bayesian computation Bioinformatics 24 23 2713 2719 angl Csillery K Francois O Blum MGB 2012 abc an R package for approximate Bayesian computation ABC Methods in Ecology and Evolution 3 475 479 angl Csillery K Francois O Blum MGB 21 lyutogo 2012 Approximate Bayesian Computation ABC in R A Vignette PDF Procitovano 10 May 2013 Jabot F Faure T Dumoulin N EasyABC performing efficient approximate Bayesian computation sampling schemes using R Methods in Ecology and Evolution 4 684 687 Jabot F Faure T Dumoulin N 3 chervnya 2013 PDF Arhiv originalu PDF za 18 serpnya 2016 Procitovano 3 serpnya 2016 Liepe J Barnes C Cule E Erguler K Kirk P Toni T Stumpf MP 2010 ABC SysBio approximate Bayesian computation in Python with GPU support Bioinformatics 26 1797 1799 angl Wegmann D Leuenberger C Neuenschwander S Excoffier L 2010 ABCtoolbox a versatile toolkit for approximate Bayesian computations BMC Bioinformatics 11 116 angl Hickerson MJ Stahl E Takebayashi N 2007 msBayes Pipeline for testing comparative phylogeographic histories using hierarchical approximate Bayesian computation BMC Bioinformatics 8 268 1471 2105 angl Lopes JS Balding D Beaumont MA 2009 PopABC a program to infer historical demographic parameters Bioinformatics 25 2747 2749 angl Tallmon DA Koyuk A Luikart G Beaumont MA 2008 COMPUTER PROGRAMS onesamp a program to estimate effective population size using approximate Bayesian computation Molecular Ecology Resources 8 299 301 angl Foll M Baumont MA Gaggiotti OE 2008 An Approximate Bayesian Computation approach to overcome biases that arise when using AFLP markers to study population structure Genetics 179 927 939 angl Bray TC Sousa VC Parreira B Bruford MW Chikhi L 2010 2BAD an application to estimate the parental contributions during two independent admisture events Molecular Ecology Resources 10 3 538 541 angl PosilannyaDarren Wilkinson 31 bereznya 2013 Introduction to Approximate Bayesian Computation Procitovano 31 bereznya 2013 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a Cite maye pustij nevidomij parametr 1 dovidka angl Rasmus Baath 20 zhovtnya 2014 Tiny Data Approximate Bayesian Computation and the Socks of Karl Broman Procitovano 22 sichnya 2015 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a Cite maye pustij nevidomij parametr 1 dovidka angl