У теорії рішень алгоритм шансів (або алгоритм Брюсса) — це математичний метод обчислення оптимальних стратегій для класу задач, які належать до області задач оптимальної зупинки. Їх розв'язок випливає зі стратегії шансів, а важливість стратегії шансів полягає в її оптимальності, як пояснюється нижче.
Алгоритм шансів застосовується до класу проблем, які називаються проблемами останнього успіху. Формально метою цих задач є максимізація ймовірності ідентифікації в послідовності незалежних подій саме останньої події, яка задовольняє певному критерію («специфічна подія»). Ця ідентифікація повинна бути зроблена в момент спостереження. Повернення до попередніх спостережень не дозволяється. Зазвичай особлива подія визначається особою, яка приймає рішення, як подія, що становить справжній інтерес з погляду «зупинки» для здійснення чітко визначеної дії. Такі проблеми виникають у кількох ситуаціях.
Приклади
Дві різні ситуації є прикладами зацікавленості в максимізації ймовірності зупинитися на останній події.
- Припустимо, що автомобіль виставлено на продаж тому, хто запропонує найвищу ціну (найкращу «пропозицію»). Нехай потенційних покупців відгукнулися і попросили показати їм машину. Кожен з них наполягає на негайному рішенні продавця прийняти пропозицію чи ні. Визначимо пропозицію як цікаву і закодуємо її 1, якщо вона краща за всі попередні пропозиції, і 0 в іншому випадку. Пропозиції формують [en] з 0 та 1. Тільки 1 цікавлять продавця, який може побоюватися, що кожна наступна 1 може стати останньою. З визначення випливає, що остання 1 є найвищою ставкою. Отже, максимізація ймовірності продажу за останньою одиницею означає максимізацію ймовірності продажу за найкращою ціною.
- Лікар, застосовуючи спеціальне лікування, може використовувати код 1 для успішного лікування, 0 — у протилежному випадку. Лікар лікує послідовність з пацієнтів однаковим чином і хоче мінімізувати будь-які страждання, а також вилікувати кожного пацієнта, який реагує на лікування. Зупинившись на останній 1 у такій випадковій послідовності 0 і 1, він досягне цієї мети. Оскільки лікар не пророк, його мета — максимізувати ймовірність зупинки на останній 1 (див. розділ [en]).
Визначення
Розглянемо послідовність незалежних подій. Пов'яжемо із цією послідовністю іншу послідовність незалежних подій зі значеннями 1 або 0. тут , що називається успіхом, означає подію, що k-те спостереження є цікавим (як визначено особою, яка приймає рішення), і для нецікавих. Ці випадкові величини спостерігаються послідовно, і мета полягає в тому, щоб правильно вибрати останній успіх, коли він спостерігається.
Нехай ймовірність того, що k-та подія є цікавою. Далі нехай і . Зауважимо, що представляє [en] на те, що k-та подія виявиться цікавою, пояснюючи назву алгоритму шансів.
Алгоритмічна процедура
Алгоритм шансів підсумовує шанси у зворотному порядку
доки ця сума вперше не досягне або не перевищить значення 1. Якщо це відбувається з індексом s, зберігається s і відповідна сума
Якщо сума шансів не досягає 1, встановлюється s = 1. Водночас він обчислює
Вихід є
- , поріг зупинки
- , ймовірність виграшу.
Стратегія шансів
Стратегія шансів — це правило спостереження за подіями одна за одною та зупинка на першій цікавій події від індексу s (якщо є), де s — поріг зупинки результату a.
Важливість стратегії шансів, а отже й алгоритму шансів, полягає в наступній теоремі шансів.
Теорема шансів
Теорема шансів стверджує, що
- Стратегія шансів є оптимальною, тобто вона максимізує ймовірність зупинки на останній 1.
- Імовірність виграшу стратегії шансів дорівнює
- Якщо , ймовірність виграшу завжди принаймні 1/e = 0.367879.... і ця нижня межа є найкращою з можливих.
Особливості
Алгоритм шансів обчислює оптимальну стратегію та оптимальну ймовірність виграшу одночасно. Крім того, кількість операцій алгоритму шансів є (суб)лінійною по n. Отже, не може існувати швидшого алгоритму для всіх послідовностей, так що алгоритм шансів водночас є оптимальним як алгоритм.
Джерела
Алгоритм шансів розробив Брюсс, 2000 року, який і придумав його назву. Він також відомий як алгоритм (стратегія) Брюсса. Безкоштовні втілення можна знайти в Інтернеті.
Застосування
Застосування алгоритму шансів охоплюють медичні питання в клінічних випробуваннях, проблеми з продажем, секретарські проблеми, вибір портфоліо, (односторонні) стратегії пошуку, проблеми траєкторії та [en] до проблем онлайн-обслуговування тощо.
Також існує теорема шансів для безперервних процесів надходження з [en], таких як процес Пуассона (Брюсс, 2000). У деяких випадках шанси не обов'язково відомі заздалегідь (як у прикладі 2 вище), тому застосування алгоритму шансів безпосередньо неможливо. У цьому випадку кожен крок може використовувати шансів. Це має сенс, якщо кількість невідомих параметрів невелика порівняно з кількістю спостережень n. Питання оптимальності тоді є складнішим, однак, і вимагає додаткових досліджень. Узагальнення алгоритму шансів дозволяють отримати різну винагороду за невдалу і помилкову зупинку, а також замінити припущення про незалежність на слабші (Фергюсон, 2008).
Варіації
Брюсс та Пейндавейн, 2000 обговорювали проблему вибору останніх успіхів.
Тамакі, 2010 довів теорему про мультиплікативні шанси, яка розглядає проблему зупинки на будь-якому з останніх успіхів.
Жорстка нижня межа ймовірності виграшу отримана за формулою Мацуї та Ано, 2014.
Мацуї та Ано, 2017 обговорили проблему вибору з останніх і отримали жорстку нижню межу ймовірності виграшу. Коли задача еквівалентна задачі Брюсса про шанси. Якщо задача еквівалентна задачі в Брюсс та Пейндавейн, 2000. Задача, що розглядається в Тамакі, 2010 отримується за умови, що
Проблема множинного вибору
Гравцеві дозволено виборів, і він виграє, якщо будь-який вибір є останнім успішним. Для класичної проблеми секретаря Гілберт та Мостеллер, 1966 обговорили випадки . Проблема шансів з обговорюється Ано, Какінума та Мійоші, 2010. Додаткові випадки проблеми шансів див. у Мацуї та Ано, 2016.
Оптимальна стратегія для цієї задачі належить до класу стратегій, визначених набором порогових чисел , де .
Зокрема, уявіть, що у вас є листів-зобов'язань, позначених від до . У вас буде працівників, кожен з яких тримає одну літеру. Ви продовжуєте проводити співбесіди з кандидатами й заносите їх у таблицю, яку бачить кожен з них. Зараз працівник надсилає лист-відповідь про прийняття на роботу першому кандидату, який виявився кращим за всіх інших кандидатів до . (Невідправлені листи про прийняття за замовчуванням віддаються останнім заявникам, так само як і у стандартній задачі про секретаря).
Коли , Ано, Какінума та Мійоші, 2010 показали, що нижня межа ймовірності виграшу дорівнює Для загального натурального числа , Мацуї та Ано, 2016 довели, що нижня межа ймовірності виграшу є ймовірністю виграшу у варіанті задачі секретаря, де потрібно вибрати k кращих кандидатів, використовуючи лише k спроб.
Коли , нижні межі ймовірностей виграшу дорівнюють , і відповідно.
Щодо подальших числових випадків для , а також алгоритму для загальних випадків, див. Мацуї та Ано, 2016.
Див. також
Список літератури
- Ano, K.; Kakinuma, H.; Miyoshi, N. (2010). Odds theorem with multiple selection chances. Journal of Applied Probability. 47 (4): 1093—1104. doi:10.1239/jap/1294170522.
- (2000). Sum the odds to one and stop. The Annals of Probability. Institute of Mathematical Statistics. 28 (3): 1384—1391. doi:10.1214/aop/1019160340. ISSN 0091-1798.
- «A note on Bounds for the Odds Theorem of Optimal Stopping», [en] Vol. 31, 1859—1862, (2003).
- «», Newsletter of the European Mathematical Society, Issue 62, 14–20, (2005).
- [en]: (2008, unpublished)
- Bruss, F. T.; Paindaveine, D. (2000). Selecting a sequence of last successes in independent trials (PDF). Journal of Applied Probability. 37 (2): 389—399. doi:10.1239/jap/1014842544.
- Gilbert, J; Mosteller, F (1966). Recognizing the Maximum of a Sequence. Journal of the American Statistical Association. 61 (313): 35—73. doi:10.2307/2283044. JSTOR 2283044.
- Matsui, T; Ano, K (2014). A note on a lower bound for the multiplicative odds theorem of optimal stopping. Journal of Applied Probability. 51 (3): 885—889. doi:10.1239/jap/1409932681.
- Matsui, T; Ano, K (2016). Lower bounds for Bruss' odds problem with multiple stoppings. [en]. 41 (2): 700—714. arXiv:1204.5537. doi:10.1287/moor.2015.0748.
- Matsui, T; Ano, K (2017). Compare the ratio of symmetric polynomials of odds to one and stop. Journal of Applied Probability. 54: 12—22. doi:10.1017/jpr.2016.83.
- Shoo-Ren Hsiao and Jiing-Ru. Yang: «Selecting the Last Success in Markov-Dependent Trials», [en], Vol. 93, 271—281, (2002).
- Tamaki, M (2010). Sum the multiplicative odds to one and stop. Journal of Applied Probability. 47 (3): 761—777. doi:10.1239/jap/1285335408.
- Mitsushi Tamaki: «Optimal Stopping on Trajectories and the Ballot Problem», [en] Vol. 38, 946—959 (2001).
- E. Thomas, E. Levrat, B. Iung: «L'algorithme de Bruss comme contribution à une maintenance préventive», , Vol. 4, 13-18 (2007).
Посилання
- Алгоритм Брюсса http://www.p-roesler.de/odds.html
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U teoriyi rishen algoritm shansiv abo algoritm Bryussa ce matematichnij metod obchislennya optimalnih strategij dlya klasu zadach yaki nalezhat do oblasti zadach optimalnoyi zupinki Yih rozv yazok viplivaye zi strategiyi shansiv a vazhlivist strategiyi shansiv polyagaye v yiyi optimalnosti yak poyasnyuyetsya nizhche Algoritm shansiv zastosovuyetsya do klasu problem yaki nazivayutsya problemami ostannogo uspihu Formalno metoyu cih zadach ye maksimizaciya jmovirnosti identifikaciyi v poslidovnosti nezalezhnih podij same ostannoyi podiyi yaka zadovolnyaye pevnomu kriteriyu specifichna podiya Cya identifikaciya povinna buti zroblena v moment sposterezhennya Povernennya do poperednih sposterezhen ne dozvolyayetsya Zazvichaj osobliva podiya viznachayetsya osoboyu yaka prijmaye rishennya yak podiya sho stanovit spravzhnij interes z poglyadu zupinki dlya zdijsnennya chitko viznachenoyi diyi Taki problemi vinikayut u kilkoh situaciyah PrikladiDvi rizni situaciyi ye prikladami zacikavlenosti v maksimizaciyi jmovirnosti zupinitisya na ostannij podiyi Pripustimo sho avtomobil vistavleno na prodazh tomu hto zaproponuye najvishu cinu najkrashu propoziciyu Nehaj n displaystyle n potencijnih pokupciv vidguknulisya i poprosili pokazati yim mashinu Kozhen z nih napolyagaye na negajnomu rishenni prodavcya prijnyati propoziciyu chi ni Viznachimo propoziciyu yak cikavu i zakoduyemo yiyi 1 yaksho vona krasha za vsi poperedni propoziciyi i 0 v inshomu vipadku Propoziciyi formuyut en z 0 ta 1 Tilki 1 cikavlyat prodavcya yakij mozhe poboyuvatisya sho kozhna nastupna 1 mozhe stati ostannoyu Z viznachennya viplivaye sho ostannya 1 ye najvishoyu stavkoyu Otzhe maksimizaciya jmovirnosti prodazhu za ostannoyu odiniceyu oznachaye maksimizaciyu jmovirnosti prodazhu za najkrashoyu cinoyu Likar zastosovuyuchi specialne likuvannya mozhe vikoristovuvati kod 1 dlya uspishnogo likuvannya 0 u protilezhnomu vipadku Likar likuye poslidovnist z n displaystyle n paciyentiv odnakovim chinom i hoche minimizuvati bud yaki strazhdannya a takozh vilikuvati kozhnogo paciyenta yakij reaguye na likuvannya Zupinivshis na ostannij 1 u takij vipadkovij poslidovnosti 0 i 1 vin dosyagne ciyeyi meti Oskilki likar ne prorok jogo meta maksimizuvati jmovirnist zupinki na ostannij 1 div rozdil en ViznachennyaRozglyanemo poslidovnist n displaystyle n nezalezhnih podij Pov yazhemo iz ciyeyu poslidovnistyu inshu poslidovnist nezalezhnih podij I 1 I 2 I n displaystyle I 1 I 2 dots I n zi znachennyami 1 abo 0 tut I k 1 displaystyle I k 1 sho nazivayetsya uspihom oznachaye podiyu sho k te sposterezhennya ye cikavim yak viznacheno osoboyu yaka prijmaye rishennya i I k 0 displaystyle I k 0 dlya necikavih Ci vipadkovi velichini I 1 I 2 I n displaystyle I 1 I 2 dots I n sposterigayutsya poslidovno i meta polyagaye v tomu shob pravilno vibrati ostannij uspih koli vin sposterigayetsya Nehaj p k P I k 1 displaystyle p k P I k 1 jmovirnist togo sho k ta podiya ye cikavoyu Dali nehaj q k 1 p k displaystyle q k 1 p k i r k p k q k displaystyle r k p k q k Zauvazhimo sho r k displaystyle r k predstavlyaye en na te sho k ta podiya viyavitsya cikavoyu poyasnyuyuchi nazvu algoritmu shansiv Algoritmichna proceduraAlgoritm shansiv pidsumovuye shansi u zvorotnomu poryadku r n r n 1 r n 2 displaystyle r n r n 1 r n 2 cdots doki cya suma vpershe ne dosyagne abo ne perevishit znachennya 1 Yaksho ce vidbuvayetsya z indeksom s zberigayetsya s i vidpovidna suma R s r n r n 1 r n 2 r s displaystyle R s r n r n 1 r n 2 cdots r s Yaksho suma shansiv ne dosyagaye 1 vstanovlyuyetsya s 1 Vodnochas vin obchislyuye Q s q n q n 1 q s displaystyle Q s q n q n 1 cdots q s Vihid ye s displaystyle s porig zupinki w Q s R s displaystyle w Q s R s jmovirnist vigrashu Strategiya shansivStrategiya shansiv ce pravilo sposterezhennya za podiyami odna za odnoyu ta zupinka na pershij cikavij podiyi vid indeksu s yaksho ye de s porig zupinki rezultatu a Vazhlivist strategiyi shansiv a otzhe j algoritmu shansiv polyagaye v nastupnij teoremi shansiv Teorema shansivTeorema shansiv stverdzhuye sho Strategiya shansiv ye optimalnoyu tobto vona maksimizuye jmovirnist zupinki na ostannij 1 Imovirnist vigrashu strategiyi shansiv dorivnyuye w Q s R s displaystyle w Q s R s Yaksho R s 1 displaystyle R s geq 1 jmovirnist vigrashu w displaystyle w zavzhdi prinajmni 1 e 0 367879 i cya nizhnya mezha ye najkrashoyu z mozhlivih OsoblivostiAlgoritm shansiv obchislyuye optimalnu strategiyu ta optimalnu jmovirnist vigrashu odnochasno Krim togo kilkist operacij algoritmu shansiv ye sub linijnoyu po n Otzhe ne mozhe isnuvati shvidshogo algoritmu dlya vsih poslidovnostej tak sho algoritm shansiv vodnochas ye optimalnim yak algoritm DzherelaAlgoritm shansiv rozrobiv Bryuss 2000 roku yakij i pridumav jogo nazvu Vin takozh vidomij yak algoritm strategiya Bryussa Bezkoshtovni vtilennya mozhna znajti v Interneti ZastosuvannyaZastosuvannya algoritmu shansiv ohoplyuyut medichni pitannya v klinichnih viprobuvannyah problemi z prodazhem sekretarski problemi vibir portfolio odnostoronni strategiyi poshuku problemi trayektoriyi ta en do problem onlajn obslugovuvannya tosho Takozh isnuye teorema shansiv dlya bezperervnih procesiv nadhodzhennya z en takih yak proces Puassona Bryuss 2000 U deyakih vipadkah shansi ne obov yazkovo vidomi zazdalegid yak u prikladi 2 vishe tomu zastosuvannya algoritmu shansiv bezposeredno nemozhlivo U comu vipadku kozhen krok mozhe vikoristovuvati shansiv Ce maye sens yaksho kilkist nevidomih parametriv nevelika porivnyano z kilkistyu sposterezhen n Pitannya optimalnosti todi ye skladnishim odnak i vimagaye dodatkovih doslidzhen Uzagalnennya algoritmu shansiv dozvolyayut otrimati riznu vinagorodu za nevdalu i pomilkovu zupinku a takozh zaminiti pripushennya pro nezalezhnist na slabshi Fergyuson 2008 VariaciyiBryuss ta Pejndavejn 2000 obgovoryuvali problemu viboru ostannih k displaystyle k uspihiv Tamaki 2010 doviv teoremu pro multiplikativni shansi yaka rozglyadaye problemu zupinki na bud yakomu z ostannih ℓ displaystyle ell uspihiv Zhorstka nizhnya mezha jmovirnosti vigrashu otrimana za formuloyu Macuyi ta Ano 2014 Macuyi ta Ano 2017 obgovorili problemu viboru k displaystyle k z ostannih ℓ displaystyle ell i otrimali zhorstku nizhnyu mezhu jmovirnosti vigrashu Koli ℓ k 1 displaystyle ell k 1 zadacha ekvivalentna zadachi Bryussa pro shansi Yaksho ℓ k 1 displaystyle ell k geq 1 zadacha ekvivalentna zadachi v Bryuss ta Pejndavejn 2000 Zadacha sho rozglyadayetsya v Tamaki 2010 otrimuyetsya za umovi sho ℓ k 1 displaystyle ell geq k 1 Problema mnozhinnogo viboru Gravcevi dozvoleno r displaystyle r viboriv i vin vigraye yaksho bud yakij vibir ye ostannim uspishnim Dlya klasichnoyi problemi sekretarya Gilbert ta Mosteller 1966 obgovorili vipadki r 2 3 4 displaystyle r 2 3 4 Problema shansiv z r 2 3 displaystyle r 2 3 obgovoryuyetsya Ano Kakinuma ta Mijoshi 2010 Dodatkovi vipadki problemi shansiv div u Macuyi ta Ano 2016 Optimalna strategiya dlya ciyeyi zadachi nalezhit do klasu strategij viznachenih naborom porogovih chisel a 1 a 2 a r displaystyle a 1 a 2 a r de a 1 gt a 2 gt gt a r displaystyle a 1 gt a 2 gt cdots gt a r Zokrema uyavit sho u vas ye r displaystyle r listiv zobov yazan poznachenih vid 1 displaystyle 1 do r displaystyle r U vas bude r displaystyle r pracivnikiv kozhen z yakih trimaye odnu literu Vi prodovzhuyete provoditi spivbesidi z kandidatami j zanosite yih u tablicyu yaku bachit kozhen z nih Zaraz pracivnik i displaystyle i nadsilaye list vidpovid pro prijnyattya na robotu pershomu kandidatu yakij viyavivsya krashim za vsih inshih kandidativ 1 displaystyle 1 do a i displaystyle a i Nevidpravleni listi pro prijnyattya za zamovchuvannyam viddayutsya ostannim zayavnikam tak samo yak i u standartnij zadachi pro sekretarya Koli r 2 displaystyle r 2 Ano Kakinuma ta Mijoshi 2010 pokazali sho nizhnya mezha jmovirnosti vigrashu dorivnyuye e 1 e 3 2 displaystyle e 1 e frac 3 2 Dlya zagalnogo naturalnogo chisla r displaystyle r Macuyi ta Ano 2016 doveli sho nizhnya mezha jmovirnosti vigrashu ye jmovirnistyu vigrashu u varianti zadachi sekretarya de potribno vibrati k krashih kandidativ vikoristovuyuchi lishe k sprob Koli r 3 4 5 displaystyle r 3 4 5 nizhni mezhi jmovirnostej vigrashu dorivnyuyut e 1 e 3 2 e 47 24 displaystyle e 1 e frac 3 2 e frac 47 24 e 1 e 3 2 e 47 24 e 2761 1152 displaystyle e 1 e frac 3 2 e frac 47 24 e frac 2761 1152 i e 1 e 3 2 e 47 24 e 2761 1152 e 4162637 1474560 displaystyle e 1 e frac 3 2 e frac 47 24 e frac 2761 1152 e frac 4162637 1474560 vidpovidno Shodo podalshih chislovih vipadkiv dlya r 6 10 displaystyle r 6 10 a takozh algoritmu dlya zagalnih vipadkiv div Macuyi ta Ano 2016 Div takozh en Klinichne viprobuvannya Zadacha pro perebirlivu narechenuSpisok literaturiAno K Kakinuma H Miyoshi N 2010 Odds theorem with multiple selection chances Journal of Applied Probability 47 4 1093 1104 doi 10 1239 jap 1294170522 2000 Sum the odds to one and stop The Annals of Probability Institute of Mathematical Statistics 28 3 1384 1391 doi 10 1214 aop 1019160340 ISSN 0091 1798 A note on Bounds for the Odds Theorem of Optimal Stopping en Vol 31 1859 1862 2003 Newsletter of the European Mathematical Society Issue 62 14 20 2005 en 2008 unpublished Bruss F T Paindaveine D 2000 Selecting a sequence of last successes in independent trials PDF Journal of Applied Probability 37 2 389 399 doi 10 1239 jap 1014842544 Gilbert J Mosteller F 1966 Recognizing the Maximum of a Sequence Journal of the American Statistical Association 61 313 35 73 doi 10 2307 2283044 JSTOR 2283044 Matsui T Ano K 2014 A note on a lower bound for the multiplicative odds theorem of optimal stopping Journal of Applied Probability 51 3 885 889 doi 10 1239 jap 1409932681 Matsui T Ano K 2016 Lower bounds for Bruss odds problem with multiple stoppings en 41 2 700 714 arXiv 1204 5537 doi 10 1287 moor 2015 0748 Matsui T Ano K 2017 Compare the ratio of symmetric polynomials of odds to one and stop Journal of Applied Probability 54 12 22 doi 10 1017 jpr 2016 83 Shoo Ren Hsiao and Jiing Ru Yang Selecting the Last Success in Markov Dependent Trials en Vol 93 271 281 2002 Tamaki M 2010 Sum the multiplicative odds to one and stop Journal of Applied Probability 47 3 761 777 doi 10 1239 jap 1285335408 Mitsushi Tamaki Optimal Stopping on Trajectories and the Ballot Problem en Vol 38 946 959 2001 E Thomas E Levrat B Iung L algorithme de Bruss comme contribution a une maintenance preventive Vol 4 13 18 2007 PosilannyaAlgoritm Bryussa http www p roesler de odds html