У статистиці відстань Бгаттачар'я вимірює подібність двох розподілів ймовірностей. Поняття тісно пов’язано з коефіцієнтом Бгаттачар'я, який є мірою величини перекриття двох статистичних вибірок. Обидва показники названі на честь , статиста, який працював у 1930-х роках в .
Коефіцієнт можна використовувати для визначення відносної близькості двох вибірок, що розглядаються. Також використовується для вимірювання роздільності класів у класифікації, і вважається більш надійним, ніж відстань Махаланобіса, оскільки відстань Махаланобіса є окремим випадком відстані Бхаттачар'я, коли нормальні відхилення двох класів однакові. Отже, коли два класи мають схожі математичні очікування, але різні нормальні відхилення, відстань Махаланобіса прямує нуля, тоді як відстань Бгаттачарія зростає залежно від різниці між нормальними відхиленнями.
Визначення
Для розподілу ймовірностей p і q в одній області X відстань Бгаттачар'я визначається як
де
є коефіцієнтом Бгаттачар'я для дискретних розподілів ймовірностей .
Для неперервного розподілу ймовірностей коефіцієнт Бгаттачар'я визначається як
В будь-якому випадку, і . не виконує нерівності трикутника.
У найпростішому формулюванні відстань Бгаттачар'я між двома класами за нормального розподілу можна обчислити, за математичним очікуванням та дисперсією двох окремих розподілів або класів:
де:
— дисперсія розподілу p, | |
— математичне очікування розподілу p, і | |
— два різні розподіли. |
Відстань Махаланобіса, що використовується в лінійному дискримінантному аналізі Фішера, є окремим випадком відстані Бгаттачар'я.
Для багатовимірних нормальних розподілів ,
де і є математичними очікуваннями та коваріантами розподілів, і
Зверніть увагу, що в цьому випадку перший член у відстані Бгаттачар'я пов'язаний з відстанню Махаланобіса.
Коефіцієнт Бгаттачар'я
Коефіцієнт Бгаттачар'я — це наближене вимірювання величини перекриття двох статистичних вибірок. Коефіцієнт можна використовувати для визначення відносної близькості двох зразків, що розглядаються.
Розрахунок коефіцієнта Бгаттачар'я передбачає елементарну форму інтегрування перекриття двох зразків. Інтервал значень двох зразків розбивається на обрану кількість розділів, і кількість членів кожного зразка в кожному розділі використовується в наступній формулі,
де, враховуючи зразки p і q, n — кількість розділів, і , — це кількість членів вибірки p і q в i-му розділі.
Отже, ця формула більша для кожного розділу, який містить члени обох зразків, та для кожного розділу, який має велике перекриття двох членів зразка всередині нього. Вибір кількості розділів залежить від кількості членів у кожній вибірці; при занадто малій кількості розділів втрачається точність через погану оцінку області перекриття, а при великій кількості розділів можна отримати такі, що не міститимуть жодного члена, навіть якщо вони розташовані у досить густому просторі вибірки.
Коефіцієнт Бгаттачар'я дорівнюватиме 0, якщо через множення на нуль дві вибірки не мають перекриття. Це означає, що відстань між повністю відокремленими зразками не буде піддаватися лише цьому коефіцієнту.
Коефіцієнт Бгаттачар'я використовується при побудові полярних кодів.
Застосування
Відстань Бхаттачарія широко використовується в дослідженнях вилучення та вибору функцій, обробки зображень, розпізнавання динаміків та кластеризації телефонів.
Пропонований "простір Бгаттачар'я" як техніка вибору властивостей, може бути застосований до сегментації текстур.
Див. також
Примітки
- Bhattacharyya, A. (1943). On a measure of divergence between two statistical populations defined by their probability distributions. Bulletin of the . 35: 99—109. MR 0010358.
- Guy B. Coleman, Harry C. Andrews, "Image Segmentation by Clustering", Proc IEEE, Vol. 67, No. 5, pp. 773–785, 1979
- Arıkan, Erdal (July 2009). Channel polarization: A method for constructing capacity-achieving codes for symmetric binary-input memoryless channels. IEEE Transactions on Information Theory. 55 (7): 3051—3073. arXiv:0807.3917. doi:10.1109/TIT.2009.2021379.
- Euisun Choi, Chulhee Lee, "Feature extraction based on the Bhattacharyya distance", Pattern Recognition, Volume 36, Issue 8, August 2003, Pages 1703–1709
- François Goudail, Philippe Réfrégier, Guillaume Delyon, "Bhattacharyya distance as a contrast parameter for statistical processing of noisy optical images", JOSA A, Vol. 21, Issue 7, pp. 1231−1240 (2004)
- Chang Huai You, "An SVM Kernel With GMM-Supervector Based on the Bhattacharyya Distance for Speaker Recognition", Signal Processing Letters, IEEE, Vol 16, Is 1, pp. 49-52
- Mak, B., "Phone clustering using the Bhattacharyya distance", Spoken Language, 1996. ICSLP 96. Proceedings., Fourth International Conference on, Vol 4, pp. 2005–2008 vol.4, 3−6 Oct 1996
- Reyes-Aldasoro, C.C., and A. Bhalerao, "The Bhattacharyya space for feature selection and its application to texture segmentation", Pattern Recognition, (2006) Vol. 39, Issue 5, May 2006, pp. 812–826
Список літератури
- Nielsen, F.; Boltz, S. (2010). The Burbea–Rao and Bhattacharyya centroids. IEEE Transactions on Information Theory. 57 (8): 5455—5466. arXiv:1004.5049. doi:10.1109/TIT.2011.2159046.
- Kailath, T. (1967). The Divergence and Bhattacharyya Distance Measures in Signal Selection. IEEE Transactions on Communication Technology. 15 (1): 52—60. doi:10.1109/TCOM.1967.1089532.
- Djouadi, A.; Snorrason, O.; Garber, F. (1990). The quality of Training-Sample estimates of the Bhattacharyya coefficient. . 12 (1): 92—97. doi:10.1109/34.41388.
- Короткий перелік властивостей див .: http://www.mtm.ufsc.br/~taneja/book/node20.html [ 11 квітня 2021 у Wayback Machine.]
Ланки
- Hazewinkel, Michiel, ред. (2001), distance Bhattacharyya distance, Математична енциклопедія, , ISBN
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
U statistici vidstan Bgattachar ya vimiryuye podibnist dvoh rozpodiliv jmovirnostej Ponyattya tisno pov yazano z koeficiyentom Bgattachar ya yakij ye miroyu velichini perekrittya dvoh statistichnih vibirok Obidva pokazniki nazvani na chest statista yakij pracyuvav u 1930 h rokah v Koeficiyent mozhna vikoristovuvati dlya viznachennya vidnosnoyi blizkosti dvoh vibirok sho rozglyadayutsya Takozh vikoristovuyetsya dlya vimiryuvannya rozdilnosti klasiv u klasifikaciyi i vvazhayetsya bilsh nadijnim nizh vidstan Mahalanobisa oskilki vidstan Mahalanobisa ye okremim vipadkom vidstani Bhattachar ya koli normalni vidhilennya dvoh klasiv odnakovi Otzhe koli dva klasi mayut shozhi matematichni ochikuvannya ale rizni normalni vidhilennya vidstan Mahalanobisa pryamuye nulya todi yak vidstan Bgattachariya zrostaye zalezhno vid riznici mizh normalnimi vidhilennyami ViznachennyaDlya rozpodilu jmovirnostej p i q v odnij oblasti X vidstan Bgattachar ya viznachayetsya yak D B p q ln B C p q displaystyle D B p q ln left BC p q right de B C p q x X p x q x displaystyle BC p q sum x in X sqrt p x q x ye koeficiyentom Bgattachar ya dlya diskretnih rozpodiliv jmovirnostej Dlya neperervnogo rozpodilu jmovirnostej koeficiyent Bgattachar ya viznachayetsya yak B C p q p x q x d x displaystyle BC p q int sqrt p x q x dx V bud yakomu vipadku 0 B C 1 displaystyle 0 leq BC leq 1 i 0 D B displaystyle 0 leq D B leq infty D B displaystyle D B ne vikonuye nerivnosti trikutnika U najprostishomu formulyuvanni vidstan Bgattachar ya mizh dvoma klasami za normalnogo rozpodilu mozhna obchisliti za matematichnim ochikuvannyam ta dispersiyeyu dvoh okremih rozpodiliv abo klasiv D B p q 1 4 ln 1 4 s p 2 s q 2 s q 2 s p 2 2 1 4 m p m q 2 s p 2 s q 2 displaystyle D B p q frac 1 4 ln left frac 1 4 left frac sigma p 2 sigma q 2 frac sigma q 2 sigma p 2 2 right right frac 1 4 left frac mu p mu q 2 sigma p 2 sigma q 2 right de s p 2 displaystyle sigma p 2 dispersiya rozpodilu p m p displaystyle mu p matematichne ochikuvannya rozpodilu p i p q displaystyle p q dva rizni rozpodili Vidstan Mahalanobisa sho vikoristovuyetsya v linijnomu diskriminantnomu analizi Fishera ye okremim vipadkom vidstani Bgattachar ya Dlya bagatovimirnih normalnih rozpodiliv p i N m i S i displaystyle p i mathcal N boldsymbol mu i boldsymbol Sigma i D B 1 8 m 1 m 2 T S 1 m 1 m 2 1 2 ln det S det S 1 det S 2 displaystyle D B 1 over 8 boldsymbol mu 1 boldsymbol mu 2 T boldsymbol Sigma 1 boldsymbol mu 1 boldsymbol mu 2 1 over 2 ln left det boldsymbol Sigma over sqrt det boldsymbol Sigma 1 det boldsymbol Sigma 2 right de m i displaystyle boldsymbol mu i i S i displaystyle boldsymbol Sigma i ye matematichnimi ochikuvannyami ta kovariantami rozpodiliv i S S 1 S 2 2 displaystyle boldsymbol Sigma boldsymbol Sigma 1 boldsymbol Sigma 2 over 2 Zvernit uvagu sho v comu vipadku pershij chlen u vidstani Bgattachar ya pov yazanij z vidstannyu Mahalanobisa Koeficiyent Bgattachar yaKoeficiyent Bgattachar ya ce nablizhene vimiryuvannya velichini perekrittya dvoh statistichnih vibirok Koeficiyent mozhna vikoristovuvati dlya viznachennya vidnosnoyi blizkosti dvoh zrazkiv sho rozglyadayutsya Rozrahunok koeficiyenta Bgattachar ya peredbachaye elementarnu formu integruvannya perekrittya dvoh zrazkiv Interval znachen dvoh zrazkiv rozbivayetsya na obranu kilkist rozdiliv i kilkist chleniv kozhnogo zrazka v kozhnomu rozdili vikoristovuyetsya v nastupnij formuli B C p q i 1 n p i q i displaystyle BC mathbf p mathbf q sum i 1 n sqrt p i q i de vrahovuyuchi zrazki p i q n kilkist rozdiliv i p i displaystyle p i q i displaystyle q i ce kilkist chleniv vibirki p i q v i mu rozdili Otzhe cya formula bilsha dlya kozhnogo rozdilu yakij mistit chleni oboh zrazkiv ta dlya kozhnogo rozdilu yakij maye velike perekrittya dvoh chleniv zrazka vseredini nogo Vibir kilkosti rozdiliv zalezhit vid kilkosti chleniv u kozhnij vibirci pri zanadto malij kilkosti rozdiliv vtrachayetsya tochnist cherez poganu ocinku oblasti perekrittya a pri velikij kilkosti rozdiliv mozhna otrimati taki sho ne mistitimut zhodnogo chlena navit yaksho voni roztashovani u dosit gustomu prostori vibirki Koeficiyent Bgattachar ya dorivnyuvatime 0 yaksho cherez mnozhennya na nul dvi vibirki ne mayut perekrittya Ce oznachaye sho vidstan mizh povnistyu vidokremlenimi zrazkami ne bude piddavatisya lishe comu koeficiyentu Koeficiyent Bgattachar ya vikoristovuyetsya pri pobudovi polyarnih kodiv ZastosuvannyaVidstan Bhattachariya shiroko vikoristovuyetsya v doslidzhennyah viluchennya ta viboru funkcij obrobki zobrazhen rozpiznavannya dinamikiv ta klasterizaciyi telefoniv Proponovanij prostir Bgattachar ya yak tehnika viboru vlastivostej mozhe buti zastosovanij do segmentaciyi tekstur Div takozhRozbizhnist Kulbaka Lejblera Vidstan Mahalanobisa Nerivnist Chernova Entropiya ReniPrimitkiBhattacharyya A 1943 On a measure of divergence between two statistical populations defined by their probability distributions Bulletin of the 35 99 109 MR 0010358 Guy B Coleman Harry C Andrews Image Segmentation by Clustering Proc IEEE Vol 67 No 5 pp 773 785 1979 Arikan Erdal July 2009 Channel polarization A method for constructing capacity achieving codes for symmetric binary input memoryless channels IEEE Transactions on Information Theory 55 7 3051 3073 arXiv 0807 3917 doi 10 1109 TIT 2009 2021379 Euisun Choi Chulhee Lee Feature extraction based on the Bhattacharyya distance Pattern Recognition Volume 36 Issue 8 August 2003 Pages 1703 1709 Francois Goudail Philippe Refregier Guillaume Delyon Bhattacharyya distance as a contrast parameter for statistical processing of noisy optical images JOSA A Vol 21 Issue 7 pp 1231 1240 2004 Chang Huai You An SVM Kernel With GMM Supervector Based on the Bhattacharyya Distance for Speaker Recognition Signal Processing Letters IEEE Vol 16 Is 1 pp 49 52 Mak B Phone clustering using the Bhattacharyya distance Spoken Language 1996 ICSLP 96 Proceedings Fourth International Conference on Vol 4 pp 2005 2008 vol 4 3 6 Oct 1996 Reyes Aldasoro C C and A Bhalerao The Bhattacharyya space for feature selection and its application to texture segmentation Pattern Recognition 2006 Vol 39 Issue 5 May 2006 pp 812 826Spisok literaturiNielsen F Boltz S 2010 The Burbea Rao and Bhattacharyya centroids IEEE Transactions on Information Theory 57 8 5455 5466 arXiv 1004 5049 doi 10 1109 TIT 2011 2159046 Kailath T 1967 The Divergence and Bhattacharyya Distance Measures in Signal Selection IEEE Transactions on Communication Technology 15 1 52 60 doi 10 1109 TCOM 1967 1089532 Djouadi A Snorrason O Garber F 1990 The quality of Training Sample estimates of the Bhattacharyya coefficient 12 1 92 97 doi 10 1109 34 41388 Korotkij perelik vlastivostej div http www mtm ufsc br taneja book node20 html 11 kvitnya 2021 u Wayback Machine LankiHazewinkel Michiel red 2001 distance Bhattacharyya distance Matematichna enciklopediya Springer ISBN 978 1 55608 010 4