Поняття роздрі́бнених множи́н (англ. shattered sets) відіграє важливу роль в теорії Вапника — Червоненкіса, відомій також як ВЧ-теорія. Роздрібнювання та ВЧ-теорія використовуються в дослідженні [en], а також у статистичній [en].
Визначення
Припустімо, що A є множиною, а C — класом множин. Клас C роздрі́бнює множину A, якщо для кожної підмножини a множини A існує такий елемент c класу C, що
Рівнозначно, C роздрібнює A, якщо булеан P(A) = { c ∩ A | c ∈ C }.
Ми застосовуємо літеру C для позначення «класу» (англ. class) або «набору» (англ. collection) множин, як у класі Вапника — Червоненкіса (ВЧ-клас). Множина A часто вважається скінченною, оскільки в емпіричних процесах нас цікавить роздрібнювання скінченних множин точок даних.
Приклад
Ми покажемо, що клас усіх кругів на площині (у двовимірному просторі) не роздрібнює будь-яку множину з чотирьох точок на одиничному колі, але клас усіх опуклих множин на площині роздрібнює будь-яку скінченну множину точок на одиничному колі.
Нехай A є множиною з чотирьох точок на одиничному колі, а C є класом усіх кругів.
Щоби перевірити, чи C роздрібнює A, ми намагаємося намалювати круг навколо кожної з підмножин точок множини A. По-перше, ми малюємо круг навколо підмножин з кожної ізольованої точки. Потім ми намагаємося намалювати круг навколо кожної з підмножин із пар точок. Це виявляється здійсненним для сусідніх точок, але неможливим для точок на протилежних сторонах кола. Як унаочнено нижче:
- Кожну окрему точку може бути ізольовано кругом (показано всі чотири).
- Кожну з підмножин із сусідніх точок може бути ізольовано кругом (показано один із чотирьох).
- Підмножину з точок на протилежних сторонах одиничного кола не може бути ізольовано кругом.
Оскільки існує підмножина, яку не може бути ізольовано жодним кругом із C, то ми робимо висновок, що A не роздрібнюється класом C. І, трохи поміркувавши, ми можемо довести, що жодна множина з чотирьох точок не роздрібнюється цим C.
Проте, якщо ми перевизначимо C як клас усіх еліпсів, ми виявимо, що ми все ще можемо ізолювати всі підмножини, як і вище, але також і точки, які раніше були проблемними. Таким чином, ця конкретна множина з 4 точок роздрібнюється класом еліпсів. Унаочнено нижче:
- Протилежні точки A є тепер віддільними деяким еліпсом (показано один із двох)
- Кожна з підмножин із трьох точок з A також є віддільною деяким еліпсом (показано один із чотирьох)
Трошки поміркувавши, ми можемо зробити узагальнення, що будь-яку множину скінченних точок на одиничному колі може бути роздрібнено класом усіх опуклих множин (унаочніть з'єднанням точок).
Коефіцієнт роздрібнювання
Для кількісної оцінки багатства набору множин C ми використовуємо поняття коефіцієнтів роздрібнювання (відомих також як коефіцієнти роздрібнення або функція росту, англ. shattering coefficients, shatter coefficients, growth function). Для набору C множин s⊂Ω, де Ω є будь-яким простором, часто ймовірнісним простором, а є будь-якою множиною з n точок, ми визначаємо n-тий коефіцієнт роздрібнювання набору C як
де позначає потужність множини.
— це найбільше число підмножин будь-якої множини A з n точок, які може бути сформовано перетином A з множинами з набору C.
Ось деякі факти про :
- для всіх n, оскільки для будь-якої .
- Якщо , то це означає, що існує множина потужності n, яку може бути роздрібнено набором C.
- Якщо для деякого , то для всіх .
Третя властивість означає, що якщо C не може роздрібнити будь-яку множину потужності N, то він не може роздрібнювати множини й вищих потужностей.
Клас Вапника — Червоненкіса
ВЧ-розмірність класу C визначається як
або, альтернативно, як
Зауважте, що
Якщо для будь-якого n існує множина потужності n, яку може бути роздрібнено класом C, то для всіх n, а ВЧ-розмірність цього класу C є нескінченною.
Клас зі скінченною ВЧ-розмірністю називається класом Вапника — Червоненкіса або ВЧ-класом. Клас C є [en], якщо і лише якщо він є ВЧ-класом.
Див. також
- [en], яка ставить у відповідність потужність сімейства множин розмірові його найбільшої роздрібненої множини
Джерела
- Wencour, R. S.; Dudley, R. M. (1981), Some special Vapnik–Chervonenkis classes, Discrete Mathematics, 33 (3): 313—318, doi:10.1016/0012-365X(81)90274-0 (англ.)
- (1975), Combinatorial Entropy and Uniform Limit Laws, Ph.D. thesis, Stanford University, Mathematics Department (англ.)
- (1978), Empirical discrepancies and subadditive processes, Annals of Probability, 6 (1): 118—227, doi:10.1214/aop/1176995615, JSTOR 2242865 (англ.)
Посилання
- Походження термінології «роздрібнених множин» [ 25 березня 2017 у Wayback Machine.] від [en] (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Ponyattya rozdri bnenih mnozhi n angl shattered sets vidigraye vazhlivu rol v teoriyi Vapnika Chervonenkisa vidomij takozh yak VCh teoriya Rozdribnyuvannya ta VCh teoriya vikoristovuyutsya v doslidzhenni en a takozh u statistichnij en ViznachennyaPripustimo sho A ye mnozhinoyu a C klasom mnozhin Klas C rozdri bnyuye mnozhinu A yaksho dlya kozhnoyi pidmnozhini a mnozhini A isnuye takij element c klasu C sho a c A displaystyle a c cap A Rivnoznachno C rozdribnyuye A yaksho bulean P A c A c C Mi zastosovuyemo literu C dlya poznachennya klasu angl class abo naboru angl collection mnozhin yak u klasi Vapnika Chervonenkisa VCh klas Mnozhina A chasto vvazhayetsya skinchennoyu oskilki v empirichnih procesah nas cikavit rozdribnyuvannya skinchennih mnozhin tochok danih PrikladMi pokazhemo sho klas usih krugiv na ploshini u dvovimirnomu prostori ne rozdribnyuye bud yaku mnozhinu z chotiroh tochok na odinichnomu koli ale klas usih opuklih mnozhin na ploshini rozdribnyuye bud yaku skinchennu mnozhinu tochok na odinichnomu koli Nehaj A ye mnozhinoyu z chotiroh tochok na odinichnomu koli a C ye klasom usih krugiv Mnozhina A z chotiroh konkretnih tochok na odinichnomu koli odinichne kolo pokazano rozhevim Shobi pereviriti chi C rozdribnyuye A mi namagayemosya namalyuvati krug navkolo kozhnoyi z pidmnozhin tochok mnozhini A Po pershe mi malyuyemo krug navkolo pidmnozhin z kozhnoyi izolovanoyi tochki Potim mi namagayemosya namalyuvati krug navkolo kozhnoyi z pidmnozhin iz par tochok Ce viyavlyayetsya zdijsnennim dlya susidnih tochok ale nemozhlivim dlya tochok na protilezhnih storonah kola Yak unaochneno nizhche Kozhnu okremu tochku mozhe buti izolovano krugom pokazano vsi chotiri Kozhnu z pidmnozhin iz susidnih tochok mozhe buti izolovano krugom pokazano odin iz chotiroh Pidmnozhinu z tochok na protilezhnih storonah odinichnogo kola ne mozhe buti izolovano krugom Oskilki isnuye pidmnozhina yaku ne mozhe buti izolovano zhodnim krugom iz C to mi robimo visnovok sho A ne rozdribnyuyetsya klasom C I trohi pomirkuvavshi mi mozhemo dovesti sho zhodna mnozhina z chotiroh tochok ne rozdribnyuyetsya cim C Prote yaksho mi pereviznachimo C yak klas usih elipsiv mi viyavimo sho mi vse she mozhemo izolyuvati vsi pidmnozhini yak i vishe ale takozh i tochki yaki ranishe buli problemnimi Takim chinom cya konkretna mnozhina z 4 tochok rozdribnyuyetsya klasom elipsiv Unaochneno nizhche Protilezhni tochki A ye teper viddilnimi deyakim elipsom pokazano odin iz dvoh Kozhna z pidmnozhin iz troh tochok z A takozh ye viddilnoyu deyakim elipsom pokazano odin iz chotiroh Troshki pomirkuvavshi mi mozhemo zrobiti uzagalnennya sho bud yaku mnozhinu skinchennih tochok na odinichnomu koli mozhe buti rozdribneno klasom usih opuklih mnozhin unaochnit z yednannyam tochok Koeficiyent rozdribnyuvannyaDlya kilkisnoyi ocinki bagatstva naboru mnozhin C mi vikoristovuyemo ponyattya koeficiyentiv rozdribnyuvannya vidomih takozh yak koeficiyenti rozdribnennya abo funkciya rostu angl shattering coefficients shatter coefficients growth function Dlya naboru C mnozhin s W de W ye bud yakim prostorom chasto jmovirnisnim prostorom a x 1 x 2 x n W displaystyle x 1 x 2 dots x n in Omega ye bud yakoyu mnozhinoyu z n tochok mi viznachayemo n tij koeficiyent rozdribnyuvannya naboru C yak S C n max x 1 x 2 x n W card x 1 x 2 x n s s C displaystyle S C n max x 1 x 2 dots x n in Omega operatorname card x 1 x 2 dots x n cap s s in C de card displaystyle operatorname card poznachaye potuzhnist mnozhini S C n displaystyle S C n ce najbilshe chislo pidmnozhin bud yakoyi mnozhini A z n tochok yaki mozhe buti sformovano peretinom A z mnozhinami z naboru C Os deyaki fakti pro S C n displaystyle S C n S C n 2 n displaystyle S C n leq 2 n dlya vsih n oskilki s A s C P A displaystyle s cap A s in C subseteq P A dlya bud yakoyi A W displaystyle A subseteq Omega Yaksho S C n 2 n displaystyle S C n 2 n to ce oznachaye sho isnuye mnozhina potuzhnosti n yaku mozhe buti rozdribneno naborom C Yaksho S C N lt 2 N displaystyle S C N lt 2 N dlya deyakogo N gt 1 displaystyle N gt 1 to S C n lt 2 n displaystyle S C n lt 2 n dlya vsih n N displaystyle n geq N Tretya vlastivist oznachaye sho yaksho C ne mozhe rozdribniti bud yaku mnozhinu potuzhnosti N to vin ne mozhe rozdribnyuvati mnozhini j vishih potuzhnostej Klas Vapnika ChervonenkisaVCh rozmirnist klasu C viznachayetsya yak V C C min n n S C n lt 2 n displaystyle VC C underset n min n S C n lt 2 n abo alternativno yak V C 0 C max n n S C n 2 n displaystyle VC 0 C underset n max n S C n 2 n Zauvazhte sho V C C V C 0 C 1 displaystyle VC C VC 0 C 1 Yaksho dlya bud yakogo n isnuye mnozhina potuzhnosti n yaku mozhe buti rozdribneno klasom C to S C n 2 n displaystyle S C n 2 n dlya vsih n a VCh rozmirnist cogo klasu C ye neskinchennoyu Klas zi skinchennoyu VCh rozmirnistyu nazivayetsya klasom Vapnika Chervonenkisa abo VCh klasom Klas C ye en yaksho i lishe yaksho vin ye VCh klasom Div takozh en yaka stavit u vidpovidnist potuzhnist simejstva mnozhin rozmirovi jogo najbilshoyi rozdribnenoyi mnozhiniDzherelaWencour R S Dudley R M 1981 Some special Vapnik Chervonenkis classes Discrete Mathematics 33 3 313 318 doi 10 1016 0012 365X 81 90274 0 angl 1975 Combinatorial Entropy and Uniform Limit Laws Ph D thesis Stanford University Mathematics Department angl 1978 Empirical discrepancies and subadditive processes Annals of Probability 6 1 118 227 doi 10 1214 aop 1176995615 JSTOR 2242865 angl PosilannyaPohodzhennya terminologiyi rozdribnenih mnozhin 25 bereznya 2017 u Wayback Machine vid en angl