Лінійна сепарабельність в евклідовій геометрії — це геометрична властивість пари множин точок. Цю властивість легко унаочнити у двовимірному випадку (евклідової площини). Нехай один набір точок буде пофарбований у синій колір, а інший набір точок буде пофарбований у червоний. Ці два набори є «лінійно відокремленими», якщо в площині існує принаймні одна пряма яка розділяє сині і червоні точки. Тобто всі сині точки розташовані по один бік від прямої, а всі червоні точки на іншому боці. Ця ідея очевидно узагальнюється на евклідові простори більшої розмірності, якщо пряму замінити на гіперплощину.
Проблема визначення того, чи є пара наборів лінійно відокремлюваною і чи можна знайти розділяючу гіперплощину, виникає у багатьох областях. Зокрема, у статистиці та машинному навчанні класифікація деяких типів даних є проблемою, для якої існують алгоритми, засновані на сепарабельності множин.
Математичне визначення
Нехай і - два набори точок в n-вимірному евклідовому просторі. Тоді і є лінійно відокремленими, якщо існує n + 1 дійсне число , так що кожна точка задовольняє , і кожна точка задовольняє , де є -ю компонентою .
Аналогічно, два набори лінійно відокремлюються точно, коли їхні відповідні опуклі оболонки - це неперетинні множини.
Приклади
Три не-колініарних точки у двох класах ('+' та '-') завжди лінійно розділяються в двох вимірах. Це проілюстровано на трьох прикладах на наступному малюнку (усі праві "+" не відображаються, але схожі на всі "-"):
Проте не всі набори з чотирьох точок, три з яких не колінеарні, лінійно розділяються в двох вимірах. Наступний приклад потребує двох прямих ліній і таким чином не може бути лінійно відокремлений:
Також, зверніть увагу, що три колінеарні точки форми "+ ⋅⋅⋅ — ⋅⋅⋅ +" також не лінійно відокремлюються.
Лінійна сепарабельність булевих функцій у n змінних
Булева функцію в n змінних можна вважати присвоюванням 0 або 1 для кожної вершини булевої гіперплощини розміру n. Це дає природний поділ вершин на дві множини. Булева функція вважається лінійно відокремленою, якщо ці два набори точок лінійно розділяються.
Кількість змінних | Лінійно відокремлені булеві функції |
---|---|
2 | 14 |
3 | 104 |
4 | 1882 |
5 | 94572 |
6 | 15028134 |
7 | 8378070864 |
8 | 17561539552946 |
9 | 144130531453121108 |
Метод опорних векторів
Класифікація даних - загальне задача у машинному навчанні. Припустимо, що вказуються деякі набори даних, кожен з яких належить до одного з двох наборів, і ми хочемо створити модель, яка вирішить, якою буде нова точка даних. У випадку методу опорних векторів, точка даних розглядається як вектор розмірності p (список з p чисел), і ми хочемо дізнатись, чи можемо ми розділити ці точки (p − 1)-вимірною гіперплощиною. Це називається лінійним класифікатором. Є багато гіперплощин, які можуть класифікувати (розділяти) дані. Розумний вибір найкращої гіперплощини, - це той, який дає найбільше відокремлення між двома наборами. Таким чином, ми вибираємо гіперплощину так, щоб відстань була максимальна як від неї, так і до найближчої точки даних з кожної сторони. Якщо така гіперплощина існує, вона відома як "максимальна розділова гіперплощина", а лінійний класифікатор, який він визначає, відомий як «максимальний [en]». Більш формально, з урахуванням деяких тренувальних даних , набір n точок форми
де yi це - 1 або -1, що вказує на набір, до якого належить точка . Кожен - це p-вимірний вектор дійсних чисел. Ми хочемо знайти максимально розділова гіперплощину, яка розподіляє точки з з тих, що мають . Будь-яку гіперплощину можна записати як набір точок , що задовольняють
де позначає скалярний добуток і (необов'язково нормований) вектор нормалі до гіперплощини. Параметр визначає зміщення гіперплощини від початку вздовж вектора нормалі .
Якщо тренувальні дані лінійно відокремлюються, ми можемо вибрати дві гіперплощини таким чином, щоб вони розділяли дані, а між ними не було точок, а потім намагалися максимально збільшити відстань між ними.
Див. також
Примітки
- Gruzling Nicolle. Linear separability of the vertices of an n-dimensional hypercube. M.Sc Thesis. — University of Northern British Columbia, 2006.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Linijna separabelnist v evklidovij geometriyi ce geometrichna vlastivist pari mnozhin tochok Cyu vlastivist legko unaochniti u dvovimirnomu vipadku evklidovoyi ploshini Nehaj odin nabir tochok bude pofarbovanij u sinij kolir a inshij nabir tochok bude pofarbovanij u chervonij Ci dva nabori ye linijno vidokremlenimi yaksho v ploshini isnuye prinajmni odna pryama yaka rozdilyaye sini i chervoni tochki Tobto vsi sini tochki roztashovani po odin bik vid pryamoyi a vsi chervoni tochki na inshomu boci Cya ideya ochevidno uzagalnyuyetsya na evklidovi prostori bilshoyi rozmirnosti yaksho pryamu zaminiti na giperploshinu Problema viznachennya togo chi ye para naboriv linijno vidokremlyuvanoyu i chi mozhna znajti rozdilyayuchu giperploshinu vinikaye u bagatoh oblastyah Zokrema u statistici ta mashinnomu navchanni klasifikaciya deyakih tipiv danih ye problemoyu dlya yakoyi isnuyut algoritmi zasnovani na separabelnosti mnozhin Matematichne viznachennyaNehaj X 0 displaystyle X 0 i X 1 displaystyle X 1 dva nabori tochok v n vimirnomu evklidovomu prostori Todi X 0 displaystyle X 0 i X 1 displaystyle X 1 ye linijno vidokremlenimi yaksho isnuye n 1 dijsne chislo w 1 w 2 w n k displaystyle w 1 w 2 w n k tak sho kozhna tochka x X 0 displaystyle x in X 0 zadovolnyaye i 1 n w i x i gt k displaystyle sum i 1 n w i x i gt k i kozhna tochka x X 1 displaystyle x in X 1 zadovolnyaye i 1 n w i x i lt k displaystyle sum i 1 n w i x i lt k de x i displaystyle x i ye i displaystyle i yu komponentoyu x displaystyle x Analogichno dva nabori linijno vidokremlyuyutsya tochno koli yihni vidpovidniopukli obolonki ceneperetinni mnozhini PrikladiTri ne koliniarnih tochki u dvoh klasah ta zavzhdi linijno rozdilyayutsya v dvoh vimirah Ce proilyustrovano na troh prikladah na nastupnomu malyunku usi pravi ne vidobrazhayutsya ale shozhi na vsi Prote ne vsi nabori z chotiroh tochok tri z yakih ne kolinearni linijno rozdilyayutsya v dvoh vimirah Nastupnij priklad potrebuye dvoh pryamih linij i takim chinom ne mozhe buti linijno vidokremlenij Takozh zvernit uvagu sho tri kolinearni tochki formi takozh ne linijno vidokremlyuyutsya Linijna separabelnist bulevih funkcij u n zminnihBuleva funkciyu v n zminnih mozhna vvazhati prisvoyuvannyam 0 abo 1 dlya kozhnoyi vershini bulevoyi giperploshini rozmirun Ce daye prirodnij podil vershin na dvi mnozhini Buleva funkciya vvazhayetsya linijno vidokremlenoyu yaksho ci dva nabori tochok linijno rozdilyayutsya Kilkist linijno vidokremlenih bulevih funkcij dlya kozhnoyi rozmirnosti poslidovnist A000609 z Onlajn enciklopediyi poslidovnostej cilih chisel OEIS Kilkist zminnih Linijno vidokremleni bulevi funkciyi 2 14 3 104 4 1882 5 94572 6 15028134 7 8378070864 8 17561539552946 9 144130531453121108Metod opornih vektorivDokladnishe Metod opornih vektoriv H 1 ne rozdilyaye nabori H 2 rozdilyaye ale lishe z nevelikim pokrashennyam H 3 vidokremlyuye yih z maksimalnoyu graniceyu Klasifikaciya danih zagalne zadacha u mashinnomu navchanni Pripustimo sho vkazuyutsya deyaki nabori danih kozhen z yakih nalezhit do odnogo z dvoh naboriv i mi hochemo stvoriti model yaka virishit yakoyu bude nova tochka danih U vipadku metodu opornih vektoriv tochka danih rozglyadayetsya yak vektor rozmirnosti p spisok z p chisel i mi hochemo diznatis chi mozhemo mi rozdiliti ci tochki p 1 vimirnoyu giperploshinoyu Ce nazivayetsya linijnim klasifikatorom Ye bagato giperploshin yaki mozhut klasifikuvati rozdilyati dani Rozumnij vibir najkrashoyi giperploshini ce toj yakij daye najbilshe vidokremlennya mizh dvoma naborami Takim chinom mi vibirayemo giperploshinu tak shob vidstan bula maksimalna yak vid neyi tak i do najblizhchoyi tochki danih z kozhnoyi storoni Yaksho taka giperploshina isnuye vona vidoma yak maksimalna rozdilova giperploshina a linijnij klasifikator yakij vin viznachaye vidomij yak maksimalnij en Bilsh formalno z urahuvannyam deyakih trenuvalnih danih D displaystyle mathcal D nabir n tochok formi D x i y i x i R p y i 1 1 i 1 n displaystyle mathcal D left mathbf x i y i mid mathbf x i in mathbb R p y i in 1 1 right i 1 n de yice 1 abo 1 sho vkazuye na nabir do yakogo nalezhit tochka x i displaystyle mathbf x i Kozhen x i displaystyle mathbf x i ce p vimirnij vektor dijsnih chisel Mi hochemo znajti maksimalno rozdilova giperploshinu yaka rozpodilyaye tochki z y i 1 displaystyle y i 1 z tih sho mayut y i 1 displaystyle y i 1 Bud yaku giperploshinu mozhna zapisati yak nabir tochok x displaystyle mathbf x sho zadovolnyayut w x b 0 displaystyle mathbf w cdot mathbf x b 0 de displaystyle cdot poznachaye skalyarnij dobutok i w displaystyle mathbf w neobov yazkovo normovanij vektor normali do giperploshini Parametr b w displaystyle tfrac b mathbf w viznachaye zmishennya giperploshini vid pochatku vzdovzh vektora normali w displaystyle mathbf w Yaksho trenuvalni dani linijno vidokremlyuyutsya mi mozhemo vibrati dvi giperploshini takim chinom shob voni rozdilyali dani a mizh nimi ne bulo tochok a potim namagalisya maksimalno zbilshiti vidstan mizh nimi Div takozhPerseptron VCh rozmirnistPrimitkiGruzling Nicolle Linear separability of the vertices of an n dimensional hypercube M Sc Thesis University of Northern British Columbia 2006