Навчання асоціативних правил — метод машинного навчання на основі правилах для знаходження цікавих відношень між змінними у великих базах даних. Метою є ідентифікація сильних правил, які виявляються в базах даних з використанням деяких вимірів цікавості.
Ґрунтуючись на концепції сильних правил, [en], [en] та Арун Свамі запровадили асоціативні правила для виявлення закономірностей між продажами продуктів, які фіксуються через торгові точки (англ. point-of-sale, POS) у супермаркетах і всі ці транзакції зберігаються у величезній базі даних. Наприклад, правило , що містяться в даних про продажі супермаркету, вказує на те, що якщо споживач купує цибулю та картоплю разом, то, ймовірно, також буде придбано олію для смаження картопельки з цибулею. Така інформація може бути використана як підґрунтя для прийняття рішень щодо маркетингової діяльності, наприклад, рекламних цін або вибору місць для розташування товарів.
Окрім вищезгаданого прикладу з [en], асоціативні правила застосовуються сьогодні у багатьох областях, включаючи Web mining, виявлення вторгнень, безперервне виробництво та біоінформатику. На відміну від [en] виведення послідовності, навчання асоціативних правил, як правило, не враховує порядок елементів у межах транзакції чи транзакцій.
Визначення
ID операції | молоко | хліб | масло | пиво | підгузники |
---|---|---|---|---|---|
1 | 1 | 1 | 0 | 0 | 0 |
2 | 0 | 0 | 1 | 0 | 0 |
3 | 0 | 0 | 0 | 1 | 1 |
4 | 1 | 1 | 1 | 0 | 0 |
5 | 0 | 1 | 0 | 0 | 0 |
Відповідно до визначення запропонованого Агравалем, Імієлінські, Свамі задача пошуку асоціативного правила визначається так: Нехай — множина двійкових атрибутів, яка називається предмети.
Нехай — множина операцій або транзакцій, яка називається база даних.
Кожна транзакція в має унікальний номер — ID і містить підмножину предметів .
Правило визначається як імплікація форми:
, де .
Аграваль, Імієлінські та Свамі визначали правило тільки між множиною і окремими предметами, для .
Кожне правило складається з двох різних множин предметів, також відомих як набори предметів та , де називається попередником (англ. antecedent) або лівостороннім, а наступний (англ. consequent) або правостороннім.
Для пояснення концепції, розглянемо приклад пов'язаний з супермаркетом. Множина предметів і в таблиці зображена невелика база даних, що містить предмети, де в кожному рядку значення 1 означає наявність елемента у відповідній транзакції, а значення 0 — відсутність елемента в цій транзакції.
Приклад правила для супермаркету може бути , а це означає, що, якщо купили масло та хліб, то також придбають молоко.
Варто зауважити, що цей приклад дуже маленький. Для застосувань на практиці, правило повинно виконуватись для декількох сотень транзакцій, перш ніж його можна буде вважати статистично значущим, а набори даних часто містять тисячі або мільйони транзакцій.
Корисні концепції
Для відбору цікавих правил з множини усіх можливих правил, накладають обмеження на різні способи вимірювання значущості та інтересу. Найбільш відомими обмеженнями є мінімальні пороги затребуваності та довіри.
Нехай буде набором предметів, — асоціативне правило і — множина транзакцій.
Більше вимірювань представлені і порівняні Таном та іншими, як і Гахслером. Пошук методів, які можуть моделювати те, що користувач знає (і використання цих моделей як заходи цікавість), наразі активно досліджується під назвою «суб'єктивна зацікавленість» (англ. Subjective Interestingness).
Затребуваність
Затребуваність (англ. Support) вказує наскільки часто набір предметів з'являється у наборі даних.
Затребуваність відносно визначається як частка транзакцій у наборі даних, які містять підмножиною .
У наведеному вище прикладі, набір предметів має затребуваність , бо зустрічається у 20 % всіх транзакцій (1 з 5 транзакцій). Аргументом є сукупність передумов, і, таким чином, при збільшенні кількості предметів стає більш жорсткою умовою.
Впевненість
Впевненість (англ. Confidence) вказує на те, як часто виконується правило.
Значення впевненості у правилі відносно множини транзакцій є часткою транзакцій, які містять , який також містить .
Впевненість визначається так:
Наприклад, правило має впевненість у базі, що означає, що для 100 % операцій, які містять масло та хліб, правило істинне (у 100 % випадків споживач, який купив масло та хліб, так само купив і молоко).
Зауважимо, що означає затребуваність об'єднання предметів з X та Y. Це може трохи заплутати, оскільки ми зазвичай думаємо про ймовірність подій, а не про набори предметів. Ми можемо переписати як імовірність , де та — це події, в яких транзакція містить набори та , відповідно.
Таким чином, довіру можна інтерпретувати як оцінку умовної ймовірності , ймовірності знайти наступника у транзакції, якщо вона містить попередника.
Ліфт
[en] правила визначається так:
або співвідношення спостережуваної затребуваності до очікуваного, якщо б Х та Y були незалежними.[]
Наприклад, правило має ліфт .
Якщо правило має ліфт 1, це означає, що ймовірності появи попередника та наступника є незалежними одна від одної. Коли дві події є незалежними одна від одної, то й не можна вивести правила за участю цих двох подій.
Якщо ліфт > 1, це вказує на те, наскільки ці дві ситуації залежать одна від одної, і робить ці правила потенційно корисними для прогнозування таких послідовностей у майбутніх наборах даних.
Якщо ліфт < 1, це вказує на те, що предмети замінюють один одного. Це означає, що наявність одного товару негативно впливає на наявність іншого товару, і навпаки.
Значення ліфта полягає в тому, що він враховує як впевненість, так і весь набір даних.
Переконливість
Переконливість (англ. Conviction) правила визначається як .
Наприклад, правило має переконливість , що може бути інтерпретовано як відношення очікуваної частоти того, що X трапляється без Y (тобто частота того, що правило робить неправильне передбачення), якщо Х та Y незалежні, поділене на частоту спостережень невірних передбачень. У цьому прикладі значення переконливості 1.2 показує, що правило буде правильним на 20 % частіше (у 1,2 рази частіше), якби зв'язок між X та Y був чисто випадковим.
Процес
Асоціативні правила повинні відповідати мінімальній затребуваності та мінімальній впевненості, які визначаються користувачем одночасно. Утворення асоціативних правил, зазвичай, поділяється на два окремих кроки:
- Порогове значення мінімальної затребуваності використовується для знаходження всіх частот предметів у базі даних.
- Обмеження на мінімальну впевненість застосовується до частот наборів предметів для утворення правил.
Хоча другий крок є простим, перший крок потребує більшої уваги.
Пошук усіх частот наборів предметів у базі даних складний, оскільки він включає в себе пошук усіх можливих наборів, тобто усіх комбінацій предметів. Множина можливих комбінацій є булеаном та за розміром буде (за винятком порожнього набору, який не є набором предметів). Хоча кількість підмножин експоненціально зростає залежно від кількості предметів в , ефективний пошук можливий за допомогою властивості спадного змикання (англ. downward-closure) значущості (також називається анти-монотонністю), що гарантує, що для частих наборів предметів всі його підмножини також є частими, і тому не рідкісні набори предметів можуть бути підмножиною частих наборів предметів. Використовуючи цю властивість, ефективні алгоритми (наприклад, Apriori та Eclat) можуть знаходити всі часті набори предметів.
Статистично обгрунтовані асоціації
Одним з обмежень стандартного підходу до виявлення асоціацій є те, що, перебираючи величезну кількість можливих асоціацій для пошуку колекцій предметів, які можуть бути пов'язані, існує великий ризик виявлення багатьох фальшивих асоціацій. Це набори предметів, що збігаються випадково. Наприклад, припустимо, ми розглядаємо колекцію з 10000 предметів і шукаємо правила, що містять два предмети в лівій частині та 1 предмет у правій частині. Існує приблизно 1 000 000 000 000 таких правил. Якщо ми застосуємо статистичну перевірку для незалежності з рівнем значущості 0.05, це означає, що шанс прийняти правило, якщо немає асоціації, є лише 5%. Якщо ми вважатимемо, що немає об'єднань, ми все ж повинні розраховувати на пошук 50 000 000 000 правил. Виявлення статистично обґрунтованої асоціації контролює цей ризик, і в більшості випадків зменшую ризик виявлення будь-яких хибних асоціацій відповідно до визначеного користувачем рівня значущості.
Примітки
- Piatetsky-Shapiro, Gregory (1991), Discovery, analysis, and presentation of strong rules, in Piatetsky-Shapiro, Gregory; and Frawley, William J.; eds., Knowledge Discovery in Databases, AAAI/MIT Press, Cambridge, MA.
- Agrawal, R.; Imieliński, T.; Swami, A. (1993). Mining association rules between sets of items in large databases. Proceedings of the 1993 ACM SIGMOD international conference on Management of data - SIGMOD '93. с. 207. doi:10.1145/170035.170072. ISBN .
- Tan, Pang-Ning; Kumar, Vipin; and Srivastava, Jaideep; [Selecting the right objective measure for association analysis, https://cse.msu.edu/%7Eptan/papers/IS.pdf [ 10 серпня 2017 у Wayback Machine.]] Information Systems, 29(4):293-313, 2004
- Michael Hahsler (2015). A Probabilistic Comparison of Commonly Used Interest Measures for Association Rules. http://michael.hahsler.net/research/association_rules/measures.html [ 2 серпня 2018 у Wayback Machine.]
- Hahsler, Michael (2005). (PDF). Journal of Statistical Software. Архів оригіналу (PDF) за 30 квітня 2019.
- Hipp, J.; Güntzer, U.; Nakhaeizadeh, G. (2000). Algorithms for association rule mining --- a general survey and comparison. ACM SIGKDD Explorations Newsletter. 2: 58. doi:10.1145/360402.360421.
- Tan, Pang-Ning; Michael, Steinbach; Kumar, Vipin (2005). (PDF). Introduction to Data Mining. Addison-Wesley. ISBN . Архів оригіналу (PDF) за 19 вересня 2017. Процитовано 3 серпня 2018.
- Pei, Jian; Han, Jiawei; and Lakshmanan, Laks V. S.; Mining frequent itemsets with convertible constraints, in Proceedings of the 17th International Conference on Data Engineering, April 2–6, 2001, Heidelberg, Germany, 2001, pages 433—442
- Agrawal, Rakesh; and Srikant, Ramakrishnan; Fast algorithms for mining association rules in large databases [ 25 лютого 2015 у Wayback Machine.], in Bocca, Jorge B.; Jarke, Matthias; and Zaniolo, Carlo; editors, Proceedings of the 20th International Conference on Very Large Data Bases (VLDB), Santiago, Chile, September 1994, pages 487—499
- Zaki, M. J. (2000). Scalable algorithms for association mining. IEEE Transactions on Knowledge and Data Engineering. 12 (3): 372—390. doi:10.1109/69.846291.
- Webb, Geoffrey I. (2007); Discovering Significant Patterns, Machine Learning 68(1), Netherlands: Springer, pp. 1-33 online access [ 3 серпня 2018 у Wayback Machine.]
- Gionis, Aristides; ; Mielikäinen, Taneli; and Tsaparas, Panayiotis; Assessing Data Mining Results via Swap Randomization, ACM Transactions on Knowledge Discovery from Data (TKDD), Volume 1, Issue 3 (December 2007), Article No. 14
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Navchannya asociativnih pravil metod mashinnogo navchannya na osnovi pravilah dlya znahodzhennya cikavih vidnoshen mizh zminnimi u velikih bazah danih Metoyu ye identifikaciya silnih pravil yaki viyavlyayutsya v bazah danih z vikoristannyam deyakih vimiriv cikavosti Gruntuyuchis na koncepciyi silnih pravil en en ta Arun Svami zaprovadili asociativni pravila dlya viyavlennya zakonomirnostej mizh prodazhami produktiv yaki fiksuyutsya cherez torgovi tochki angl point of sale POS u supermarketah i vsi ci tranzakciyi zberigayutsya u velicheznij bazi danih Napriklad pravilo cibulya kartoplya smazhena kartoplya displaystyle text cibulya kartoplya Rightarrow text smazhena kartoplya sho mistyatsya v danih pro prodazhi supermarketu vkazuye na te sho yaksho spozhivach kupuye cibulyu ta kartoplyu razom to jmovirno takozh bude pridbano oliyu dlya smazhennya kartopelki z cibuleyu Taka informaciya mozhe buti vikoristana yak pidgruntya dlya prijnyattya rishen shodo marketingovoyi diyalnosti napriklad reklamnih cin abo viboru misc dlya roztashuvannya tovariv Okrim vishezgadanogo prikladu z en asociativni pravila zastosovuyutsya sogodni u bagatoh oblastyah vklyuchayuchi Web mining viyavlennya vtorgnen bezperervne virobnictvo ta bioinformatiku Na vidminu vid en vivedennya poslidovnosti navchannya asociativnih pravil yak pravilo ne vrahovuye poryadok elementiv u mezhah tranzakciyi chi tranzakcij ViznachennyaPriklad bazi danih z 5 prodazhami ta 5 predmetami ID operaciyi moloko hlib maslo pivo pidguzniki 1 1 1 0 0 0 2 0 0 1 0 0 3 0 0 0 1 1 4 1 1 1 0 0 5 0 1 0 0 0 Vidpovidno do viznachennya zaproponovanogo Agravalem Imiyelinski Svami zadacha poshuku asociativnogo pravila viznachayetsya tak Nehaj I i 1 i 2 i n displaystyle I i 1 i 2 ldots i n mnozhina n displaystyle n dvijkovih atributiv yaka nazivayetsya predmeti Nehaj D t 1 t 2 t m displaystyle D t 1 t 2 ldots t m mnozhina operacij abo tranzakcij yaka nazivayetsya baza danih Kozhna tranzakciya v D displaystyle D maye unikalnij nomer ID i mistit pidmnozhinu predmetiv I displaystyle I Pravilo viznachayetsya yak implikaciya formi X Y displaystyle X Rightarrow Y de X Y I displaystyle X Y subseteq I Agraval Imiyelinski ta Svami viznachali pravilo tilki mizh mnozhinoyu i okremimi predmetami X i j displaystyle X Rightarrow i j dlya i j I displaystyle i j in I Kozhne pravilo skladayetsya z dvoh riznih mnozhin predmetiv takozh vidomih yak nabori predmetiv X displaystyle X ta Y displaystyle Y de X displaystyle X nazivayetsya poperednikom angl antecedent abo livostoronnim a Y displaystyle Y nastupnij angl consequent abo pravostoronnim Dlya poyasnennya koncepciyi rozglyanemo priklad pov yazanij z supermarketom Mnozhina predmetiv I moloko hlib maslo pivo pidguzniki displaystyle I text moloko hlib maslo pivo pidguzniki i v tablici zobrazhena nevelika baza danih sho mistit predmeti de v kozhnomu ryadku znachennya 1 oznachaye nayavnist elementa u vidpovidnij tranzakciyi a znachennya 0 vidsutnist elementa v cij tranzakciyi Priklad pravila dlya supermarketu mozhe buti maslo hlib moloko displaystyle text maslo hlib Rightarrow text moloko a ce oznachaye sho yaksho kupili maslo ta hlib to takozh pridbayut moloko Varto zauvazhiti sho cej priklad duzhe malenkij Dlya zastosuvan na praktici pravilo povinno vikonuvatis dlya dekilkoh soten tranzakcij persh nizh jogo mozhna bude vvazhati statistichno znachushim a nabori danih chasto mistyat tisyachi abo miljoni tranzakcij Korisni koncepciyiDlya vidboru cikavih pravil z mnozhini usih mozhlivih pravil nakladayut obmezhennya na rizni sposobi vimiryuvannya znachushosti ta interesu Najbilsh vidomimi obmezhennyami ye minimalni porogi zatrebuvanosti ta doviri Nehaj X displaystyle X bude naborom predmetiv X Y displaystyle X Rightarrow Y asociativne pravilo i T displaystyle T mnozhina tranzakcij Bilshe vimiryuvan predstavleni i porivnyani Tanom ta inshimi yak i Gahslerom Poshuk metodiv yaki mozhut modelyuvati te sho koristuvach znaye i vikoristannya cih modelej yak zahodi cikavist narazi aktivno doslidzhuyetsya pid nazvoyu sub yektivna zacikavlenist angl Subjective Interestingness Zatrebuvanist Zatrebuvanist angl Support vkazuye naskilki chasto nabir predmetiv z yavlyayetsya u nabori danih Zatrebuvanist X displaystyle X vidnosno T displaystyle T viznachayetsya yak chastka tranzakcij t displaystyle t u nabori danih yaki mistyat pidmnozhinoyu X displaystyle X s u p p X t T X t T displaystyle mathrm supp X frac t in T X subseteq t T U navedenomu vishe prikladi nabir predmetiv X pivo pidguzniki displaystyle X text pivo pidguzniki maye zatrebuvanist 1 5 0 2 displaystyle 1 5 0 2 bo zustrichayetsya u 20 vsih tranzakcij 1 z 5 tranzakcij Argumentom s u p p displaystyle mathrm supp ye sukupnist peredumov i takim chinom pri zbilshenni kilkosti predmetiv staye bilsh zhorstkoyu umovoyu Vpevnenist Vpevnenist angl Confidence vkazuye na te yak chasto vikonuyetsya pravilo Znachennya vpevnenosti u pravili X Y displaystyle X Rightarrow Y vidnosno mnozhini tranzakcij T displaystyle T ye chastkoyu tranzakcij yaki mistyat X displaystyle X yakij takozh mistit Y displaystyle Y Vpevnenist viznachayetsya tak c o n f X Y s u p p X Y s u p p X displaystyle mathrm conf X Rightarrow Y mathrm supp X cup Y mathrm supp X Napriklad pravilo maslo hlib moloko displaystyle text maslo hlib Rightarrow text moloko maye vpevnenist 0 2 0 2 1 0 displaystyle 0 2 0 2 1 0 u bazi sho oznachaye sho dlya 100 operacij yaki mistyat maslo ta hlib pravilo istinne u 100 vipadkiv spozhivach yakij kupiv maslo ta hlib tak samo kupiv i moloko Zauvazhimo sho s u p p X Y displaystyle mathrm supp X cup Y oznachaye zatrebuvanist ob yednannya predmetiv z X ta Y Ce mozhe trohi zaplutati oskilki mi zazvichaj dumayemo pro jmovirnist podij a ne pro nabori predmetiv Mi mozhemo perepisati s u p p X Y displaystyle mathrm supp X cup Y yak imovirnist P E X E Y displaystyle P E X cap E Y de E X displaystyle E X ta E Y displaystyle E Y ce podiyi v yakih tranzakciya mistit nabori X displaystyle X ta Y displaystyle Y vidpovidno Takim chinom doviru mozhna interpretuvati yak ocinku umovnoyi jmovirnosti P E Y E X displaystyle P E Y E X jmovirnosti znajti nastupnika u tranzakciyi yaksho vona mistit poperednika Lift en pravila viznachayetsya tak l i f t X Y s u p p X Y s u p p X s u p p Y displaystyle mathrm lift X Rightarrow Y frac mathrm supp X cup Y mathrm supp X times mathrm supp Y abo spivvidnoshennya sposterezhuvanoyi zatrebuvanosti do ochikuvanogo yaksho b H ta Y buli nezalezhnimi dzherelo Napriklad pravilo moloko hlib maslo displaystyle text moloko hlib Rightarrow text maslo maye lift 0 2 0 4 0 4 1 25 displaystyle frac 0 2 0 4 times 0 4 1 25 Yaksho pravilo maye lift 1 ce oznachaye sho jmovirnosti poyavi poperednika ta nastupnika ye nezalezhnimi odna vid odnoyi Koli dvi podiyi ye nezalezhnimi odna vid odnoyi to j ne mozhna vivesti pravila za uchastyu cih dvoh podij Yaksho lift gt 1 ce vkazuye na te naskilki ci dvi situaciyi zalezhat odna vid odnoyi i robit ci pravila potencijno korisnimi dlya prognozuvannya takih poslidovnostej u majbutnih naborah danih Yaksho lift lt 1 ce vkazuye na te sho predmeti zaminyuyut odin odnogo Ce oznachaye sho nayavnist odnogo tovaru negativno vplivaye na nayavnist inshogo tovaru i navpaki Znachennya lifta polyagaye v tomu sho vin vrahovuye yak vpevnenist tak i ves nabir danih Perekonlivist Perekonlivist angl Conviction pravila viznachayetsya yak c o n v X Y 1 s u p p Y 1 c o n f X Y displaystyle mathrm conv X Rightarrow Y frac 1 mathrm supp Y 1 mathrm conf X Rightarrow Y Napriklad pravilo moloko hlib maslo displaystyle text moloko hlib Rightarrow text maslo maye perekonlivist 1 0 4 1 0 5 1 2 displaystyle frac 1 0 4 1 0 5 1 2 sho mozhe buti interpretovano yak vidnoshennya ochikuvanoyi chastoti togo sho X traplyayetsya bez Y tobto chastota togo sho pravilo robit nepravilne peredbachennya yaksho H ta Y nezalezhni podilene na chastotu sposterezhen nevirnih peredbachen U comu prikladi znachennya perekonlivosti 1 2 pokazuye sho pravilo moloko hlib maslo displaystyle text moloko hlib Rightarrow text maslo bude pravilnim na 20 chastishe u 1 2 razi chastishe yakbi zv yazok mizh X ta Y buv chisto vipadkovim ProcesGratka chastot naboriv predmetiv v yakij kolir pryamokutnika vkazuye na te skilki tranzakcij mistyat predmeti Zaznachimo sho nizhchi rivni gratki mozhut mistiti ne bilshe minimalnoyi kilkosti predmetiv svoyih batkiv napriklad ac mozhe mistiti shonajbilshe m i n a c displaystyle min a c Ce nazivayetsya vlastivistyu spadnogo zmikannya Asociativni pravila povinni vidpovidati minimalnij zatrebuvanosti ta minimalnij vpevnenosti yaki viznachayutsya koristuvachem odnochasno Utvorennya asociativnih pravil zazvichaj podilyayetsya na dva okremih kroki Porogove znachennya minimalnoyi zatrebuvanosti vikoristovuyetsya dlya znahodzhennya vsih chastot predmetiv u bazi danih Obmezhennya na minimalnu vpevnenist zastosovuyetsya do chastot naboriv predmetiv dlya utvorennya pravil Hocha drugij krok ye prostim pershij krok potrebuye bilshoyi uvagi Poshuk usih chastot naboriv predmetiv u bazi danih skladnij oskilki vin vklyuchaye v sebe poshuk usih mozhlivih naboriv tobto usih kombinacij predmetiv Mnozhina mozhlivih kombinacij ye buleanom I displaystyle I ta za rozmirom bude 2 n 1 displaystyle 2 n 1 za vinyatkom porozhnogo naboru yakij ne ye naborom predmetiv Hocha kilkist pidmnozhin eksponencialno zrostaye zalezhno vid kilkosti predmetiv n displaystyle n v I displaystyle I efektivnij poshuk mozhlivij za dopomogoyu vlastivosti spadnogo zmikannya angl downward closure znachushosti takozh nazivayetsya anti monotonnistyu sho garantuye sho dlya chastih naboriv predmetiv vsi jogo pidmnozhini takozh ye chastimi i tomu ne ridkisni nabori predmetiv mozhut buti pidmnozhinoyu chastih naboriv predmetiv Vikoristovuyuchi cyu vlastivist efektivni algoritmi napriklad Apriori ta Eclat mozhut znahoditi vsi chasti nabori predmetiv Statistichno obgruntovani asociaciyiOdnim z obmezhen standartnogo pidhodu do viyavlennya asociacij ye te sho perebirayuchi velicheznu kilkist mozhlivih asociacij dlya poshuku kolekcij predmetiv yaki mozhut buti pov yazani isnuye velikij rizik viyavlennya bagatoh falshivih asociacij Ce nabori predmetiv sho zbigayutsya vipadkovo Napriklad pripustimo mi rozglyadayemo kolekciyu z 10000 predmetiv i shukayemo pravila sho mistyat dva predmeti v livij chastini ta 1 predmet u pravij chastini Isnuye priblizno 1 000 000 000 000 takih pravil Yaksho mi zastosuyemo statistichnu perevirku dlya nezalezhnosti z rivnem znachushosti 0 05 ce oznachaye sho shans prijnyati pravilo yaksho nemaye asociaciyi ye lishe 5 Yaksho mi vvazhatimemo sho nemaye ob yednan mi vse zh povinni rozrahovuvati na poshuk 50 000 000 000 pravil Viyavlennya statistichno obgruntovanoyi asociaciyi kontrolyuye cej rizik i v bilshosti vipadkiv zmenshuyu rizik viyavlennya bud yakih hibnih asociacij vidpovidno do viznachenogo koristuvachem rivnya znachushosti PrimitkiPiatetsky Shapiro Gregory 1991 Discovery analysis and presentation of strong rules in Piatetsky Shapiro Gregory and Frawley William J eds Knowledge Discovery in Databases AAAI MIT Press Cambridge MA Agrawal R Imielinski T Swami A 1993 Mining association rules between sets of items in large databases Proceedings of the 1993 ACM SIGMOD international conference on Management of data SIGMOD 93 s 207 doi 10 1145 170035 170072 ISBN 0897915925 Tan Pang Ning Kumar Vipin and Srivastava Jaideep Selecting the right objective measure for association analysis https cse msu edu 7Eptan papers IS pdf 10 serpnya 2017 u Wayback Machine Information Systems 29 4 293 313 2004 Michael Hahsler 2015 A Probabilistic Comparison of Commonly Used Interest Measures for Association Rules http michael hahsler net research association rules measures html 2 serpnya 2018 u Wayback Machine Hahsler Michael 2005 PDF Journal of Statistical Software Arhiv originalu PDF za 30 kvitnya 2019 Hipp J Guntzer U Nakhaeizadeh G 2000 Algorithms for association rule mining a general survey and comparison ACM SIGKDD Explorations Newsletter 2 58 doi 10 1145 360402 360421 Tan Pang Ning Michael Steinbach Kumar Vipin 2005 PDF Introduction to Data Mining Addison Wesley ISBN 0 321 32136 7 Arhiv originalu PDF za 19 veresnya 2017 Procitovano 3 serpnya 2018 Pei Jian Han Jiawei and Lakshmanan Laks V S Mining frequent itemsets with convertible constraints in Proceedings of the 17th International Conference on Data Engineering April 2 6 2001 Heidelberg Germany 2001 pages 433 442 Agrawal Rakesh and Srikant Ramakrishnan Fast algorithms for mining association rules in large databases 25 lyutogo 2015 u Wayback Machine in Bocca Jorge B Jarke Matthias and Zaniolo Carlo editors Proceedings of the 20th International Conference on Very Large Data Bases VLDB Santiago Chile September 1994 pages 487 499 Zaki M J 2000 Scalable algorithms for association mining IEEE Transactions on Knowledge and Data Engineering 12 3 372 390 doi 10 1109 69 846291 Webb Geoffrey I 2007 Discovering Significant Patterns Machine Learning 68 1 Netherlands Springer pp 1 33 online access 3 serpnya 2018 u Wayback Machine Gionis Aristides Mielikainen Taneli and Tsaparas Panayiotis Assessing Data Mining Results via Swap Randomization ACM Transactions on Knowledge Discovery from Data TKDD Volume 1 Issue 3 December 2007 Article No 14