Баєсова фільтрація спаму (англ. Naive Bayes spam filtering) — метод для фільтрації спаму, заснований на застосуванні наївного баєсова класифікатора, що спирається на пряме використання теореми Баєса. Теорему Баєса названо на честь її автора Томаса Баєса (1702—1761) — англійського математика і священика, який першим запропонував використання теореми для коригування переконань, ґрунтуючись на оновлених даних.
Опис
Під час навчання фільтра для кожного слова в тексті вираховують та зберігають його «вагу» — оцінку ймовірності того, що текст із цим словом — спам. У найпростішому випадку як оцінку використовують частоту: «появ в спамі/появ всього». У складніших випадках можлива попередня обробка тексту: приведення слів до початкової форми, видалення службових слів, обчислення «ваги» для цілих фраз, транслітерація тощо.
Під час перевірки нового тексту ймовірність «спаму» обчислюють за вказаною вище формулою для множини гіпотез. В цьому випадку «гіпотези» — це слова, і для кожного слова «достовірність гіпотези» — частка цього слова в тексті, а «залежність події від гіпотези» — обчислена раніше «вага» слова. Тобто «вага» тексту в даному випадку — усереднена «вага» всіх його слів.
Віднесення тексту до «спаму» чи «не-спаму» проводиться в залежності від того, чи перевищує його «вага» якусь планку, задану користувачем (зазвичай беруть 60-80 %). Після ухвалення рішення стосовно тексту в базі даних оновлюються «ваги» для слів, що входять до його складу.
Ця стаття не містить . (березень 2017) |
Це незавершена стаття зі штучного інтелекту. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Bayesova filtraciya spamu angl Naive Bayes spam filtering metod dlya filtraciyi spamu zasnovanij na zastosuvanni nayivnogo bayesova klasifikatora sho spirayetsya na pryame vikoristannya teoremi Bayesa Teoremu Bayesa nazvano na chest yiyi avtora Tomasa Bayesa 1702 1761 anglijskogo matematika i svyashenika yakij pershim zaproponuvav vikoristannya teoremi dlya koriguvannya perekonan gruntuyuchis na onovlenih danih OpisPid chas navchannya filtra dlya kozhnogo slova v teksti virahovuyut ta zberigayut jogo vagu ocinku jmovirnosti togo sho tekst iz cim slovom spam U najprostishomu vipadku yak ocinku vikoristovuyut chastotu poyav v spami poyav vsogo U skladnishih vipadkah mozhliva poperednya obrobka tekstu privedennya sliv do pochatkovoyi formi vidalennya sluzhbovih sliv obchislennya vagi dlya cilih fraz transliteraciya tosho Pid chas perevirki novogo tekstu jmovirnist spamu obchislyuyut za vkazanoyu vishe formuloyu dlya mnozhini gipotez V comu vipadku gipotezi ce slova i dlya kozhnogo slova dostovirnist gipotezi P Ai Nwordi Nwords total displaystyle P A i N word i N words total chastka cogo slova v teksti a zalezhnist podiyi vid gipotezi P B Ai displaystyle P B A i obchislena ranishe vaga slova Tobto vaga tekstu v danomu vipadku userednena vaga vsih jogo sliv Vidnesennya tekstu do spamu chi ne spamu provoditsya v zalezhnosti vid togo chi perevishuye jogo vaga yakus planku zadanu koristuvachem zazvichaj berut 60 80 Pislya uhvalennya rishennya stosovno tekstu v bazi danih onovlyuyutsya vagi dlya sliv sho vhodyat do jogo skladu Cya stattya ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno berezen 2017 Ce nezavershena stattya zi shtuchnogo intelektu Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi