Система фільтрації інформації — це система, яка усуває надлишкову або небажану інформацію з інформаційного потоку за допомогою автоматичних (напівавтоматичних) або комп'ютерних методів і надає її користувачу-людині. Основна задача — управління інформаційним перевантаженням та збільшення семантичного співвідношення («сигнал-шум»). Щоб зробити це, профіль користувача співставляється з деякими еталонними даними. Ці характеристики можуть походити з інформаційного елемента (контентно-орієнтовний підхід) або із соціального середовища користувача (підхід спільної фільтрації).
У той час як [en] й передачі сигналу інформації використовуються проти синтаксичного руйнівного шуму на бітовому рівні, методи, що використовуються при фільтрації інформації, діють на семантичному рівні.
Діапазон методів, які застосовуються машинами, ґрунтується на тих самих принципах, що використовуються для добування інформації. Це суттєво використовується у фільтуванні електронної пошти. Таким чином, це використовується не тільки у випадку інформаційного вибуху, що потребує використання деякої форми фільтрів, але також і для фільрування ненавмисно або навмисно доданої [en]інформації.
На загал, система фільтрації набуває форми вподобань користувача на основі добірки і т. д.
Рекомендаційні системи — це активні системи фільтрації інформації, які намагаються надати користувачу інформаційні елементи (кіно, телебачення, музика, книги, новини, вебсторінки), у яких зацікавлений користувач. Ці системи додають інформаційні елементи до інформації, призначеної користувачу. Рекомендаційні системи зазвичай використовують колаборативну фільтрацію або комбінацію спільної фільтрації та змістовних підходів фільтрації, хоча при цьому, існують також рекомендаційні системи засновані на контенті.
Історія
До появи інтернету вже було декілька методів фільтрації інформації; наприклад, уряд може контролювати й обмежувати потік інформації в даній країні шляхом формальної або неформальної цензури. З іншого боку, ми збираємося говорити про інформаційні фільтри, якщо ми посилаємося на газетних редакторів та журналістів, коли вони надають послуги, які вибирають найціннішу інформацію для своїх клієнтів, читачів книг, журнали, газети, радіослухачів і телеглядачів. Ця операція фільтрації також є у школах та в університетах, де є вибір інформації для надання допомоги на основі академічних критеріїв для клієнтів цієї служби, студентів. З появою інтернету збільшується можливість того, що будь-хто може опублікувати за низькими цінами все, що забажає. Таким чином, це значно збільшує кількість менш корисної інформації, а отже й якість цієї інформації є поняттям розсіяним. Маючи цю проблему, почалися розробки нової фільтрації, з якою ми можемо легко й ефективно отримати інформацію, розділену на окремі теми.
Операція
Система фільтрації цього стилю складається з декількох інструментів, які допомагають людям знайти найціннішу інформацію, тобто за обмежений час ви можете присвятити / прочитати / прослухати / переглянути інформацію, спрямовану на найцікавіші та гайцінніші документи, окрім найнесуттєвішого. Ці фільтри також використовуються для організації і структурування інформації в коректній і зрозумілій формі, виключаючи лише групування повідомлень поштою на ім'я. Ці фільтри дуже потрібні в отриманих результатах пошукових систем в Інтернеті. Функції фільтрації поліпшуються кожен день, щоб отримати найкраще завантаження вебдокументів і більш ефективне сполучення.
Критерії
Одним з критеріїв, що використовуються на цьому етапі є знання шкідливо це чи ні, чи знання дозволяє краще зрозуміти, з або без концепції. В цьому випадку задача фільтрації інформації напрямлена на те, щоб зменшити або усунути шкідливу інформацію з певними знаннями.
Система навчання
Зміст системи навчання полягає в основному у трьох основних етапах:
1.По-перше, це система, яка забезпечує вирішення заданого набору завдань.
2.Згодом вона піддається оцінці критеріїв, за якими вимірюється продуктивність на попередньому етапі у зв'язку з вирішенням проблем.
3.Придбання модуля, його вихід отриманих знань, які використовуються в системі розрахунку першого етапу.
Майбутнє
В даний час проблема полягає не у знаходженні найкращого способу фільтрування інформації, а способу, яким ці системи зможуть користуватися, щоб самостійно вивчати інформаційні потреби користувачів. Не тільки тому, що вони автоматизують процес фільтрації, але й через будівництво та адаптацію фільтра. Деякі гілки на його основі, такі як статистики, машинне навчання, розпізнавання образів та інтелектуального аналізу даних — є основою для розробки інформаційних фільтрів, які з'являються і адаптуються в базу даних для досвіду. Щоб відбувався процес навчання, частина інформації повинна бути попередньо відфільтровані, значить є і позитивні і негативні приклади, які ми назвали навчальними даними, які можуть визначатися експертами або через форму зворотного зв'язку зі звичайними користувачами.
Помилки
По мірі введення даних, система включає в себе нові правила: якщо ми вважаємо, що ці дані можуть узагальнити навчальні дані, то ми повинні оцінити системи розвитку та виміряти здатність системи правильно прогнозувати категорій нової інформації. Цей крок є спрощеним шляхом відділення підготовки даних у новій серії під назвою «перевірка даних, які ми будемо використовувати для вимірювання частоти помилок». Як загальне правило, важливо розрізняти типи помилок (помилкові спрацьовування та негативи). Наприклад, у випадку з агрегатором контенту для дітей — він не має достатньої сили тяжіння, щоб забезпечити прохід інформації яка не підходить для них, що показує насильство чи порнографію. Щоб покращити систему у напрямку зниження частоти помилок та мати ці системи зі здатністю навчатися такою ж, як у людей, нам потрібні розробки систем, що симулюють людські когнітивні здатності, такі як натуральне розуміння мови, уловлювання сенсу з такою ж легкістю, що й інші форми глибокої обробки для отримання семантики інформації.
Сфери застосування
Сьогодні, існує багато способів розробки інформаційних фільтрів, деякі з котрих досягають частоти помилок, менш ніж 10 % у численних експериментах. Серед цих методів є дерева рішень, метод опорних векторів, нейронні мережі, баєсівські мережі, лінійні дискримінанти, логістична регресія і т. д.. Ці техніки використовуються у різноманітних програмах, не лише у вебконтексті, а й у тематичних питаннях, таких як розпізнання голосу, класифікації телескопічної астрономії або оцінювання фінансових ризиків.
Див. також
Джерела
- Hanani, U., Shapira, B., Shoval, P. (2001) Information filtering: Overview of issues, research and systems. User Modeling and User-Adapted Interaction, 11, pp. 203—259.
- http://www.infoworld.com/d/developer-world/human-information-filter-8[недоступне посилання з липня 2019]
Посилання
- infoworld
- IEEXplore
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Sistema filtraciyi informaciyi ce sistema yaka usuvaye nadlishkovu abo nebazhanu informaciyu z informacijnogo potoku za dopomogoyu avtomatichnih napivavtomatichnih abo komp yuternih metodiv i nadaye yiyi koristuvachu lyudini Osnovna zadacha upravlinnya informacijnim perevantazhennyam ta zbilshennya semantichnogo spivvidnoshennya signal shum Shob zrobiti ce profil koristuvacha spivstavlyayetsya z deyakimi etalonnimi danimi Ci harakteristiki mozhut pohoditi z informacijnogo elementa kontentno oriyentovnij pidhid abo iz socialnogo seredovisha koristuvacha pidhid spilnoyi filtraciyi U toj chas yak en j peredachi signalu informaciyi vikoristovuyutsya proti sintaksichnogo rujnivnogo shumu na bitovomu rivni metodi sho vikoristovuyutsya pri filtraciyi informaciyi diyut na semantichnomu rivni Diapazon metodiv yaki zastosovuyutsya mashinami gruntuyetsya na tih samih principah sho vikoristovuyutsya dlya dobuvannya informaciyi Ce suttyevo vikoristovuyetsya u filtuvanni elektronnoyi poshti Takim chinom ce vikoristovuyetsya ne tilki u vipadku informacijnogo vibuhu sho potrebuye vikoristannya deyakoyi formi filtriv ale takozh i dlya filruvannya nenavmisno abo navmisno dodanoyi en informaciyi Na zagal sistema filtraciyi nabuvaye formi vpodoban koristuvacha na osnovi dobirki i t d Rekomendacijni sistemi ce aktivni sistemi filtraciyi informaciyi yaki namagayutsya nadati koristuvachu informacijni elementi kino telebachennya muzika knigi novini vebstorinki u yakih zacikavlenij koristuvach Ci sistemi dodayut informacijni elementi do informaciyi priznachenoyi koristuvachu Rekomendacijni sistemi zazvichaj vikoristovuyut kolaborativnu filtraciyu abo kombinaciyu spilnoyi filtraciyi ta zmistovnih pidhodiv filtraciyi hocha pri comu isnuyut takozh rekomendacijni sistemi zasnovani na kontenti IstoriyaDo poyavi internetu vzhe bulo dekilka metodiv filtraciyi informaciyi napriklad uryad mozhe kontrolyuvati j obmezhuvati potik informaciyi v danij krayini shlyahom formalnoyi abo neformalnoyi cenzuri Z inshogo boku mi zbirayemosya govoriti pro informacijni filtri yaksho mi posilayemosya na gazetnih redaktoriv ta zhurnalistiv koli voni nadayut poslugi yaki vibirayut najcinnishu informaciyu dlya svoyih kliyentiv chitachiv knig zhurnali gazeti radiosluhachiv i teleglyadachiv Cya operaciya filtraciyi takozh ye u shkolah ta v universitetah de ye vibir informaciyi dlya nadannya dopomogi na osnovi akademichnih kriteriyiv dlya kliyentiv ciyeyi sluzhbi studentiv Z poyavoyu internetu zbilshuyetsya mozhlivist togo sho bud hto mozhe opublikuvati za nizkimi cinami vse sho zabazhaye Takim chinom ce znachno zbilshuye kilkist mensh korisnoyi informaciyi a otzhe j yakist ciyeyi informaciyi ye ponyattyam rozsiyanim Mayuchi cyu problemu pochalisya rozrobki novoyi filtraciyi z yakoyu mi mozhemo legko j efektivno otrimati informaciyu rozdilenu na okremi temi OperaciyaSistema filtraciyi cogo stilyu skladayetsya z dekilkoh instrumentiv yaki dopomagayut lyudyam znajti najcinnishu informaciyu tobto za obmezhenij chas vi mozhete prisvyatiti prochitati prosluhati pereglyanuti informaciyu spryamovanu na najcikavishi ta gajcinnishi dokumenti okrim najnesuttyevishogo Ci filtri takozh vikoristovuyutsya dlya organizaciyi i strukturuvannya informaciyi v korektnij i zrozumilij formi viklyuchayuchi lishe grupuvannya povidomlen poshtoyu na im ya Ci filtri duzhe potribni v otrimanih rezultatah poshukovih sistem v Interneti Funkciyi filtraciyi polipshuyutsya kozhen den shob otrimati najkrashe zavantazhennya vebdokumentiv i bilsh efektivne spoluchennya Kriteriyi Odnim z kriteriyiv sho vikoristovuyutsya na comu etapi ye znannya shkidlivo ce chi ni chi znannya dozvolyaye krashe zrozumiti z abo bez koncepciyi V comu vipadku zadacha filtraciyi informaciyi napryamlena na te shob zmenshiti abo usunuti shkidlivu informaciyu z pevnimi znannyami Sistema navchannya Zmist sistemi navchannya polyagaye v osnovnomu u troh osnovnih etapah 1 Po pershe ce sistema yaka zabezpechuye virishennya zadanogo naboru zavdan 2 Zgodom vona piddayetsya ocinci kriteriyiv za yakimi vimiryuyetsya produktivnist na poperednomu etapi u zv yazku z virishennyam problem 3 Pridbannya modulya jogo vihid otrimanih znan yaki vikoristovuyutsya v sistemi rozrahunku pershogo etapu MajbutnyeV danij chas problema polyagaye ne u znahodzhenni najkrashogo sposobu filtruvannya informaciyi a sposobu yakim ci sistemi zmozhut koristuvatisya shob samostijno vivchati informacijni potrebi koristuvachiv Ne tilki tomu sho voni avtomatizuyut proces filtraciyi ale j cherez budivnictvo ta adaptaciyu filtra Deyaki gilki na jogo osnovi taki yak statistiki mashinne navchannya rozpiznavannya obraziv ta intelektualnogo analizu danih ye osnovoyu dlya rozrobki informacijnih filtriv yaki z yavlyayutsya i adaptuyutsya v bazu danih dlya dosvidu Shob vidbuvavsya proces navchannya chastina informaciyi povinna buti poperedno vidfiltrovani znachit ye i pozitivni i negativni prikladi yaki mi nazvali navchalnimi danimi yaki mozhut viznachatisya ekspertami abo cherez formu zvorotnogo zv yazku zi zvichajnimi koristuvachami Pomilki Po miri vvedennya danih sistema vklyuchaye v sebe novi pravila yaksho mi vvazhayemo sho ci dani mozhut uzagalniti navchalni dani to mi povinni ociniti sistemi rozvitku ta vimiryati zdatnist sistemi pravilno prognozuvati kategorij novoyi informaciyi Cej krok ye sproshenim shlyahom viddilennya pidgotovki danih u novij seriyi pid nazvoyu perevirka danih yaki mi budemo vikoristovuvati dlya vimiryuvannya chastoti pomilok Yak zagalne pravilo vazhlivo rozriznyati tipi pomilok pomilkovi spracovuvannya ta negativi Napriklad u vipadku z agregatorom kontentu dlya ditej vin ne maye dostatnoyi sili tyazhinnya shob zabezpechiti prohid informaciyi yaka ne pidhodit dlya nih sho pokazuye nasilstvo chi pornografiyu Shob pokrashiti sistemu u napryamku znizhennya chastoti pomilok ta mati ci sistemi zi zdatnistyu navchatisya takoyu zh yak u lyudej nam potribni rozrobki sistem sho simulyuyut lyudski kognitivni zdatnosti taki yak naturalne rozuminnya movi ulovlyuvannya sensu z takoyu zh legkistyu sho j inshi formi glibokoyi obrobki dlya otrimannya semantiki informaciyi Sferi zastosuvannyaSogodni isnuye bagato sposobiv rozrobki informacijnih filtriv deyaki z kotrih dosyagayut chastoti pomilok mensh nizh 10 u chislennih eksperimentah Sered cih metodiv ye dereva rishen metod opornih vektoriv nejronni merezhi bayesivski merezhi linijni diskriminanti logistichna regresiya i t d Ci tehniki vikoristovuyutsya u riznomanitnih programah ne lishe u vebkonteksti a j u tematichnih pitannyah takih yak rozpiznannya golosu klasifikaciyi teleskopichnoyi astronomiyi abo ocinyuvannya finansovih rizikiv Div takozhInformacijna kultura Filtr Kalmana Kontent filtrDzherelaHanani U Shapira B Shoval P 2001 Information filtering Overview of issues research and systems User Modeling and User Adapted Interaction 11 pp 203 259 http www infoworld com d developer world human information filter 8 nedostupne posilannya z lipnya 2019 Posilannyainfoworld IEEXplore