Рейтинг результатів запиту є однією з основних задач інформаційного пошуку (ІП), яка є науковою та інженерною дисципліною яка використовується пошуковими системами. Для заданого запиту q і колекції документів D, які відповідають запиту, задача полягає у присвоєнні рейтингу цим документів, тобто потрібно відсортувати, документи в D відповідно до певного критерію, так, щоб «найкращі» результати з'являться на початку списку результатів, який відображається користувачу. У класичному варіанті критерії рейтингу формулюються у термінах релевантності документів відповідно до інформаційної потреби, яка виражена у запиті.
Рейтинг часто зводиться до розрахунку числових балів для пар запит-документ. Для цього використовується базова функція ранжирування — це може бути косинус подібності між векторами tf-idf, які відповідають запиту і документу у векторній моделі, бали в [en] або ймовірності у ймовірнісній моделі інформаційного пошуку. Потім рейтинг може бути розрахований шляхом сортування документів у порядку зменшення балів. Іншій підхід полягає у визначенні функції оцінки на парі документів d₁, d₂, яка приймає позитивне значення тоді і тільки тоді, коли d₁ більш релевантний запиту, ніж d₂, і використати цю інформацію для сортування.
Функції ранжирування оцінюються різними методами. Один з найпростіших — це визначити влучність перших k найвищих результатів для деяких фіксованих k. Наприклад, це може бути частка 10 найкращих результатів, які є релевантними, в середньому за багатьма запитами.
Часто обчислення функцій ранжирування можна спростити, скориставшись тим, що має значення тільки відносний порядок балів, а не їхня абсолютна величина. Тому, терміни чи чинники, незалежні від документа, можна вилучити, а терміни чи чинники, які не залежать від запиту, можуть бути попередньо обчислені та збережені разом із документом.
Примітки
- Обчислення балів для векторів [ 14 грудня 2016 у Wayback Machine.].
Див. також
- Навчання ранжуванню — застосування машинного навчання до задачі ранжування
Це незавершена стаття з інформатики. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Rejting rezultativ zapitu ye odniyeyu z osnovnih zadach informacijnogo poshuku IP yaka ye naukovoyu ta inzhenernoyu disciplinoyu yaka vikoristovuyetsya poshukovimi sistemami Dlya zadanogo zapitu q i kolekciyi dokumentiv D yaki vidpovidayut zapitu zadacha polyagaye u prisvoyenni rejtingu cim dokumentiv tobto potribno vidsortuvati dokumenti v D vidpovidno do pevnogo kriteriyu tak shob najkrashi rezultati z yavlyatsya na pochatku spisku rezultativ yakij vidobrazhayetsya koristuvachu U klasichnomu varianti kriteriyi rejtingu formulyuyutsya u terminah relevantnosti dokumentiv vidpovidno do informacijnoyi potrebi yaka virazhena u zapiti Rejting chasto zvoditsya do rozrahunku chislovih baliv dlya par zapit dokument Dlya cogo vikoristovuyetsya bazova funkciya ranzhiruvannya ce mozhe buti kosinus podibnosti mizh vektorami tf idf yaki vidpovidayut zapitu i dokumentu u vektornij modeli bali v en abo jmovirnosti u jmovirnisnij modeli informacijnogo poshuku Potim rejting mozhe buti rozrahovanij shlyahom sortuvannya dokumentiv u poryadku zmenshennya baliv Inshij pidhid polyagaye u viznachenni funkciyi ocinki na pari dokumentiv d d yaka prijmaye pozitivne znachennya todi i tilki todi koli d bilsh relevantnij zapitu nizh d i vikoristati cyu informaciyu dlya sortuvannya Funkciyi ranzhiruvannya ocinyuyutsya riznimi metodami Odin z najprostishih ce viznachiti vluchnist pershih k najvishih rezultativ dlya deyakih fiksovanih k Napriklad ce mozhe buti chastka 10 najkrashih rezultativ yaki ye relevantnimi v serednomu za bagatma zapitami Chasto obchislennya funkcij ranzhiruvannya mozhna sprostiti skoristavshis tim sho maye znachennya tilki vidnosnij poryadok baliv a ne yihnya absolyutna velichina Tomu termini chi chinniki nezalezhni vid dokumenta mozhna viluchiti a termini chi chinniki yaki ne zalezhat vid zapitu mozhut buti poperedno obchisleni ta zberezheni razom iz dokumentom PrimitkiObchislennya baliv dlya vektoriv 14 grudnya 2016 u Wayback Machine Div takozhNavchannya ranzhuvannyu zastosuvannya mashinnogo navchannya do zadachi ranzhuvannya Ce nezavershena stattya z informatiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi