Коефіцієнт Танімото (англ. coefficient Tanimoto) — описує ступінь подібності двох множин.
Застосування
Коефіцієнт Танімото застосовується для:
- визначення рівня схожості двох множин об'єктів;
- виокремлення груп (кластерів) об'єктів з однаковими властивостями (наприклад, пошук людей з однаковими уподобаннями);
- визначення молекулярної схожості.
Обчислення
Формула для обчислення коефіцієнта Танімото:
:
- де Т(A,B) — коефіцієнт Танімото — коефіцієнт схожості множин А та В;
- — кількість елементів в множині A;
- — кількість елементів в множині B;
- — кількість спільних для множин A і B елементів.
T приймає значення від 0 до 1. Чим ближче значення Т до 1, тим більш схожі множини.
Представлення через перетин та об'єднання множин
Коефіцієнт Танімото визначає рівень схожості множин через відношення перетину до об'єднання множин:
Векторне представлення
Припустимо, у нас є N об'єктів. Оцінки, виставлені певним користувачем цим об'єктам, можуть бути представлені як вектор а у N-вимірному просторі об'єктів. Коефіцієнт Танімото використовується для порівняння вектора а з вектором b:
- де -скалярний добуток векторів a та b; та — довжини векторів а та b відповідно.
Реалізація на Python
Визначення схожості двох списків (строк) з використанням мови програмування Python:
# Inputs: two lists # Output: the Tanimoto Coefficient def tanimoto (list1, list2) intersection = [common_item for common_item in list1 if common_item in list2] return float(len(c))/(len(a) + len(b) — len(c))
Примітки
- Коефіцієнт Танімото для визначення людей з однаковими уподобаннями [ 8 листопада 2012 у Wayback Machine.]
- Discussion of Similarity Metrics: Jaccard / Tanimoto Coefficient [ 20 вересня 2012 у Wayback Machine.]
Посилання
- Онлайн калькулятор: Коефіцієнт Танімото [ 8 листопада 2012 у Wayback Machine.]
Джерела
- Dogra, Shaillay K., “Script for computing Tanimoto coefficient” from QSARWorld resource for QSAR modeling.
- Segaran, Toby. Programming Collective Intelligence: Building Smart Web 2.0 Applications. Sebastopol, CA: O'Reilly Media, 2007.
- Romesburg, Charles. Cluster Analysis For Researchers. Morrisville, NC: Lulu.com, 2004.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Koeficiyent Tanimoto angl coefficient Tanimoto opisuye stupin podibnosti dvoh mnozhin ZastosuvannyaKoeficiyent Tanimoto zastosovuyetsya dlya viznachennya rivnya shozhosti dvoh mnozhin ob yektiv viokremlennya grup klasteriv ob yektiv z odnakovimi vlastivostyami napriklad poshuk lyudej z odnakovimi upodobannyami viznachennya molekulyarnoyi shozhosti ObchislennyaFormula dlya obchislennya koeficiyenta Tanimoto T A B N c N a N b N c displaystyle T A B frac N c N a N b N c de T A B koeficiyent Tanimoto koeficiyent shozhosti mnozhin A ta V N a displaystyle N a kilkist elementiv v mnozhini A N b displaystyle N b kilkist elementiv v mnozhini B N c displaystyle N c kilkist spilnih dlya mnozhin A i B elementiv T prijmaye znachennya vid 0 do 1 Chim blizhche znachennya T do 1 tim bilsh shozhi mnozhini Predstavlennya cherez peretin ta ob yednannya mnozhin Koeficiyent Tanimoto viznachaye riven shozhosti mnozhin cherez vidnoshennya peretinu do ob yednannya mnozhin T A B A B A B displaystyle T A B frac A cap B A cup B Vektorne predstavlennya Pripustimo u nas ye N ob yektiv Ocinki vistavleni pevnim koristuvachem cim ob yektam mozhut buti predstavleni yak vektor a u N vimirnomu prostori ob yektiv Koeficiyent Tanimoto vikoristovuyetsya dlya porivnyannya vektora a z vektorom b T a B a b a 2 b 2 a b displaystyle T vec a vec B frac vec a cdot vec b vec a 2 vec b 2 vec a cdot vec b de a b displaystyle vec a cdot vec b skalyarnij dobutok vektoriv a ta b a displaystyle vec a ta b displaystyle vec b dovzhini vektoriv a ta b vidpovidno Realizaciya na PythonViznachennya shozhosti dvoh spiskiv strok z vikoristannyam movi programuvannya Python Inputs two lists Output the Tanimoto Coefficient def tanimoto list1 list2 intersection common item for common item in list1 if common item in list2 return float len c len a len b amp nbsp len c PrimitkiKoeficiyent Tanimoto dlya viznachennya lyudej z odnakovimi upodobannyami 8 listopada 2012 u Wayback Machine Discussion of Similarity Metrics Jaccard Tanimoto Coefficient 20 veresnya 2012 u Wayback Machine PosilannyaOnlajn kalkulyator Koeficiyent Tanimoto 8 listopada 2012 u Wayback Machine DzherelaDogra Shaillay K Script for computing Tanimoto coefficient from QSARWorld resource for QSAR modeling Segaran Toby Programming Collective Intelligence Building Smart Web 2 0 Applications Sebastopol CA O Reilly Media 2007 Romesburg Charles Cluster Analysis For Researchers Morrisville NC Lulu com 2004