Кластерний аналіз (англ. Data clustering) — задача розбиття заданої вибірки об'єктів (ситуацій) на підмножини, які називаються кластерами, так, щоб кожен кластер складався з схожих об'єктів, а об'єкти різних кластерів істотно відрізнялися. Завдання кластеризації належить до статистичної обробки, а також до широкого класу завдань некерованого навчання.
Кластерний аналіз — це не якийсь один алгоритм, а загальна задача, для розв'язання якої використовуються різні підходи. Зокрема, алгоритми побудови кластерів можуть суттєво відрізнятись у розумінні того, що відносити в один кластер і як їх ефективно шукати. Серед популярних концепцій кластерів є групи з елементами, які утворюються ґрунтуючись на відстані між ними, на щільності ділянок у просторі даних, інтервалах або на конкретних статистичних розподілах. Тому кластеризація може бути сформульована як задача багатокритеріальної оптимізації. Відповідний алгоритм кластеризації та вибору параметрів (включаючи такі параметри, як функція відстані, порогове значення щільності або кількість очікуваних кластерів) залежать від конкретного набору даних та мети використання результатів. Кластерний аналіз як такий є не автоматизованим завданням, а ітераційним процесом (виявлення знань) або інтерактивної багатокритеріальної оптимізації, який містить спроби та невдачі. Часто доводиться змінювати процес опрацювання даних та параметри моделі поки не буде отримано з результат з заданими властивостями.
Окрім терміну кластеризація існує багато термінів з аналогічним значенням, серед яких автоматична класифікація, [en] та типологічний аналіз. Тонкі розбіжності часто полягають у використанні результатів: для добування даних, отримані групи є предметом інтересу, при автоматичній класифікації, навпаки, більш важливий степінь розбіжності.
Кластерний аналіз походить з антропології, де він був започаткований Драйвером (англ. Driver) і Крьобером (англ. Kroeber) у 1932 році. В психологію він був введений Зубіним у 1938 році і [en] у 1939. Став відомий завдяки використанню Кеттелем для класифікації теорії ознак в психології особистості, починаючи з 1943 року.
Загальна характеристика
Кластерний аналіз — це багатовимірна статистична процедура, яка виконує збір даних, що містять інформацію про вибірку об'єктів і потім упорядковує об'єкти в порівняно однорідні групи — кластери (Q-кластеризація, або Q-техніка, власне кластерний аналіз).
Основна мета кластерного аналізу — знаходження груп схожих об'єктів у вибірці. Спектр застосувань кластерного аналізу дуже широкий: його використовують в археології, антропології, медицині, психології, хімії, біології, державному управлінні, філології, маркетингу, соціології та інших дисциплінах. Однак універсальність застосування привела до появи великої кількості несумісних термінів, методів і підходів, що ускладнюють однозначне використання і несуперечливу інтерпретацію кластерного аналізу.
Формальне визначення кластеризації
Нехай — множина об'єктів, — множина номерів (імен, міток) кластерів. Задано функцію відстані між об'єктами . Є кінцева вибірка об'єктів . Потрібно розбити вибірку на непересічні підмножини, що називаються кластерами, так, щоб кожен кластер складався з об'єктів, близьких по метриці , а об'єкти різних кластерів істотно відрізнялися. При цьому кожному об'єкту приписується номер кластеру .
Алгоритм кластеризації — це функція , яка будь-якому об'єкту ставить у відповідність номер кластера . Множина в деяких випадках відома заздалегідь, проте частіше ставиться завдання визначити оптимальне число кластерів, з погляду деякого критерію якості кластеризації.
Завдання
Кластерний аналіз виконує наступні основні завдання:
- Розробка типології або класифікації.
- Дослідження корисних концептуальних схем групування об'єктів.
- Породження гіпотез на основі дослідження даних.
- Перевірка гіпотез або дослідження для визначення, чи дійсно групи, виділені тим чи іншим способом, присутні в наявних даних.
Етапи
Незалежно від конкретної сфери, застосування кластерного аналізу передбачає наступні етапи:
- Відбір вибірки для кластеризації.
- Визначення множини характеристик, по яких будуть оцінюватися об'єкти у вибірці.
- Обчислення значень тієї чи іншої між об'єктами.
- Застосування одного з методів кластерного аналізу для створення груп схожих об'єктів.
- Перевірка достовірності результатів кластеризації.
Якщо кластерному аналізу передує факторний аналіз, то вибірка не потребує коректування — викладені вимоги виконуються автоматично самою процедурою факторного моделювання. В іншому випадку вибірку потрібно коректувати.
Методи кластеризації
Оскільки поняття «кластеру» не може бути точно визначено, то це є однією з причин чому існує так багато різних методів кластеризації. Але є і спільна риса — це об'єднання схожих об'єктів у групи. Однак, різні дослідники використовують різні моделі кластерів і для кожної з цих моделей можуть бути застосовані різні алгоритми. Поняття кластера, які отримуються у різних алгоритмах, різняться властивостями. Розуміння цих «кластерних моделей» є ключовим для розуміння відмінностей між різними алгоритмами. Типовими кластерними моделями є:
- Моделі зв'язності. Наприклад, ієрархічна кластеризація або таксономія будуються на основі відстані між вузлами.
- Центроїдні моделі. Наприклад, метод K-середніх (K-means) представляє кожен кластер єдиним усередненим вектором.
- Статистичні моделі. Кластери будуються ґрунтуючись на статистичних розподілах. Таких як багатовимірний нормальний розподіл з допомогою ЕМ-алгоритму.
- Моделі засновані на щільності. Наприклад, в DBSCAN і в OPTICS кластери визначаються як зв'язані області відповідної щільності у просторі даних.
- Групові моделі. Деякі алгоритми не забезпечують вдосконалену модель для своїх результатів, а просто описують групування об'єктів.
- Графові моделі. Поняття кліки (така підмножина вершин, в якій кожна пара вершин з'єднана ребром) у графі слугує прототипом кластеру. Пом'якшення вимоги до повної зв'язності (тобто, частина ребер може бути відсутня) призводить до поняття відомого як квазі-кліка. Вони будуються алгоритмом [en].
- Нейронні моделі. Найбільш відомою моделлю нейронної мережі з некерованим навчанням є нейронна мережа Кохонена. Ці моделі, як правило, можна охарактеризувати як схожі на одну або подібні якійсь з наведених вище моделей, включаючи моделі у підпросторах, коли нейронні мережі реалізують метод головних компонент або [en].
«Кластеризацією» зазвичай вважають такий набір кластерів, які містять усі об'єкти набору даних. Додатково, можна розглянути відношення між кластерами. Наприклад, ієрархію вкладеності кластерів один у одного. Грубо можна виділити такі кластеризації:
- Жорстка кластеризація. Кожен об'єкт або належить кластеру або ні.
- М'яка кластеризація (також нечітка кластеризація). Кожен об'єкт належить кожному кластеру до певної міри. Наприклад, це ймовірність належності кластеру.
Серед них виділяють декілька доладних:
- Жорстке розбиття на кластери. Кожен об'єкт належить рівно одному кластеру.
- Жорстке розбиття на кластери з викидами. Об'єкт може не належати жодному кластеру і розглядається як викид.
- Кластери з перетином. Об'єкт може належати більш ніж одному кластеру.
- Ієрархічна кластеризація. Якщо об'єкт належить нащадку, то він також належить і предку.
- Підпросторова кластеризація. Хоч кластери і можуть перетинатись, проте в межах визначеного підпростору кластери не перетинаються. Для прикладу дивись [en].
Вхідні дані
Типи вхідних даних
Вхідними даними кластерного аналізу є набір об'єктів. В залежності від способу представлення цих об'єктів розрізняють такі типи вхідних даних:
- Вектор характеристик. Кожен об'єкт описується набором своїх характеристик; ці характеристики можуть бути числовими або нечисловими.
- . Кожен об'єкт описується відстанями до всіх інших об'єктів вибірки.
Вимоги до вхідних даних
Кластерний аналіз висуває наступні вимоги до даних:
- Об'єкти не повинні корелювати між собою.
- Об'єкти мають бути безрозмірними.
- Розподіл об'єктів має бути близьким до нормального.
- Об'єкти повинні відповідати вимозі стійкості, під якою розуміється відсутність впливу на їх значення випадкових чинників.
- Вибірка повинна бути однорідна.
Результати
Причини неоднозначності
Рішення задачі кластеризації принципове неоднозначне, і цьому є декілька причин:
- Не існує однозначно якнайкращого критерію якості кластеризації. Відомий цілий ряд евристичних критеріїв, а також ряд алгоритмів, що не мають чітко вираженого критерію, але здійснюють достатньо розумну кластеризацію «по побудові». Всі вони можуть давати різні результати.
- Число кластерів, як правило, невідоме заздалегідь і встановлюється відповідно до деякого суб'єктивного критерію.
- Результат кластеризації істотно залежить від метрики, вибір якої, як правило, також суб'єктивний і визначається експертом.
Інтерпретація результатів
Результатом кластеризації є групи об'єктів, об'єднані за певною характеристикою чи характеристиками. Однак ці результати можуть бути інтерпретовані по-різному. Зокрема, при аналізі результатів соціологічних досліджень рекомендується здійснювати аналіз ієрархічними методами, наприклад методом Уорда, при якому всередині кластерів оптимізується мінімальна дисперсія і в результаті створюються кластери приблизно рівних розмірів. Як міра відмінності між кластерами використовується квадратична евклідова відстань, що сприяє збільшенню контрастності кластерів.
Тепер виникає питання стійкості знайденого кластерного рішення. По суті, перевірка стійкості кластеризації зводиться до перевірки її достовірності. Тут існує емпіричне правило — стійка типологія зберігається при зміні методів кластеризації. Результати ієрархічного кластерного аналізу можна перевіряти ітеративним кластерним аналізом методом k-середніх. Якщо при порівнянні групи збігаються більше, ніж на 70 % (понад 2/3 збігів), то кластерне рішення приймається.
Перевірити адекватність рішення, не вдаючись до допомоги інших видів аналізу, не можна. Принаймні, в теоретичному плані ця проблема не вирішена. Деякі додаткові методи перевірки стійкості відкидаються з певних причин:
- — не рекомендується і обмежена у використанні.
- Тести значущості (дисперсійний аналіз) — завжди дають значущий результат.
- Метод повторних випадкових вибірок — не доводить правильність рішення.
- Тести значущості для зовнішніх ознак — придатні тільки для повторних вимірювань.
- Методи Монте-Карло — дуже складні і доступні тільки досвідченим математикам.
Дотичні терміни
- Кластерування (рос. кластерирование, англ. clustering) — метод обробки даних, що полягає у встановленні в певній сукупності за певним алгоритмом членів, які є подібними.
Якісні або кількісні критерії подібності задаються. Широко використовується в хемометриці, комбінаторній хімії, при обробці хімічної та біохімічної інформації.
Див. також
Примітки
- Bailey, Ken (1994). Numerical Taxonomy and Cluster Analysis. Typologies and Taxonomies. с. 34. ISBN .
- (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards Brothers.
- Cattell, R. B. (1943). The description of personality: Basic traits resolved into clusters. Journal of Abnormal and Social Psychology. 38 (4): 476—506. doi:10.1037/h0054116.
- Estivill-Castro, Vladimir (20 червня 2002). Why so many clustering algorithms – A Position Paper. ACM SIGKDD Explorations Newsletter. 4 (1): 65—75. doi:10.1145/568574.568575.
Джерела
- Jain, Murty, Flynn Data clustering: a review. // ACM Comput. Surv. 31(3), 1999.
- Журавлев Ю. И., Рязанов В. В., Сенько О. В. Распознавание. Математические методы. Программная система. Практические применения. — М.: Фазис, 2006. .
- Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. .
- Мандель И. Д. Кластерный анализ. — М.: Финансы и статистика, 1988. .
- Олдендерфер М. С., Блэшфилд Р. К. Кластерный анализ / Факторный, дискриминантный и кластерный анализ: пер. с англ.; Под. ред. И. С. Енюкова. — М.: Финансы и статистика, 1989. — 215 с.
- Шуметов В. Г. Шуметова Л. В. Кластерный анализ: подход с применением ЭВМ. — Орел: ОрелГТУ, 2000. — 118 с.
- Глосарій термінів з хімії // Й. Опейда, О. Швайка. Ін-т фізико-органічної хімії та вуглехімії ім. Л. М. Литвиненка НАН України, Донецький національний університет. — Донецьк: Вебер, 2008. — 758 с. —
- Tan, Pang-Ning; Michael, Steinbach; Kumar, Vipin (2005). (PDF). Introduction to Data Mining. Addison-Wesley. ISBN . Архів оригіналу (PDF) за 18 Жовтня 2018. Процитовано 3 Серпня 2018.
Посилання
- Кластерний аналіз на фінансових ринках [ 21 лютого 2017 у Wayback Machine.]
В іншому мовному розділі є повніша стаття Cluster analysis(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою з англійської. (листопад 2022)
|
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Klasternij analiz angl Data clustering zadacha rozbittya zadanoyi vibirki ob yektiv situacij na pidmnozhini yaki nazivayutsya klasterami tak shob kozhen klaster skladavsya z shozhih ob yektiv a ob yekti riznih klasteriv istotno vidriznyalisya Zavdannya klasterizaciyi nalezhit do statistichnoyi obrobki a takozh do shirokogo klasu zavdan nekerovanogo navchannya Rezultat klasternogo analizu pokazano u viglyadi tochok rozfarbovanih u tri kolori Klasternij analiz ce ne yakijs odin algoritm a zagalna zadacha dlya rozv yazannya yakoyi vikoristovuyutsya rizni pidhodi Zokrema algoritmi pobudovi klasteriv mozhut suttyevo vidriznyatis u rozuminni togo sho vidnositi v odin klaster i yak yih efektivno shukati Sered populyarnih koncepcij klasteriv ye grupi z elementami yaki utvoryuyutsya gruntuyuchis na vidstani mizh nimi na shilnosti dilyanok u prostori danih intervalah abo na konkretnih statistichnih rozpodilah Tomu klasterizaciya mozhe buti sformulovana yak zadacha bagatokriterialnoyi optimizaciyi Vidpovidnij algoritm klasterizaciyi ta viboru parametriv vklyuchayuchi taki parametri yak funkciya vidstani porogove znachennya shilnosti abo kilkist ochikuvanih klasteriv zalezhat vid konkretnogo naboru danih ta meti vikoristannya rezultativ Klasternij analiz yak takij ye ne avtomatizovanim zavdannyam a iteracijnim procesom viyavlennya znan abo interaktivnoyi bagatokriterialnoyi optimizaciyi yakij mistit sprobi ta nevdachi Chasto dovoditsya zminyuvati proces opracyuvannya danih ta parametri modeli poki ne bude otrimano z rezultat z zadanimi vlastivostyami Okrim terminu klasterizaciya isnuye bagato terminiv z analogichnim znachennyam sered yakih avtomatichna klasifikaciya en ta tipologichnij analiz Tonki rozbizhnosti chasto polyagayut u vikoristanni rezultativ dlya dobuvannya danih otrimani grupi ye predmetom interesu pri avtomatichnij klasifikaciyi navpaki bilsh vazhlivij stepin rozbizhnosti Klasternij analiz pohodit z antropologiyi de vin buv zapochatkovanij Drajverom angl Driver i Kroberom angl Kroeber u 1932 roci V psihologiyu vin buv vvedenij Zubinim u 1938 roci i en u 1939 Stav vidomij zavdyaki vikoristannyu Kettelem dlya klasifikaciyi teoriyi oznak v psihologiyi osobistosti pochinayuchi z 1943 roku Zagalna harakteristikaKlasternij analiz ce bagatovimirna statistichna procedura yaka vikonuye zbir danih sho mistyat informaciyu pro vibirku ob yektiv i potim uporyadkovuye ob yekti v porivnyano odnoridni grupi klasteri Q klasterizaciya abo Q tehnika vlasne klasternij analiz Osnovna meta klasternogo analizu znahodzhennya grup shozhih ob yektiv u vibirci Spektr zastosuvan klasternogo analizu duzhe shirokij jogo vikoristovuyut v arheologiyi antropologiyi medicini psihologiyi himiyi biologiyi derzhavnomu upravlinni filologiyi marketingu sociologiyi ta inshih disciplinah Odnak universalnist zastosuvannya privela do poyavi velikoyi kilkosti nesumisnih terminiv metodiv i pidhodiv sho uskladnyuyut odnoznachne vikoristannya i nesuperechlivu interpretaciyu klasternogo analizu Formalne viznachennya klasterizaciyiNehaj X displaystyle X mnozhina ob yektiv Y displaystyle Y mnozhina nomeriv imen mitok klasteriv Zadano funkciyu vidstani mizh ob yektami r x x displaystyle rho x x Ye kinceva vibirka ob yektiv X m x 1 x m X displaystyle X m x 1 dots x m subset X Potribno rozbiti vibirku na neperesichni pidmnozhini sho nazivayutsya klasterami tak shob kozhen klaster skladavsya z ob yektiv blizkih po metrici r displaystyle rho a ob yekti riznih klasteriv istotno vidriznyalisya Pri comu kozhnomu ob yektu x i X m displaystyle x i in X m pripisuyetsya nomer klasteru y i displaystyle y i Algoritm klasterizaciyi ce funkciya a X Y displaystyle a colon X to Y yaka bud yakomu ob yektu x X displaystyle x in X stavit u vidpovidnist nomer klastera y Y displaystyle y in Y Mnozhina Y displaystyle Y v deyakih vipadkah vidoma zazdalegid prote chastishe stavitsya zavdannya viznachiti optimalne chislo klasteriv z poglyadu deyakogo kriteriyu yakosti klasterizaciyi ZavdannyaKlasternij analiz vikonuye nastupni osnovni zavdannya Rozrobka tipologiyi abo klasifikaciyi Doslidzhennya korisnih konceptualnih shem grupuvannya ob yektiv Porodzhennya gipotez na osnovi doslidzhennya danih Perevirka gipotez abo doslidzhennya dlya viznachennya chi dijsno grupi vidileni tim chi inshim sposobom prisutni v nayavnih danih EtapiNezalezhno vid konkretnoyi sferi zastosuvannya klasternogo analizu peredbachaye nastupni etapi Vidbir vibirki dlya klasterizaciyi Viznachennya mnozhini harakteristik po yakih budut ocinyuvatisya ob yekti u vibirci Obchislennya znachen tiyeyi chi inshoyi mizh ob yektami Zastosuvannya odnogo z metodiv klasternogo analizu dlya stvorennya grup shozhih ob yektiv Perevirka dostovirnosti rezultativ klasterizaciyi Yaksho klasternomu analizu pereduye faktornij analiz to vibirka ne potrebuye korektuvannya vikladeni vimogi vikonuyutsya avtomatichno samoyu proceduroyu faktornogo modelyuvannya V inshomu vipadku vibirku potribno korektuvati Metodi klasterizaciyiOskilki ponyattya klasteru ne mozhe buti tochno viznacheno to ce ye odniyeyu z prichin chomu isnuye tak bagato riznih metodiv klasterizaciyi Ale ye i spilna risa ce ob yednannya shozhih ob yektiv u grupi Odnak rizni doslidniki vikoristovuyut rizni modeli klasteriv i dlya kozhnoyi z cih modelej mozhut buti zastosovani rizni algoritmi Ponyattya klastera yaki otrimuyutsya u riznih algoritmah riznyatsya vlastivostyami Rozuminnya cih klasternih modelej ye klyuchovim dlya rozuminnya vidminnostej mizh riznimi algoritmami Tipovimi klasternimi modelyami ye Modeli zv yaznosti Napriklad iyerarhichna klasterizaciya abo taksonomiya buduyutsya na osnovi vidstani mizh vuzlami Centroyidni modeli Napriklad metod K serednih K means predstavlyaye kozhen klaster yedinim userednenim vektorom Statistichni modeli Klasteri buduyutsya gruntuyuchis na statistichnih rozpodilah Takih yak bagatovimirnij normalnij rozpodil z dopomogoyu EM algoritmu Modeli zasnovani na shilnosti Napriklad v DBSCAN i v OPTICS klasteri viznachayutsya yak zv yazani oblasti vidpovidnoyi shilnosti u prostori danih Grupovi modeli Deyaki algoritmi ne zabezpechuyut vdoskonalenu model dlya svoyih rezultativ a prosto opisuyut grupuvannya ob yektiv Grafovi modeli Ponyattya kliki taka pidmnozhina vershin v yakij kozhna para vershin z yednana rebrom u grafi sluguye prototipom klasteru Pom yakshennya vimogi do povnoyi zv yaznosti tobto chastina reber mozhe buti vidsutnya prizvodit do ponyattya vidomogo yak kvazi klika Voni buduyutsya algoritmom en Nejronni modeli Najbilsh vidomoyu modellyu nejronnoyi merezhi z nekerovanim navchannyam ye nejronna merezha Kohonena Ci modeli yak pravilo mozhna oharakterizuvati yak shozhi na odnu abo podibni yakijs z navedenih vishe modelej vklyuchayuchi modeli u pidprostorah koli nejronni merezhi realizuyut metod golovnih komponent abo en Klasterizaciyeyu zazvichaj vvazhayut takij nabir klasteriv yaki mistyat usi ob yekti naboru danih Dodatkovo mozhna rozglyanuti vidnoshennya mizh klasterami Napriklad iyerarhiyu vkladenosti klasteriv odin u odnogo Grubo mozhna vidiliti taki klasterizaciyi Zhorstka klasterizaciya Kozhen ob yekt abo nalezhit klasteru abo ni M yaka klasterizaciya takozh nechitka klasterizaciya Kozhen ob yekt nalezhit kozhnomu klasteru do pevnoyi miri Napriklad ce jmovirnist nalezhnosti klasteru Sered nih vidilyayut dekilka doladnih Zhorstke rozbittya na klasteri Kozhen ob yekt nalezhit rivno odnomu klasteru Zhorstke rozbittya na klasteri z vikidami Ob yekt mozhe ne nalezhati zhodnomu klasteru i rozglyadayetsya yak vikid Klasteri z peretinom Ob yekt mozhe nalezhati bilsh nizh odnomu klasteru Iyerarhichna klasterizaciya Yaksho ob yekt nalezhit nashadku to vin takozh nalezhit i predku Pidprostorova klasterizaciya Hoch klasteri i mozhut peretinatis prote v mezhah viznachenogo pidprostoru klasteri ne peretinayutsya Dlya prikladu divis en Vhidni daniTipi vhidnih danih Vhidnimi danimi klasternogo analizu ye nabir ob yektiv V zalezhnosti vid sposobu predstavlennya cih ob yektiv rozriznyayut taki tipi vhidnih danih Vektor harakteristik Kozhen ob yekt opisuyetsya naborom svoyih harakteristik ci harakteristiki mozhut buti chislovimi abo nechislovimi Kozhen ob yekt opisuyetsya vidstanyami do vsih inshih ob yektiv vibirki Vimogi do vhidnih danih Klasternij analiz visuvaye nastupni vimogi do danih Ob yekti ne povinni korelyuvati mizh soboyu Ob yekti mayut buti bezrozmirnimi Rozpodil ob yektiv maye buti blizkim do normalnogo Ob yekti povinni vidpovidati vimozi stijkosti pid yakoyu rozumiyetsya vidsutnist vplivu na yih znachennya vipadkovih chinnikiv Vibirka povinna buti odnoridna RezultatiPrichini neodnoznachnosti Rishennya zadachi klasterizaciyi principove neodnoznachne i comu ye dekilka prichin Ne isnuye odnoznachno yaknajkrashogo kriteriyu yakosti klasterizaciyi Vidomij cilij ryad evristichnih kriteriyiv a takozh ryad algoritmiv sho ne mayut chitko virazhenogo kriteriyu ale zdijsnyuyut dostatno rozumnu klasterizaciyu po pobudovi Vsi voni mozhut davati rizni rezultati Chislo klasteriv yak pravilo nevidome zazdalegid i vstanovlyuyetsya vidpovidno do deyakogo sub yektivnogo kriteriyu Rezultat klasterizaciyi istotno zalezhit vid metriki vibir yakoyi yak pravilo takozh sub yektivnij i viznachayetsya ekspertom Interpretaciya rezultativ Rezultatom klasterizaciyi ye grupi ob yektiv ob yednani za pevnoyu harakteristikoyu chi harakteristikami Odnak ci rezultati mozhut buti interpretovani po riznomu Zokrema pri analizi rezultativ sociologichnih doslidzhen rekomenduyetsya zdijsnyuvati analiz iyerarhichnimi metodami napriklad metodom Uorda pri yakomu vseredini klasteriv optimizuyetsya minimalna dispersiya i v rezultati stvoryuyutsya klasteri priblizno rivnih rozmiriv Yak mira vidminnosti mizh klasterami vikoristovuyetsya kvadratichna evklidova vidstan sho spriyaye zbilshennyu kontrastnosti klasteriv Teper vinikaye pitannya stijkosti znajdenogo klasternogo rishennya Po suti perevirka stijkosti klasterizaciyi zvoditsya do perevirki yiyi dostovirnosti Tut isnuye empirichne pravilo stijka tipologiya zberigayetsya pri zmini metodiv klasterizaciyi Rezultati iyerarhichnogo klasternogo analizu mozhna pereviryati iterativnim klasternim analizom metodom k serednih Yaksho pri porivnyanni grupi zbigayutsya bilshe nizh na 70 ponad 2 3 zbigiv to klasterne rishennya prijmayetsya Pereviriti adekvatnist rishennya ne vdayuchis do dopomogi inshih vidiv analizu ne mozhna Prinajmni v teoretichnomu plani cya problema ne virishena Deyaki dodatkovi metodi perevirki stijkosti vidkidayutsya z pevnih prichin ne rekomenduyetsya i obmezhena u vikoristanni Testi znachushosti dispersijnij analiz zavzhdi dayut znachushij rezultat Metod povtornih vipadkovih vibirok ne dovodit pravilnist rishennya Testi znachushosti dlya zovnishnih oznak pridatni tilki dlya povtornih vimiryuvan Metodi Monte Karlo duzhe skladni i dostupni tilki dosvidchenim matematikam Dotichni terminiKlasteruvannya ros klasterirovanie angl clustering metod obrobki danih sho polyagaye u vstanovlenni v pevnij sukupnosti za pevnim algoritmom chleniv yaki ye podibnimi Yakisni abo kilkisni kriteriyi podibnosti zadayutsya Shiroko vikoristovuyetsya v hemometrici kombinatornij himiyi pri obrobci himichnoyi ta biohimichnoyi informaciyi Div takozh1R algoritmPrimitkiBailey Ken 1994 Numerical Taxonomy and Cluster Analysis Typologies and Taxonomies s 34 ISBN 9780803952591 1939 Cluster Analysis Correlation Profile and Orthometric factor Analysis for the Isolation of Unities in Mind and Personality Edwards Brothers Cattell R B 1943 The description of personality Basic traits resolved into clusters Journal of Abnormal and Social Psychology 38 4 476 506 doi 10 1037 h0054116 Estivill Castro Vladimir 20 chervnya 2002 Why so many clustering algorithms A Position Paper ACM SIGKDD Explorations Newsletter 4 1 65 75 doi 10 1145 568574 568575 DzherelaJain Murty Flynn Data clustering a review ACM Comput Surv 31 3 1999 Zhuravlev Yu I Ryazanov V V Senko O V Raspoznavanie Matematicheskie metody Programmnaya sistema Prakticheskie primeneniya M Fazis 2006 ISBN 5 7036 0108 8 Zagorujko N G Prikladnye metody analiza dannyh i znanij Novosibirsk IM SO RAN 1999 ISBN 5 86134 060 9 Mandel I D Klasternyj analiz M Finansy i statistika 1988 ISBN 5 279 00050 7 Oldenderfer M S Bleshfild R K Klasternyj analiz Faktornyj diskriminantnyj i klasternyj analiz per s angl Pod red I S Enyukova M Finansy i statistika 1989 215 s Shumetov V G Shumetova L V Klasternyj analiz podhod s primeneniem EVM Orel OrelGTU 2000 118 s Glosarij terminiv z himiyi J Opejda O Shvajka In t fiziko organichnoyi himiyi ta vuglehimiyi im L M Litvinenka NAN Ukrayini Doneckij nacionalnij universitet Doneck Veber 2008 758 s ISBN 978 966 335 206 0 Tan Pang Ning Michael Steinbach Kumar Vipin 2005 PDF Introduction to Data Mining Addison Wesley ISBN 0 321 32136 7 Arhiv originalu PDF za 18 Zhovtnya 2018 Procitovano 3 Serpnya 2018 PosilannyaKlasternij analiz na finansovih rinkah 21 lyutogo 2017 u Wayback Machine V inshomu movnomu rozdili ye povnisha stattya Cluster analysis angl Vi mozhete dopomogti rozshirivshi potochnu stattyu za dopomogoyu perekladu z anglijskoyi listopad 2022 Divitis avtoperekladenu versiyu statti z movi anglijska Perekladach povinen rozumiti sho vidpovidalnist za kincevij vmist statti u Vikipediyi nese same avtor redaguvan Onlajn pereklad nadayetsya lishe yak korisnij instrument pereglyadu vmistu zrozumiloyu movoyu Ne vikoristovujte nevichitanij i nevidkorigovanij mashinnij pereklad u stattyah ukrayinskoyi Vikipediyi Mashinnij pereklad Google ye korisnoyu vidpravnoyu tochkoyu dlya perekladu ale perekladacham neobhidno vipravlyati pomilki ta pidtverdzhuvati tochnist perekladu a ne prosto skopiyuvati mashinnij pereklad do ukrayinskoyi Vikipediyi Ne perekladajte tekst yakij vidayetsya nedostovirnim abo neyakisnim Yaksho mozhlivo perevirte tekst za posilannyami podanimi v inshomovnij statti Dokladni rekomendaciyi div Vikipediya Pereklad