Було запропоновано цю статтю або розділ до Розвідувальний аналіз, але, можливо, це варто додатково . Пропозиція з липня 2018. |
Розвідковий аналіз даних (РАД) (англ. Exploratory data analysis - EDA) — попередній аналіз даних з метою виявлення найзагальніших закономірностей та тенденцій, характеру та властивостей даних аналізу, законів розподілу величин, які аналізуються.
РАД використовується для знаходження зв'язків між змінними в ситуаціях, коли відсутні (або недостатні) апріорні уявлення щодо природи цих зв'язків. Як правило, при розвідковому аналізі враховується та порівнюється велика кількість змінних, а для пошуку закономірностей використовуються значна кількість методів.
Термін «розвідковий аналіз» був введений математиком з Принстонського університету Дж. Тьюкі.
Цілі РАД
Основні цілі розвідкового аналізу:
- максимальне «проникнення» в дані
- виявлення основних структур
- вибір найвагоміших змінних
- виявлення відхилень та аномалій
- перевірка основних гіпотез (припущень)
- розробка початкових моделей
Методи РАД
До основних методів розвідкового аналізу даних відносять:
- кластерний аналіз
- факторний аналіз
- аналіз дискримінантних функцій
- багатомірне шкалювання
- логлінійний аналіз
- канонічні кореляції
- покрокова лінійна та нелінійна регресія
- аналіз відповідностей
- аналіз часових рядів
- дерева класифікації
Перевірка результатів РАД
Попереднє дослідження даних може бути лише першим етапом їх аналізу, і поки результати не будуть підтверджені на інших вибірках або на незалежній множині даних, їх слід сприймати щонайбільше як гіпотезу. Якщо результати розвідкового аналізу свідчать на користь певної моделі, то її справедливість можна потім перевірити, застосувавши її до нових даних.
Результати розвідкового аналізу не використовуються для вироблення управлінських рішень. Їхнє призначення — допомога в розробці найкращої стратегії поглибленого аналізу, висування гіпотез, уточнення особливостей застосування тих чи інших математичних методів та моделей.
Посилання
- сайт OLAP-ru[недоступне посилання з липня 2019]
- сайт компанії BaseGroup Labs [ 14 вересня 2011 у Wayback Machine.]
- сайт компанії StatSoft [ 20 липня 2017 у Wayback Machine.]
Джерела
- Тьюки Д. Анализ результатов наблюдений. Разведочный анализ, М.: Мир, 1981.-697 с.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Bulo zaproponovano priyednati cyu stattyu abo rozdil do Rozviduvalnij analiz ale mozhlivo ce varto dodatkovo Propoziciya z lipnya 2018 Rozvidkovij analiz danih RAD angl Exploratory data analysis EDA poperednij analiz danih z metoyu viyavlennya najzagalnishih zakonomirnostej ta tendencij harakteru ta vlastivostej danih analizu zakoniv rozpodilu velichin yaki analizuyutsya RAD vikoristovuyetsya dlya znahodzhennya zv yazkiv mizh zminnimi v situaciyah koli vidsutni abo nedostatni apriorni uyavlennya shodo prirodi cih zv yazkiv Yak pravilo pri rozvidkovomu analizi vrahovuyetsya ta porivnyuyetsya velika kilkist zminnih a dlya poshuku zakonomirnostej vikoristovuyutsya znachna kilkist metodiv Termin rozvidkovij analiz buv vvedenij matematikom z Prinstonskogo universitetu Dzh Tyuki Cili RADOsnovni cili rozvidkovogo analizu maksimalne proniknennya v dani viyavlennya osnovnih struktur vibir najvagomishih zminnih viyavlennya vidhilen ta anomalij perevirka osnovnih gipotez pripushen rozrobka pochatkovih modelejMetodi RADDo osnovnih metodiv rozvidkovogo analizu danih vidnosyat klasternij analiz faktornij analiz analiz diskriminantnih funkcij bagatomirne shkalyuvannya loglinijnij analiz kanonichni korelyaciyi pokrokova linijna ta nelinijna regresiya analiz vidpovidnostej analiz chasovih ryadiv dereva klasifikaciyiPerevirka rezultativ RADPoperednye doslidzhennya danih mozhe buti lishe pershim etapom yih analizu i poki rezultati ne budut pidtverdzheni na inshih vibirkah abo na nezalezhnij mnozhini danih yih slid sprijmati shonajbilshe yak gipotezu Yaksho rezultati rozvidkovogo analizu svidchat na korist pevnoyi modeli to yiyi spravedlivist mozhna potim pereviriti zastosuvavshi yiyi do novih danih Rezultati rozvidkovogo analizu ne vikoristovuyutsya dlya viroblennya upravlinskih rishen Yihnye priznachennya dopomoga v rozrobci najkrashoyi strategiyi pogliblenogo analizu visuvannya gipotez utochnennya osoblivostej zastosuvannya tih chi inshih matematichnih metodiv ta modelej Posilannyasajt OLAP ru nedostupne posilannya z lipnya 2019 sajt kompaniyi BaseGroup Labs 14 veresnya 2011 u Wayback Machine sajt kompaniyi StatSoft 20 lipnya 2017 u Wayback Machine DzherelaTyuki D Analiz rezultatov nablyudenij Razvedochnyj analiz M Mir 1981 697 s