Було запропоновано статтю Розвідковий аналіз даних до цієї статті або розділу, але, можливо, це варто додатково . Пропозиція із серпня 2018. |
Розвідувальний аналіз займається попереднім експрес-аналізом даних шляхом їх перетворення та/або представлення у зручному вигляді: графічному, табличному, схем, діаграм і т.д.
Спостереження за однією змінною
Пробіт-графік
Будується таким чином: Нехай - клас розподілів типу зсув-масштабу, з базовою функцією . Спочатку по вибірці ,будується емпірична функція розподілу , а сама пробіт-функція:
а) Якщо пробіт-функція майже пряма, то гіпотеза про те, що функція спостерігається на даній величині типу зсув масштабу справедлива.
- ( В протилежному випадку гіпотеза несправедлива)
б) Якщо є кількість точок, що лежать осторонь усіх інших точок графіка, то спостерігаємо аномальне явище у вибірці.
Ймовірнісний графік
Ідея та ж сама, тільки зі спотвореною віссю y. Маємо множину , яку розтягують за правилом
Папір (декартова площина), де спотворюється масштаб, називають імовірнісним папером. Якщо за розподіл взяти нормальний розподіл, то такий папір називається нормальним імовірнісним папером.
Будуємо графік функції для спостереження величини .
Спотворений масштаб - смуга на , від 0 до 1. Розтягується на всю площину.
Отримуємо набір ймовірностей. Набір для класу розподілів
Звисні гістобари
Звисні гістобари - це один з графіків розвідувального аналізу, для перевірки гіпотези відповідності вибірки нормальному розподілу.
Нормальним розподілом найбільш узгодженим з даною вибіркою називається нормальний розподіл параметри (медіана та дисперсія) якого побудовані на базі вибірки.
Щоб побудувати графік висячих гістобар спочатку малюють нормальний розподіл найбільш узгоджений з даною вибіркою, потім проводять процедуру групування. Посередині кожного інтервалу за графік розподілу підвішують прямокутник, довжина якого пропорційна відносній частоті потрапляння значень в інтервал.
Якщо основи цих гістобар несуттєво відхиляється від осі OX, то гіпотеза про нормальність вибірки приймається. Інакше відхиляється.
Підвішена коренеграма
Для вибірки проводять групування, і для кожного інтервалу обчислюють величину
- ,
де - емпірична частота попадань в інтервал, а - теоретична частота обчислена згідно з узгодженим з вибіркою розподілом.
Нормальним розподілом найбільш узгодженим з даною вибіркою називається нормальний розподіл параметри (медіана та дисперсія) якого побудовані на базі вибірки.
Зображення «скринька з вусами»
Цей розділ потребує доповнення. (червень 2010) |
Зображення «стебло-листок»
Цей розділ потребує доповнення. (червень 2010) |
Випадок спостереження за двома змінними
Діаграма розсіювання
Всю площину розбивають на пікселі. І в залежності від того скільки значень потрапило всередину даного пікселя, кольору пікселя присвоюють яскравість чи насиченість.
Таблиця спряженості
Будується для двох випадкових змінних що приймають скінченне число значень. В першому рядку записують можливі значення першої змінної, в першому стовпцю - другої. І на перетині i-того рядка, та j-того стовпця записують скільки разів перша змінна прийняла і-те значення, одночасно з тим, як друга змінна прийняла j-те.
Це незавершена стаття з математики. Ви можете проєкту, виправивши або дописавши її. |
Посилання
Ця стаття не містить . (грудень 2016) |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Bulo zaproponovano priyednati stattyu Rozvidkovij analiz danih do ciyeyi statti abo rozdilu ale mozhlivo ce varto dodatkovo obgovoriti Propoziciya iz serpnya 2018 Rozviduvalnij analiz zajmayetsya poperednim ekspres analizom danih shlyahom yih peretvorennya ta abo predstavlennya u zruchnomu viglyadi grafichnomu tablichnomu shem diagram i t d Sposterezhennya za odniyeyu zminnoyuProbit grafik Buduyetsya takim chinom Nehaj F displaystyle mathfrak F klas rozpodiliv tipu zsuv masshtabu z bazovoyu funkciyeyu F 0 displaystyle F 0 cdot Spochatku po vibirci 3 x 1 x n displaystyle xi x 1 cdot x n buduyetsya empirichna funkciya rozpodilu F x displaystyle F x a sama probit funkciya y F 0 1 F x displaystyle y F 0 1 F x a Yaksho probit funkciya majzhe pryama to gipoteza pro te sho funkciya sposterigayetsya na danij velichini tipu zsuv masshtabu spravedliva H 0 F 3 F displaystyle H 0 F xi cdot in mathfrak F V protilezhnomu vipadku gipoteza nespravedliva b Yaksho ye kilkist tochok sho lezhat ostoron usih inshih tochok grafika to sposterigayemo anomalne yavishe u vibirci y F 0 1 F x F 0 1 F 3 x x b a b displaystyle y F 0 1 F x approx F 0 1 F xi x frac x b frac a b Jmovirnisnij grafik Ideya ta zh sama tilki zi spotvorenoyu vissyu y Mayemo mnozhinu x R y 0 1 displaystyle x in mathbb R y in 0 1 yaku roztyaguyut za pravilom x y x F 0 1 y displaystyle x y to x F 0 1 y Papir dekartova ploshina de spotvoryuyetsya masshtab nazivayut imovirnisnim paperom Yaksho za rozpodil vzyati normalnij rozpodil to takij papir nazivayetsya normalnim imovirnisnim paperom Buduyemo grafik funkciyi y F 3 x displaystyle y F xi x dlya sposterezhennya velichini 3 displaystyle xi Spotvorenij masshtab smuga na y displaystyle y vid 0 do 1 Roztyaguyetsya na vsyu ploshinu Otrimuyemo nabir jmovirnostej Nabir dlya klasu rozpodiliv Zvisni gistobari Zvisni gistobari ce odin z grafikiv rozviduvalnogo analizu dlya perevirki gipotezi vidpovidnosti vibirki normalnomu rozpodilu Normalnim rozpodilom najbilsh uzgodzhenim z danoyu vibirkoyu nazivayetsya normalnij rozpodil parametri mediana ta dispersiya yakogo pobudovani na bazi vibirki Shob pobuduvati grafik visyachih gistobar spochatku malyuyut normalnij rozpodil najbilsh uzgodzhenij z danoyu vibirkoyu potim provodyat proceduru grupuvannya Poseredini kozhnogo intervalu za grafik rozpodilu pidvishuyut pryamokutnik dovzhina yakogo proporcijna vidnosnij chastoti potraplyannya znachen v interval Yaksho osnovi cih gistobar nesuttyevo vidhilyayetsya vid osi OX to gipoteza pro normalnist vibirki prijmayetsya Inakshe vidhilyayetsya Pidvishena korenegrama Dlya vibirki provodyat grupuvannya i dlya kozhnogo intervalu obchislyuyut velichinu n e i n t i displaystyle sqrt nu e i sqrt nu tau i de n e i displaystyle nu e i empirichna chastota popadan v interval a n t i displaystyle nu tau i teoretichna chastota obchislena zgidno z uzgodzhenim z vibirkoyu rozpodilom Normalnim rozpodilom najbilsh uzgodzhenim z danoyu vibirkoyu nazivayetsya normalnij rozpodil parametri mediana ta dispersiya yakogo pobudovani na bazi vibirki Zobrazhennya skrinka z vusami Dokladnishe Diagrama skrinka z vusami Cej rozdil potrebuye dopovnennya cherven 2010 Zobrazhennya steblo listok Dokladnishe Diagrama stovbur listya Cej rozdil potrebuye dopovnennya cherven 2010 Vipadok sposterezhennya za dvoma zminnimiDiagrama rozsiyuvannya Dokladnishe Tochkova diagrama Vsyu ploshinu rozbivayut na pikseli I v zalezhnosti vid togo skilki znachen potrapilo vseredinu danogo pikselya koloru pikselya prisvoyuyut yaskravist chi nasichenist Tablicya spryazhenosti Buduyetsya dlya dvoh vipadkovih zminnih sho prijmayut skinchenne chislo znachen V pershomu ryadku zapisuyut mozhlivi znachennya pershoyi zminnoyi v pershomu stovpcyu drugoyi I na peretini i togo ryadka ta j togo stovpcya zapisuyut skilki raziv persha zminna prijnyala i te znachennya odnochasno z tim yak druga zminna prijnyala j te Ce nezavershena stattya z matematiki Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi PosilannyaCya stattya ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno gruden 2016