Корелограма
В аналізі даних корелограмою називається зображення статистики кореляції. Наприклад, в аналізі часових рядів, корелограма, також знана як автокореляційна діаграма, являє собою графік зразка автокореляцій , в порівнянні з , (часові затримки).
Якщо використовується взаємно-кореляційна функція, результат називають поперечною корелограмою. Корелограми є широко використовуваним інструментом для перевірки випадковості в наборі даних. Випадковість знаходиться шляхом обчислення автокореляції для значень даних при різних часових затримках. Якщо випадково, такі автокореляції будуть близькі до нуля для будь-яких і всіх розділень часових затримок. Якщо невипадкове, то один або більше з автокореляції буде істотно відмінна від нуля.
Крім того, корелограми використовують в для Box-Jenkins моделі авторегресії ковзного середнього часового ряду. Автокореляція повинна бути близькою до нуль-випадковості, якщо аналітик не перевіряє випадковість, то справедливість багатьох з статистичних висновків попадає під сумнів. Корелограми є чудовим способом перевірки такої випадковості.
Застосування
Корелограми допомагають знайти відповіді на такі питання:
- Чи дані насправді випадкові?
- Чи спостереження пов'язані з суміжними спостереженнями?
- Чи пов'язані спостереження з двічі зсунутим спостереженням?
- Чи є спостережуваний часовий ряд — білим шумом?
- Чи є спостережуваний часовий ряд — синусоїдою?
- Чи є спостережуваний часовий ряд — авторегресивним?
- Якою є модель, що підходить для спостереження за часовим рядом?
- Чи є модель : дійсною та достатньою?
- Чи є значення дійсним?
Значення
Випадковість (разом з фіксованою моделлю, фіксованими змінними та фіксованим розподілом) є одним з чотирьох припущень, які лежать в основі всіх процесів вимірювань. Припущення випадковості дуже важливе з таких причин:
- Більшість стандартних статистичних тестів залежать від випадковості. Валідність результатів тесту прямо пов'язане з тим, чи є дійсною припущена випадковість.
- Багато формул в статистиці залежать від випадковості припущення, найбільш поширеною є формула для визначення стандартного відхилення:
, Де S — це стандартне відхилення даних. Не зважаючи на те, що ця формула дуже поширення, її результати не мають цінності, якщо не триматися припущеної випадковості.
- Для одновимірних даних, за замовчуванням:
Якщо дані не є випадковими, ця модель — некоректна та не є дійсною, тому оцінки параметрів стають безглуздими.
Оцінка автокореляцій
Коефіцієнт автокореляції:
- ,
де ch — автоковаріаційна функція.
c0 — дисперсія функції
Отримане значення rh буде в діапазоні від −1 до 1.
Альтернативні оцінки
Інколи використовують наступну формулу для автоваріації функції:
Хоча це визначення має менший відхил, (1/N) має деякі бажані статистичні властивості. Цю формулу часто використовують в літературі про статистику.
Статистичні висновки
В один графік можна провести верхню та нижню межі для автокореляції за рівнем значущості: , з як передбачувана автокореляція для запізнення . Якщо автокореляція вище (нижче), ніж ця верхня (нижня) межа, то нульова гіпотеза, тобто що немає автокореляції в самій затримці та за її межами відкидається на рівні значущості. Цей тест є наближеним і припускає, що часовий ряд є гаусовим. У наведеній вище z1-α/2 квантиль нормального розподілу; SE — стандартна помилка, яка може бути обчислена за формулою Бартлетта:
- for
На картинці вище ми можемо відкинути нульову гіпотезу про те, що немає автокореляції між часовими точками, які є суміжними (запізнення = 1). Для інших періодів ніхто не може відкинути нульову гіпотезу про відсутність автокореляції.
Слід зазначити, що існують дві різні формули для генерації області впевненості:
1. Якщо корелограми використовується для перевірки випадковості (тобто не має часової залежності між даними), то краще використати наступну формулу: де N є розмір вибірки, Z є квантиль функція стандартного нормального розподілу і α є рівень значущості. У цьому випадку, довірчі інтервали мають фіксовану довжину, яка залежить від розміру вибірки.
2. Корелограми також використовуються на стадії ідентифікації моделі для установки моделей типу ARIMA. У цьому випадку модель ковзного середнього значення визначений для даних і наступні області впевненості повинні бути сформовані: де к-запізнення. У цьому випадку довірчі інтервали зростають в міру збільшення затримки.
Програмне забезпечення
Корелограми доступні у більшості статистичного програмного забезпечення загального призначення. Для створення такого типу графіка в R можна використовувати функції ACF і PACF.
Див. також
Ця стаття не містить . (грудень 2018) |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Korelograma Na malyunku grafik sho pokazuye 100 vipadkovih chisel z prihovanoyu funkciyeyu sinus avtokorelyaciya korelograma ryadiv na dni Priklad korelogrami V analizi danih korelogramoyu nazivayetsya zobrazhennya statistiki korelyaciyi Napriklad v analizi chasovih ryadiv korelograma takozh znana yak avtokorelyacijna diagrama yavlyaye soboyu grafik zrazka avtokorelyacij r h displaystyle r h v porivnyanni z h displaystyle h chasovi zatrimki Yaksho vikoristovuyetsya vzayemno korelyacijna funkciya rezultat nazivayut poperechnoyu korelogramoyu Korelogrami ye shiroko vikoristovuvanim instrumentom dlya perevirki vipadkovosti v nabori danih Vipadkovist znahoditsya shlyahom obchislennya avtokorelyaciyi dlya znachen danih pri riznih chasovih zatrimkah Yaksho vipadkovo taki avtokorelyaciyi budut blizki do nulya dlya bud yakih i vsih rozdilen chasovih zatrimok Yaksho nevipadkove to odin abo bilshe z avtokorelyaciyi bude istotno vidminna vid nulya Krim togo korelogrami vikoristovuyut v dlya Box Jenkins modeli avtoregresiyi kovznogo serednogo chasovogo ryadu Avtokorelyaciya povinna buti blizkoyu do nul vipadkovosti yaksho analitik ne pereviryaye vipadkovist to spravedlivist bagatoh z statistichnih visnovkiv popadaye pid sumniv Korelogrami ye chudovim sposobom perevirki takoyi vipadkovosti ZastosuvannyaKorelogrami dopomagayut znajti vidpovidi na taki pitannya Chi dani naspravdi vipadkovi Chi sposterezhennya pov yazani z sumizhnimi sposterezhennyami Chi pov yazani sposterezhennya z dvichi zsunutim sposterezhennyam Chi ye sposterezhuvanij chasovij ryad bilim shumom Chi ye sposterezhuvanij chasovij ryad sinusoyidoyu Chi ye sposterezhuvanij chasovij ryad avtoregresivnim Yakoyu ye model sho pidhodit dlya sposterezhennya za chasovim ryadom Chi ye model Y c o n s t a n t e r r o r displaystyle Y mathrm constant mathrm error dijsnoyu ta dostatnoyu Chi ye znachennya s Y s N displaystyle s bar Y s sqrt N dijsnim ZnachennyaVipadkovist razom z fiksovanoyu modellyu fiksovanimi zminnimi ta fiksovanim rozpodilom ye odnim z chotiroh pripushen yaki lezhat v osnovi vsih procesiv vimiryuvan Pripushennya vipadkovosti duzhe vazhlive z takih prichin Bilshist standartnih statistichnih testiv zalezhat vid vipadkovosti Validnist rezultativ testu pryamo pov yazane z tim chi ye dijsnoyu pripushena vipadkovist Bagato formul v statistici zalezhat vid vipadkovosti pripushennya najbilsh poshirenoyu ye formula dlya viznachennya standartnogo vidhilennya s Y s N displaystyle s bar Y s sqrt N De S ce standartne vidhilennya danih Ne zvazhayuchi na te sho cya formula duzhe poshirennya yiyi rezultati ne mayut cinnosti yaksho ne trimatisya pripushenoyi vipadkovosti Dlya odnovimirnih danih za zamovchuvannyam Y c o n s t a n t e r r o r displaystyle Y mathrm constant mathrm error Yaksho dani ne ye vipadkovimi cya model nekorektna ta ne ye dijsnoyu tomu ocinki parametriv stayut bezgluzdimi Ocinka avtokorelyacijKoeficiyent avtokorelyaciyi r h c h c 0 displaystyle r h c h c 0 de ch avtokovariacijna funkciya c h 1 N t 1 N h Y t Y Y t h Y displaystyle c h frac 1 N sum t 1 N h left Y t bar Y right left Y t h bar Y right c0 dispersiya funkciyi c 0 1 N t 1 N Y t Y 2 displaystyle c 0 frac 1 N sum t 1 N left Y t bar Y right 2 Otrimane znachennya rh bude v diapazoni vid 1 do 1 Alternativni ocinkiInkoli vikoristovuyut nastupnu formulu dlya avtovariaciyi funkciyi c h 1 N h t 1 N h Y t Y Y t h Y displaystyle c h frac 1 N h sum t 1 N h left Y t bar Y right left Y t h bar Y right Hocha ce viznachennya maye menshij vidhil 1 N maye deyaki bazhani statistichni vlastivosti Cyu formulu chasto vikoristovuyut v literaturi pro statistiku Statistichni visnovkiV odin grafik mozhna provesti verhnyu ta nizhnyu mezhi dlya avtokorelyaciyi za rivnem znachushosti B z 1 a 2 S E r h displaystyle B pm z 1 alpha 2 SE r h z r h displaystyle r h yak peredbachuvana avtokorelyaciya dlya zapiznennya h displaystyle h Yaksho avtokorelyaciya vishe nizhche nizh cya verhnya nizhnya mezha to nulova gipoteza tobto sho nemaye avtokorelyaciyi v samij zatrimci ta za yiyi mezhami vidkidayetsya na rivni znachushosti Cej test ye nablizhenim i pripuskaye sho chasovij ryad ye gausovim U navedenij vishe z1 a 2 kvantil normalnogo rozpodilu SE standartna pomilka yaka mozhe buti obchislena za formuloyu Bartletta S E r 1 1 N displaystyle SE r 1 frac 1 sqrt N S E r h 1 2 i 1 h 1 r i 2 N displaystyle SE r h sqrt frac 1 2 sum i 1 h 1 r i 2 N for h gt 1 displaystyle h gt 1 Na kartinci vishe mi mozhemo vidkinuti nulovu gipotezu pro te sho nemaye avtokorelyaciyi mizh chasovimi tochkami yaki ye sumizhnimi zapiznennya 1 Dlya inshih periodiv nihto ne mozhe vidkinuti nulovu gipotezu pro vidsutnist avtokorelyaciyi Slid zaznachiti sho isnuyut dvi rizni formuli dlya generaciyi oblasti vpevnenosti 1 Yaksho korelogrami vikoristovuyetsya dlya perevirki vipadkovosti tobto ne maye chasovoyi zalezhnosti mizh danimi to krashe vikoristati nastupnu formulu z 1 a 2 N displaystyle pm frac z 1 alpha 2 sqrt N de N ye rozmir vibirki Z ye kvantil funkciya standartnogo normalnogo rozpodilu i a ye riven znachushosti U comu vipadku dovirchi intervali mayut fiksovanu dovzhinu yaka zalezhit vid rozmiru vibirki 2 Korelogrami takozh vikoristovuyutsya na stadiyi identifikaciyi modeli dlya ustanovki modelej tipu ARIMA U comu vipadku model kovznogo serednogo znachennya viznachenij dlya danih i nastupni oblasti vpevnenosti povinni buti sformovani z 1 a 2 1 N 1 2 i 1 k y i 2 displaystyle pm z 1 alpha 2 sqrt frac 1 N left 1 2 sum i 1 k y i 2 right de k zapiznennya U comu vipadku dovirchi intervali zrostayut v miru zbilshennya zatrimki Programne zabezpechennyaKorelogrami dostupni u bilshosti statistichnogo programnogo zabezpechennya zagalnogo priznachennya Dlya stvorennya takogo tipu grafika v R mozhna vikoristovuvati funkciyi ACF i PACF Div takozhKorelometr Cya stattya ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno gruden 2018