У статистиці середньоквадрати́чна по́хибка, сере́дня квадрати́чна по́хибка (СКП, англ. mean squared error, MSE) або середньоквадрати́чне відхи́лення, сере́днє квадрати́чне відхи́лення (СКВ, англ. mean squared deviation, MSD) оцінювача (процедури оцінювання неспостережуваної величини) вимірює усереднення квадратів похибок — тобто, середнє квадратичної різниці між оцінками значень та справжнім значенням. СКП є функцією ризику, яка відповідає математичному сподіванню квадрату похибкових втрат.[][: ком.] Той факт, що СКП є майже завжди строго додатною (а не нульовою), випливає з випадковості, або з того, що оцінювач [en], яка могла би давати точнішу оцінку.
СКП є мірою якості оцінювача. Оскільки вона походить від квадрата евклідової відстані, її значення є завжди додатним, і зменшується, коли похибка наближається до нуля.
СКП є другим моментом похибки (відносно оригіналу),[: ком.] і, таким чином, охоплює як дисперсію оцінювача (наскільки широким є розкид оцінок від одного зразка даних до іншого), так і його зміщення (наскільки віддаленим є усереднене оцінене значення від істинного).[] Для незміщеного оцінювача СКП є його дисперсією. Як і дисперсія, СКП має ті ж одиниці вимірювання, що й квадрат оцінюваної величини. За аналогією зі стандартним відхиленням, взяття квадратного кореня СКП дає кореневу середньоквадратичну похибку, або [en] (КСКП або КСКВ, англ. RMSE, RMSD), що має ті ж одиниці вимірювання, що й оцінювана величина. Для незміщеного оцінювача КСКП є квадратним коренем дисперсії, відомим як стандартна похибка.
Визначення та основні властивості
СКП оцінює якість або передбачувача (тобто функції, що відображує довільні входи до вибірки значень деякої випадкової величини), або оцінювача (тобто математичної функції, що відображує вибірку даних до оцінки параметра сукупності, з якої відбираються ці дані). Визначення СКП різниться залежно від того, чи вона описує передбачувач, чи оцінювач.
Передбачувач
Якщо вектор з передбачень породжується з вибірки точок даних на всіх змінних, є вектором спостережуваних значень передбачуваної змінної, а є передбаченими значеннями (наприклад, як із допасовування найменшими квадратами), тоді СКП цього передбачувача в межах цієї вибірки обчислюється як
Іншими словами, СКП є середнім значенням квадратів похибок . Це є легко обчислюваною величиною для конкретної вибірки (й отже, залежить від вибірки).
У матрицевому записі
де є , а є матрицею .
СКП також можливо обчислювати на q точках даних, які не використовували для оцінювання моделі, чи то через те, що їх було притримано для цієї мети, чи то через те, що ці дані було отримано щойно. У цьому процесі (відомому як перехресне затверджування) СКП часто називають [en][], й обчислюють як
Оцінювач
СКП оцінювача відносно невідомого параметра визначають як
Це визначення залежить від невідомого параметра, але СКП апріорі є властивістю оцінювача. СКП може бути функцією від невідомих параметрів, і в цьому випадку будь-який оцінювач СКП на основі оцінок цих параметрів буде функцією від даних (і відтак випадковою величиною). Якщо оцінювач виводять як статистику вибірки й використовують для оцінювання якогось параметра сукупності, тоді математичне сподівання стосується ви́біркового розподілу цієї статистики вибірки.
СКП можливо записувати як суму дисперсії оцінювача та квадрату його зміщення, що забезпечує корисний спосіб обчислювання СКП й виражає те, що у випадку незміщених оцінювачів СКП та дисперсія дорівнюють одна одній.
Доведення взаємозв'язку з дисперсією та зміщенням
Як альтернативний варіант, маємо
Але у випадку реального моделювання, СКП можливо описувати як суму дисперсії моделі, зміщення моделі, та незвідної невизначеності[][: ком.]. Відповідно до цього взаємозв'язку, СКП оцінювачів можливо просто використовувати для порівнювання [en], що враховує інформацію про дисперсію та зміщення оцінювача. Це називають критерієм СКП (англ. MSE criterion).
У регресії
Детальніші відомості з цієї теми ви можете знайти в статті [en].
В регресійному аналізі природнішим способом перегляду загальної тенденції даних у цілому є побудова графіків. Середнє значення відстані від кожної з точок до передбачуваної регресійної моделі можливо обчислювати й показувати як середньоквадратичну похибку. Піднесення до квадрату має вирішальне значення для подолання складності з від'ємними знаками. Для мінімізування СКП модель може бути точнішою, що означатиме, що модель є ближчою до фактичних даних. Одним із прикладів лінійної регресії з використанням цього методу є метод найменших квадратів, який оцінює адекватність моделі лінійної регресії для моделювання [en], але обмеження якого пов'язане з відомим розподілом цих даних.
Термін середньоквадратична похибка іноді використовують як позначення незміщеної оцінки дисперсії похибок: [en], поділеної на кількість ступенів вільності. Це визначення для відомої, обчислюваної величини відрізняється від наведеного вище визначення для обчислюваної СКП передбачувача використанням іншого знаменника. Цим знаменником є розмір вибірки, зменшений на кількість параметрів моделі, оцінюваних з тих самих даних, (n − p) для p регресорів, або (n − p − 1), якщо використовують [en] (докладніше див. похибки та залишки у статистиці). Незважаючи на те, що СКП (визначене як у цій статті) не є незміщеним оцінювачем дисперсії похибок, вона є слушним оцінювачем за умови слушності передбачувача.
У регресійнім аналізі «середньоквадратична похибка», яку часто називають [en] або «позави́бірковою середньоквадратичною похибкою» (англ. out-of-sample mean squared error), може також позначувати середнє значення [en] передбачень від істинних значень на позавибірковому випробувальному просторі, породженому моделлю, оціненою за певним ви́бірковим простором. Вона також є відомою, обчислюваною величиною, і вона різниться залежно від вибірки та позавибіркового випробувального простору.
Приклади
Середнє значення
Нехай є випадкова вибірка розміру з генеральної сукупності, . Нехай зразки вибірки було вибрано [en]. Тобто, зразків вибирають по одному, і раніше вибрані зразки все одно мають право бути вибраними для всіх витягувань. Звичайним оцінювачем для є ви́біркове середнє
яке має математичне сподівання, що дорівнює істинному середньому (тож воно є незміщеним), і середньоквадратичну похибку
де є дисперсією сукупності.
Це є [en] (тобто тим, що має найнижчу СКП серед усіх незміщених оцінювачів) для гауссового розподілу, але не для, скажімо, рівномірного розподілу.
Дисперсія
Звичайним оцінювачем дисперсії є виправлена дисперсія вибірки:
Він є незміщеним (його математичним сподіванням є ), й відтак його також називають незміщеною дисперсією вибірки, а його СКП становить
де є четвертим центральним моментом розподілу або сукупності, а є коефіцієнтом ексцесу.
Проте можливо використовувати й інші оцінювачі для , пропорційні , і належний вибір може завжди давати нижчу середньоквадратичну похибку. Якщо ми визначимо
тоді обчислюємо:
Це мінімізується, коли
Для гауссового розподілу, де , це означає, що СКП зводиться до мінімуму при діленні суми на . Мінімальний коефіцієнт ексцесу становить , що досягається розподілом Бернуллі з p = 1/2 (підкидання монети), й СКП зводиться до мінімуму при Отже, незалежно від коефіцієнту ексцесу, ми отримуємо «кращу» оцінку (в сенсі нижчої СКП), трохи зменшивши незміщений оцінювач. Це є простим прикладом [en]: оцінювач «стискають» у бік нуля (зменшують незміщений оцінювач).
Далі, хоч виправлена дисперсія вибірки і є [en] (мінімальна середньоквадратична похибка серед незміщених оцінювачів) дисперсії для гауссових розподілів, якщо розподіл не є гауссовим, то навіть серед незміщених оцінювачів найкращим незміщеним оцінювачем дисперсії бути не може.
Гауссів розподіл
В наступній таблиці наведено декілька оцінювачів істинних параметрів сукупності, μ та σ2, для гауссового випадку.
Істинне значення | Оцінювач | Середньоквадратична похибка |
---|---|---|
= незміщений оцінювач середнього значення сукупності, | ||
= незміщений оцінювач дисперсії сукупності, | ||
= зміщений оцінювач дисперсії сукупності, | ||
= зміщений оцінювач дисперсії сукупності, |
Інтерпретація
Нульова СКП, що означає, що оцінювач передбачує спостереження параметру з бездоганною точністю, є ідеальною (але зазвичай неможливою).
Значення СКП можна використовувати з метою порівнювання. Дві або більше статистичних моделей можна порівнювати, використовуючи їхні СКП — як міру того, наскільки добре вони пояснюють заданий набір спостережень: незміщений оцінювач (оцінений зі статистичної моделі) з найменшою дисперсією серед усіх незміщених оцінювачів є [en], або англ. MVUE (Minimum Variance Unbiased Estimator).
Як методика лінійної регресії, так і методика дисперсійного аналізу оцінюють СКП як частину аналізу й використовують оцінену СКП, щоби визначати статистичну значущість досліджуваних чинників або предикторів. Метою планування експериментів є побудова експериментів таким чином, щоби при аналізі спостережень СКП була близькою до нуля відносно величини щонайменше одного з оцінюваних впливів експерименту.
В однофакторнім дисперсійнім аналізі СКП можливо обчислювати шляхом ділення суми квадратів похибок на ступінь вільності. Також, F-значення є відношенням середньоквадратичного впливу до СКП.
СКП також використовують у декількох методиках [en] як частину визначання того, скільки предикторів з набору кандидатів включити до моделі для заданого набору спостережень.
Застосування
Ця стаття має вигляд переліку, який краще подати . (липень 2021) |
- Зведення СКП до мінімуму є ключовим критерієм обирання оцінювачів, див. [en]. Серед незміщених оцінювачів зведення СКП до мінімуму еквівалентне зведенню до мінімуму дисперсії, а оцінювач, який робить це, є [en]. Проте зміщений оцінювач може мати нижчу СКП, див. зміщення оцінювача.
- У статистичному моделюванні СКП може подавати різницю між фактичними спостереженнями та значеннями спостережень, передбаченими моделлю. У цьому контексті її використовують для того, щоб визначати, наскільки модель допасовано до даних, а також чи можливо вилучити деякі пояснювальні змінні без значної шкоди для передбачувальної здатності моделі.
- [en] у прогнозуванні та передбачуванні є мірою [en], що ґрунтується на СКП.
Функція втрат
Втрати квадрату похибки є однією з найширше використовуваних функцій втрат у статистиці[], хоча її широке використання більше випливає з математичної зручності, ніж з міркувань фактичних втрат у застосуваннях. Карл Фрідріх Гаусс, який запровадив використання середньоквадратичної похибки, усвідомлював її довільність і погоджувався з запереченнями проти неї на цих підставах. Математичні переваги середньоквадратичної похибки особливо очевидні при її використанні для аналізу продуктивності лінійної регресії, оскільки це дозволяє розділити дисперсію в наборі даних на дисперсію, що пояснюється моделлю, та дисперсію, що пояснюється випадковістю.
Критика
Беззаперечне використання середньоквадратичної похибки критикував фахівець із теорії рішень [en]. Середньоквадратична похибка — це мінус математичного сподівання однієї конкретної функції корисності, квадратичної, яка може не бути слушною функцією корисності для використання за заданої сукупності обставин. Проте існують деякі сценарії, за яких середньоквадратична похибка може слугувати добрим наближенням функції втрат, що зустрічається у застосуванні природним чином.
Як і дисперсія, середньоквадратична похибка має недолік надавання великої ваги викидам. Це є результатом піднесенням до квадрату кожного члену, через яке більші похибки заважують сильніше за менші. Ця властивість, небажана у багатьох застосуваннях, змусила дослідників використовувати такі альтернативи як [en], або такі, що ґрунтуються на медіані.
Див. також
- [en]
- Компроміс зміщення та дисперсії
- [en]
- [en]
- [en]
- [en]
- Перенавчання
- Пікове відношення сигналу до шуму
- [en]
- [en]
- [en]
- [en]
Виноски
- Це можливо довести за допомогою нерівності Єнсена наступним чином. Четвертий центральний момент є верхньою межею для квадрату дисперсії, тож найменшим значенням для їхнього відношення є одиниця, відтак, найменшим значенням для коефіцієнта ексцесу є −2, отримуваним, наприклад, Бернуллі з p = 1/2.
Примітки
- . Math Vault (амер.). 26 квітня 2020. Архів оригіналу за 18 серпня 2020. Процитовано 12 вересня 2020. (англ.)
- . www.probabilitycourse.com. Архів оригіналу за 6 травня 2021. Процитовано 12 вересня 2020. (англ.)
- Lehmann, E. L.; Casella, George (1998). Theory of Point Estimation (вид. 2nd). New York: Springer. ISBN . MR 1639875. (англ.)
- Wackerly, Dennis; Mendenhall, William; Scheaffer, Richard L. (2008). Mathematical Statistics with Applications (вид. 7). Belmont, CA, USA: Thomson Higher Education. ISBN . (англ.)
- A modern introduction to probability and statistics : understanding why and how. London: Springer. 2005. ISBN . OCLC 262680588. (англ.)
- Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., [en], 1960, page 288. (англ.)
- Mood, A.; Graybill, F.; Boes, D. (1974). Introduction to the Theory of Statistics (вид. 3rd). McGraw-Hill. с. 229. (англ.)
- (1980). Probability and Statistics (вид. 2nd). Addison-Wesley. (англ.)
- (1985). 2.4.2 Certain Standard Loss Functions. Statistical Decision Theory and Bayesian Analysis (вид. 2nd). New York: Springer-Verlag. с. 60. ISBN . MR 0804611. (англ.)
- Bermejo, Sergio; Cabestany, Joan (2001). Oriented principal component analysis for large margin classifiers. Neural Networks. 14 (10): 1447—1461. doi:10.1016/S0893-6080(01)00106-X. PMID 11771723. (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Zapit Serednokvadratichne vidhilennya perenapravlyaye syudi Ne slid plutati z U statistici serednokvadrati chna po hibka sere dnya kvadrati chna po hibka SKP angl mean squared error MSE abo serednokvadrati chne vidhi lennya sere dnye kvadrati chne vidhi lennya SKV angl mean squared deviation MSD ocinyuvacha proceduri ocinyuvannya nesposterezhuvanoyi velichini vimiryuye userednennya kvadrativ pohibok tobto serednye kvadratichnoyi riznici mizh ocinkami znachen ta spravzhnim znachennyam SKP ye funkciyeyu riziku yaka vidpovidaye matematichnomu spodivannyu kvadratu pohibkovih vtrat na chiyu dumku proyasniti kom Toj fakt sho SKP ye majzhe zavzhdi strogo dodatnoyu a ne nulovoyu viplivaye z vipadkovosti abo z togo sho ocinyuvach en yaka mogla bi davati tochnishu ocinku SKP ye miroyu yakosti ocinyuvacha Oskilki vona pohodit vid kvadrata evklidovoyi vidstani yiyi znachennya ye zavzhdi dodatnim i zmenshuyetsya koli pohibka nablizhayetsya do nulya SKP ye drugim momentom pohibki vidnosno originalu proyasniti kom i takim chinom ohoplyuye yak dispersiyu ocinyuvacha naskilki shirokim ye rozkid ocinok vid odnogo zrazka danih do inshogo tak i jogo zmishennya naskilki viddalenim ye userednene ocinene znachennya vid istinnogo dzherelo Dlya nezmishenogo ocinyuvacha SKP ye jogo dispersiyeyu Yak i dispersiya SKP maye ti zh odinici vimiryuvannya sho j kvadrat ocinyuvanoyi velichini Za analogiyeyu zi standartnim vidhilennyam vzyattya kvadratnogo korenya SKP daye korenevu serednokvadratichnu pohibku abo en KSKP abo KSKV angl RMSE RMSD sho maye ti zh odinici vimiryuvannya sho j ocinyuvana velichina Dlya nezmishenogo ocinyuvacha KSKP ye kvadratnim korenem dispersiyi vidomim yak standartna pohibka Viznachennya ta osnovni vlastivostiSKP ocinyuye yakist abo peredbachuvacha tobto funkciyi sho vidobrazhuye dovilni vhodi do vibirki znachen deyakoyi vipadkovoyi velichini abo ocinyuvacha tobto matematichnoyi funkciyi sho vidobrazhuye vibirku danih do ocinki parametra sukupnosti z yakoyi vidbirayutsya ci dani Viznachennya SKP riznitsya zalezhno vid togo chi vona opisuye peredbachuvach chi ocinyuvach Peredbachuvach Yaksho vektor z n displaystyle n peredbachen porodzhuyetsya z vibirki n displaystyle n tochok danih na vsih zminnih Y displaystyle Y ye vektorom sposterezhuvanih znachen peredbachuvanoyi zminnoyi a Y displaystyle hat Y ye peredbachenimi znachennyami napriklad yak iz dopasovuvannya najmenshimi kvadratami todi SKP cogo peredbachuvacha v mezhah ciyeyi vibirki obchislyuyetsya yak MSE 1 n i 1 n Y i Y i 2 displaystyle operatorname MSE frac 1 n sum i 1 n Y i hat Y i 2 Inshimi slovami SKP ye serednim znachennyam 1 n i 1 n textstyle left frac 1 n sum i 1 n right kvadrativ pohibok Y i Y i 2 displaystyle left Y i hat Y i right 2 Ce ye legko obchislyuvanoyu velichinoyu dlya konkretnoyi vibirki j otzhe zalezhit vid vibirki U matricevomu zapisi MSE 1 n i 1 n e i 2 1 n e T e displaystyle operatorname MSE frac 1 n sum i 1 n e i 2 frac 1 n mathbf e mathsf T mathbf e de e i displaystyle e i ye Y i Y i displaystyle Y i hat Y i a e displaystyle mathbf e ye matriceyu n 1 displaystyle n times 1 SKP takozh mozhlivo obchislyuvati na q tochkah danih yaki ne vikoristovuvali dlya ocinyuvannya modeli chi to cherez te sho yih bulo pritrimano dlya ciyeyi meti chi to cherez te sho ci dani bulo otrimano shojno U comu procesi vidomomu yak perehresne zatverdzhuvannya SKP chasto nazivayut en dzherelo j obchislyuyut yak MSPE 1 q i n 1 n q Y i Y i 2 displaystyle operatorname MSPE frac 1 q sum i n 1 n q left Y i hat Y i right 2 Ocinyuvach SKP ocinyuvacha 8 displaystyle hat theta vidnosno nevidomogo parametra 8 displaystyle theta viznachayut yak MSE 8 E 8 8 8 2 displaystyle operatorname MSE hat theta operatorname E theta left hat theta theta 2 right Ce viznachennya zalezhit vid nevidomogo parametra ale SKP apriori ye vlastivistyu ocinyuvacha SKP mozhe buti funkciyeyu vid nevidomih parametriv i v comu vipadku bud yakij ocinyuvach SKP na osnovi ocinok cih parametriv bude funkciyeyu vid danih i vidtak vipadkovoyu velichinoyu Yaksho ocinyuvach 8 displaystyle hat theta vivodyat yak statistiku vibirki j vikoristovuyut dlya ocinyuvannya yakogos parametra sukupnosti todi matematichne spodivannya stosuyetsya vi birkovogo rozpodilu ciyeyi statistiki vibirki SKP mozhlivo zapisuvati yak sumu dispersiyi ocinyuvacha ta kvadratu jogo zmishennya sho zabezpechuye korisnij sposib obchislyuvannya SKP j virazhaye te sho u vipadku nezmishenih ocinyuvachiv SKP ta dispersiya dorivnyuyut odna odnij MSE 8 Var 8 8 Bias 8 8 2 displaystyle operatorname MSE hat theta operatorname Var theta hat theta operatorname Bias hat theta theta 2 Dovedennya vzayemozv yazku z dispersiyeyu ta zmishennyam MSE 8 E 8 8 8 2 E 8 8 E 8 8 E 8 8 8 2 E 8 8 E 8 8 2 2 8 E 8 8 E 8 8 8 E 8 8 8 2 E 8 8 E 8 8 2 E 8 2 8 E 8 8 E 8 8 8 E 8 E 8 8 8 2 E 8 8 E 8 8 2 2 E 8 8 8 E 8 8 E 8 8 E 8 8 8 2 E 8 8 8 const E 8 8 E 8 8 2 2 E 8 8 8 E 8 8 E 8 8 E 8 8 8 2 E 8 8 const E 8 8 E 8 8 2 E 8 8 8 2 Var 8 8 Bias 8 8 8 2 displaystyle begin aligned operatorname MSE hat theta amp operatorname E theta left hat theta theta 2 right amp operatorname E theta left left hat theta operatorname E theta hat theta operatorname E theta hat theta theta right 2 right amp operatorname E theta left left hat theta operatorname E theta hat theta right 2 2 left hat theta operatorname E theta hat theta right left operatorname E theta hat theta theta right left operatorname E theta hat theta theta right 2 right amp operatorname E theta left left hat theta operatorname E theta hat theta right 2 right operatorname E theta left 2 left hat theta operatorname E theta hat theta right left operatorname E theta hat theta theta right right operatorname E theta left left operatorname E theta hat theta theta right 2 right amp operatorname E theta left left hat theta operatorname E theta hat theta right 2 right 2 left operatorname E theta hat theta theta right operatorname E theta left hat theta operatorname E theta hat theta right left operatorname E theta hat theta theta right 2 amp amp operatorname E theta hat theta theta text const amp operatorname E theta left left hat theta operatorname E theta hat theta right 2 right 2 left operatorname E theta hat theta theta right left operatorname E theta hat theta operatorname E theta hat theta right left operatorname E theta hat theta theta right 2 amp amp operatorname E theta hat theta text const amp operatorname E theta left left hat theta operatorname E theta hat theta right 2 right left operatorname E theta hat theta theta right 2 amp operatorname Var theta hat theta operatorname Bias theta hat theta theta 2 end aligned Yak alternativnij variant mayemo E 8 8 2 E 8 2 E 8 2 2 8 E 8 Var 8 E 8 2 8 2 2 8 E 8 Var 8 E 8 8 2 Var 8 Bias 2 8 displaystyle begin aligned mathbb E theta hat theta 2 amp mathbb E hat theta 2 mathbb E theta 2 2 theta mathbb E hat theta amp operatorname Var hat theta mathbb E hat theta 2 theta 2 2 theta mathbb E hat theta amp operatorname Var hat theta mathbb E hat theta theta 2 amp operatorname Var hat theta operatorname Bias 2 hat theta end aligned Ale u vipadku realnogo modelyuvannya SKP mozhlivo opisuvati yak sumu dispersiyi modeli zmishennya modeli ta nezvidnoyi neviznachenosti dzherelo proyasniti kom Vidpovidno do cogo vzayemozv yazku SKP ocinyuvachiv mozhlivo prosto vikoristovuvati dlya porivnyuvannya en sho vrahovuye informaciyu pro dispersiyu ta zmishennya ocinyuvacha Ce nazivayut kriteriyem SKP angl MSE criterion U regresiyiDetalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en V regresijnomu analizi prirodnishim sposobom pereglyadu zagalnoyi tendenciyi danih u cilomu ye pobudova grafikiv Serednye znachennya vidstani vid kozhnoyi z tochok do peredbachuvanoyi regresijnoyi modeli mozhlivo obchislyuvati j pokazuvati yak serednokvadratichnu pohibku Pidnesennya do kvadratu maye virishalne znachennya dlya podolannya skladnosti z vid yemnimi znakami Dlya minimizuvannya SKP model mozhe buti tochnishoyu sho oznachatime sho model ye blizhchoyu do faktichnih danih Odnim iz prikladiv linijnoyi regresiyi z vikoristannyam cogo metodu ye metod najmenshih kvadrativ yakij ocinyuye adekvatnist modeli linijnoyi regresiyi dlya modelyuvannya en ale obmezhennya yakogo pov yazane z vidomim rozpodilom cih danih Termin serednokvadratichna pohibka inodi vikoristovuyut yak poznachennya nezmishenoyi ocinki dispersiyi pohibok en podilenoyi na kilkist stupeniv vilnosti Ce viznachennya dlya vidomoyi obchislyuvanoyi velichini vidriznyayetsya vid navedenogo vishe viznachennya dlya obchislyuvanoyi SKP peredbachuvacha vikoristannyam inshogo znamennika Cim znamennikom ye rozmir vibirki zmenshenij na kilkist parametriv modeli ocinyuvanih z tih samih danih n p dlya p regresoriv abo n p 1 yaksho vikoristovuyut en dokladnishe div pohibki ta zalishki u statistici Nezvazhayuchi na te sho SKP viznachene yak u cij statti ne ye nezmishenim ocinyuvachem dispersiyi pohibok vona ye slushnim ocinyuvachem za umovi slushnosti peredbachuvacha U regresijnim analizi serednokvadratichna pohibka yaku chasto nazivayut en abo pozavi birkovoyu serednokvadratichnoyu pohibkoyu angl out of sample mean squared error mozhe takozh poznachuvati serednye znachennya en peredbachen vid istinnih znachen na pozavibirkovomu viprobuvalnomu prostori porodzhenomu modellyu ocinenoyu za pevnim vi birkovim prostorom Vona takozh ye vidomoyu obchislyuvanoyu velichinoyu i vona riznitsya zalezhno vid vibirki ta pozavibirkovogo viprobuvalnogo prostoru PrikladiSerednye znachennya Nehaj ye vipadkova vibirka rozmiru n displaystyle n z generalnoyi sukupnosti X 1 X n displaystyle X 1 dots X n Nehaj zrazki vibirki bulo vibrano en Tobto n displaystyle n zrazkiv vibirayut po odnomu i ranishe vibrani zrazki vse odno mayut pravo buti vibranimi dlya vsih n displaystyle n vityaguvan Zvichajnim ocinyuvachem dlya m displaystyle mu ye vi birkove serednye X 1 n i 1 n X i displaystyle overline X frac 1 n sum i 1 n X i yake maye matematichne spodivannya sho dorivnyuye istinnomu serednomu m displaystyle mu tozh vono ye nezmishenim i serednokvadratichnu pohibku MSE X E X m 2 s n 2 s 2 n displaystyle operatorname MSE left overline X right operatorname E left left overline X mu right 2 right left frac sigma sqrt n right 2 frac sigma 2 n de s 2 displaystyle sigma 2 ye dispersiyeyu sukupnosti Ce ye en tobto tim sho maye najnizhchu SKP sered usih nezmishenih ocinyuvachiv dlya gaussovogo rozpodilu ale ne dlya skazhimo rivnomirnogo rozpodilu Dispersiya Dokladnishe Dispersiya vibirki Zvichajnim ocinyuvachem dispersiyi ye vipravlena dispersiya vibirki S n 1 2 1 n 1 i 1 n X i X 2 1 n 1 i 1 n X i 2 n X 2 displaystyle S n 1 2 frac 1 n 1 sum i 1 n left X i overline X right 2 frac 1 n 1 left sum i 1 n X i 2 n overline X 2 right Vin ye nezmishenim jogo matematichnim spodivannyam ye s 2 displaystyle sigma 2 j vidtak jogo takozh nazivayut nezmishenoyu dispersiyeyu vibirki a jogo SKP stanovit MSE S n 1 2 1 n m 4 n 3 n 1 s 4 1 n g 2 2 n n 1 s 4 displaystyle operatorname MSE S n 1 2 frac 1 n left mu 4 frac n 3 n 1 sigma 4 right frac 1 n left gamma 2 frac 2n n 1 right sigma 4 de m 4 displaystyle mu 4 ye chetvertim centralnim momentom rozpodilu abo sukupnosti a g 2 m 4 s 4 3 displaystyle gamma 2 mu 4 sigma 4 3 ye koeficiyentom ekscesu Prote mozhlivo vikoristovuvati j inshi ocinyuvachi dlya s 2 displaystyle sigma 2 proporcijni S n 1 2 displaystyle S n 1 2 i nalezhnij vibir mozhe zavzhdi davati nizhchu serednokvadratichnu pohibku Yaksho mi viznachimo S a 2 n 1 a S n 1 2 1 a i 1 n X i X 2 displaystyle S a 2 frac n 1 a S n 1 2 frac 1 a sum i 1 n left X i overline X right 2 todi obchislyuyemo MSE S a 2 E n 1 a S n 1 2 s 2 2 E n 1 2 a 2 S n 1 4 2 n 1 a S n 1 2 s 2 s 4 n 1 2 a 2 E S n 1 4 2 n 1 a E S n 1 2 s 2 s 4 n 1 2 a 2 E S n 1 4 2 n 1 a s 4 s 4 E S n 1 2 s 2 n 1 2 a 2 g 2 n n 1 n 1 s 4 2 n 1 a s 4 s 4 E S n 1 4 MSE S n 1 2 s 4 n 1 n a 2 n 1 g 2 n 2 n s 4 2 n 1 a s 4 s 4 displaystyle begin aligned operatorname MSE S a 2 amp operatorname E left left frac n 1 a S n 1 2 sigma 2 right 2 right amp operatorname E left frac n 1 2 a 2 S n 1 4 2 left frac n 1 a S n 1 2 right sigma 2 sigma 4 right amp frac n 1 2 a 2 operatorname E left S n 1 4 right 2 left frac n 1 a right operatorname E left S n 1 2 right sigma 2 sigma 4 amp frac n 1 2 a 2 operatorname E left S n 1 4 right 2 left frac n 1 a right sigma 4 sigma 4 amp amp operatorname E left S n 1 2 right sigma 2 amp frac n 1 2 a 2 left frac gamma 2 n frac n 1 n 1 right sigma 4 2 left frac n 1 a right sigma 4 sigma 4 amp amp operatorname E left S n 1 4 right operatorname MSE S n 1 2 sigma 4 amp frac n 1 na 2 left n 1 gamma 2 n 2 n right sigma 4 2 left frac n 1 a right sigma 4 sigma 4 end aligned Ce minimizuyetsya koli a n 1 g 2 n 2 n n n 1 n 1 n g 2 displaystyle a frac n 1 gamma 2 n 2 n n n 1 frac n 1 n gamma 2 Dlya gaussovogo rozpodilu de g 2 0 displaystyle gamma 2 0 ce oznachaye sho SKP zvoditsya do minimumu pri dilenni sumi na a n 1 displaystyle a n 1 Minimalnij koeficiyent ekscesu stanovit g 2 2 displaystyle gamma 2 2 sho dosyagayetsya rozpodilom Bernulli z p 1 2 pidkidannya moneti j SKP zvoditsya do minimumu pri a n 1 2 n displaystyle a n 1 tfrac 2 n Otzhe nezalezhno vid koeficiyentu ekscesu mi otrimuyemo krashu ocinku v sensi nizhchoyi SKP trohi zmenshivshi nezmishenij ocinyuvach Ce ye prostim prikladom en ocinyuvach stiskayut u bik nulya zmenshuyut nezmishenij ocinyuvach Dali hoch vipravlena dispersiya vibirki i ye en minimalna serednokvadratichna pohibka sered nezmishenih ocinyuvachiv dispersiyi dlya gaussovih rozpodiliv yaksho rozpodil ne ye gaussovim to navit sered nezmishenih ocinyuvachiv S n 1 2 displaystyle S n 1 2 najkrashim nezmishenim ocinyuvachem dispersiyi buti ne mozhe Gaussiv rozpodil V nastupnij tablici navedeno dekilka ocinyuvachiv istinnih parametriv sukupnosti m ta s2 dlya gaussovogo vipadku Istinne znachennya Ocinyuvach Serednokvadratichna pohibka 8 m displaystyle theta mu 8 displaystyle hat theta nezmishenij ocinyuvach serednogo znachennya sukupnosti X 1 n i 1 n X i displaystyle overline X frac 1 n sum i 1 n X i MSE X E X m 2 s n 2 displaystyle operatorname MSE overline X operatorname E overline X mu 2 left frac sigma sqrt n right 2 8 s 2 displaystyle theta sigma 2 8 displaystyle hat theta nezmishenij ocinyuvach dispersiyi sukupnosti S n 1 2 1 n 1 i 1 n X i X 2 displaystyle S n 1 2 frac 1 n 1 sum i 1 n left X i overline X right 2 MSE S n 1 2 E S n 1 2 s 2 2 2 n 1 s 4 displaystyle operatorname MSE S n 1 2 operatorname E S n 1 2 sigma 2 2 frac 2 n 1 sigma 4 8 s 2 displaystyle theta sigma 2 8 displaystyle hat theta zmishenij ocinyuvach dispersiyi sukupnosti S n 2 1 n i 1 n X i X 2 displaystyle S n 2 frac 1 n sum i 1 n left X i overline X right 2 MSE S n 2 E S n 2 s 2 2 2 n 1 n 2 s 4 displaystyle operatorname MSE S n 2 operatorname E S n 2 sigma 2 2 frac 2n 1 n 2 sigma 4 8 s 2 displaystyle theta sigma 2 8 displaystyle hat theta zmishenij ocinyuvach dispersiyi sukupnosti S n 1 2 1 n 1 i 1 n X i X 2 displaystyle S n 1 2 frac 1 n 1 sum i 1 n left X i overline X right 2 MSE S n 1 2 E S n 1 2 s 2 2 2 n 1 s 4 displaystyle operatorname MSE S n 1 2 operatorname E S n 1 2 sigma 2 2 frac 2 n 1 sigma 4 InterpretaciyaNulova SKP sho oznachaye sho ocinyuvach 8 displaystyle hat theta peredbachuye sposterezhennya parametru 8 displaystyle theta z bezdogannoyu tochnistyu ye idealnoyu ale zazvichaj nemozhlivoyu Znachennya SKP mozhna vikoristovuvati z metoyu porivnyuvannya Dvi abo bilshe statistichnih modelej mozhna porivnyuvati vikoristovuyuchi yihni SKP yak miru togo naskilki dobre voni poyasnyuyut zadanij nabir sposterezhen nezmishenij ocinyuvach ocinenij zi statistichnoyi modeli z najmenshoyu dispersiyeyu sered usih nezmishenih ocinyuvachiv ye en abo angl MVUE Minimum Variance Unbiased Estimator Yak metodika linijnoyi regresiyi tak i metodika dispersijnogo analizu ocinyuyut SKP yak chastinu analizu j vikoristovuyut ocinenu SKP shobi viznachati statistichnu znachushist doslidzhuvanih chinnikiv abo prediktoriv Metoyu planuvannya eksperimentiv ye pobudova eksperimentiv takim chinom shobi pri analizi sposterezhen SKP bula blizkoyu do nulya vidnosno velichini shonajmenshe odnogo z ocinyuvanih vpliviv eksperimentu V odnofaktornim dispersijnim analizi SKP mozhlivo obchislyuvati shlyahom dilennya sumi kvadrativ pohibok na stupin vilnosti Takozh F znachennya ye vidnoshennyam serednokvadratichnogo vplivu do SKP SKP takozh vikoristovuyut u dekilkoh metodikah en yak chastinu viznachannya togo skilki prediktoriv z naboru kandidativ vklyuchiti do modeli dlya zadanogo naboru sposterezhen ZastosuvannyaCya stattya maye viglyad pereliku yakij krashe podati prozoyu Vi mozhete dopomogti viklasti spisok prozoyu de ce dorechno Oznajomtesya z dovidkoyu z redaguvannya lipen 2021 Zvedennya SKP do minimumu ye klyuchovim kriteriyem obirannya ocinyuvachiv div en Sered nezmishenih ocinyuvachiv zvedennya SKP do minimumu ekvivalentne zvedennyu do minimumu dispersiyi a ocinyuvach yakij robit ce ye en Prote zmishenij ocinyuvach mozhe mati nizhchu SKP div zmishennya ocinyuvacha U statistichnomu modelyuvanni SKP mozhe podavati riznicyu mizh faktichnimi sposterezhennyami ta znachennyami sposterezhen peredbachenimi modellyu U comu konteksti yiyi vikoristovuyut dlya togo shob viznachati naskilki model dopasovano do danih a takozh chi mozhlivo viluchiti deyaki poyasnyuvalni zminni bez znachnoyi shkodi dlya peredbachuvalnoyi zdatnosti modeli en u prognozuvanni ta peredbachuvanni ye miroyu en sho gruntuyetsya na SKP Funkciya vtratVtrati kvadratu pohibki ye odniyeyu z najshirshe vikoristovuvanih funkcij vtrat u statistici dzherelo hocha yiyi shiroke vikoristannya bilshe viplivaye z matematichnoyi zruchnosti nizh z mirkuvan faktichnih vtrat u zastosuvannyah Karl Fridrih Gauss yakij zaprovadiv vikoristannya serednokvadratichnoyi pohibki usvidomlyuvav yiyi dovilnist i pogodzhuvavsya z zaperechennyami proti neyi na cih pidstavah Matematichni perevagi serednokvadratichnoyi pohibki osoblivo ochevidni pri yiyi vikoristanni dlya analizu produktivnosti linijnoyi regresiyi oskilki ce dozvolyaye rozdiliti dispersiyu v nabori danih na dispersiyu sho poyasnyuyetsya modellyu ta dispersiyu sho poyasnyuyetsya vipadkovistyu Kritika Bezzaperechne vikoristannya serednokvadratichnoyi pohibki kritikuvav fahivec iz teoriyi rishen en Serednokvadratichna pohibka ce minus matematichnogo spodivannya odniyeyi konkretnoyi funkciyi korisnosti kvadratichnoyi yaka mozhe ne buti slushnoyu funkciyeyu korisnosti dlya vikoristannya za zadanoyi sukupnosti obstavin Prote isnuyut deyaki scenariyi za yakih serednokvadratichna pohibka mozhe sluguvati dobrim nablizhennyam funkciyi vtrat sho zustrichayetsya u zastosuvanni prirodnim chinom Yak i dispersiya serednokvadratichna pohibka maye nedolik nadavannya velikoyi vagi vikidam Ce ye rezultatom pidnesennyam do kvadratu kozhnogo chlenu cherez yake bilshi pohibki zavazhuyut silnishe za menshi Cya vlastivist nebazhana u bagatoh zastosuvannyah zmusila doslidnikiv vikoristovuvati taki alternativi yak en abo taki sho gruntuyutsya na mediani Div takozh en Kompromis zmishennya ta dispersiyi en en en en Perenavchannya Pikove vidnoshennya signalu do shumu en en en en VinoskiCe mozhlivo dovesti za dopomogoyu nerivnosti Yensena nastupnim chinom Chetvertij centralnij moment ye verhnoyu mezheyu dlya kvadratu dispersiyi tozh najmenshim znachennyam dlya yihnogo vidnoshennya ye odinicya vidtak najmenshim znachennyam dlya koeficiyenta ekscesu ye 2 otrimuvanim napriklad Bernulli z p 1 2 Primitki Math Vault amer 26 kvitnya 2020 Arhiv originalu za 18 serpnya 2020 Procitovano 12 veresnya 2020 angl www probabilitycourse com Arhiv originalu za 6 travnya 2021 Procitovano 12 veresnya 2020 angl Lehmann E L Casella George 1998 Theory of Point Estimation vid 2nd New York Springer ISBN 978 0 387 98502 2 MR 1639875 angl Wackerly Dennis Mendenhall William Scheaffer Richard L 2008 Mathematical Statistics with Applications vid 7 Belmont CA USA Thomson Higher Education ISBN 978 0 495 38508 0 angl A modern introduction to probability and statistics understanding why and how London Springer 2005 ISBN 978 1 85233 896 1 OCLC 262680588 angl Steel R G D and Torrie J H Principles and Procedures of Statistics with Special Reference to the Biological Sciences en 1960 page 288 angl Mood A Graybill F Boes D 1974 Introduction to the Theory of Statistics vid 3rd McGraw Hill s 229 angl 1980 Probability and Statistics vid 2nd Addison Wesley angl 1985 2 4 2 Certain Standard Loss Functions Statistical Decision Theory and Bayesian Analysis vid 2nd New York Springer Verlag s 60 ISBN 978 0 387 96098 2 MR 0804611 angl Bermejo Sergio Cabestany Joan 2001 Oriented principal component analysis for large margin classifiers Neural Networks 14 10 1447 1461 doi 10 1016 S0893 6080 01 00106 X PMID 11771723 angl