Стати́стика (англ. statistics) — це дисципліна, що працює над збиранням, організуванням, аналізом, інтерпретуванням та представленням даних. В застосуванні статистики до наукової, промислової або соціальної задачі є звичним починати з генеральної сукупності (англ. statistical population) або статистичної моделі для дослідження. Генеральні сукупності можуть бути різноманітними групами людей або об'єктів, такими як «всі люди, що живуть в якійсь країні» або «кожен з атомів, що складають кристал». Статистика працює зі всіма аспектами даних, включно з плануванням збирання даних в термінах планування обстежень (англ. surveys) та експериментів. Див. [en].
Коли зібрати дані перепису (англ. census) неможливо, статистики збирають дані, розробляючи спеціальні плани експериментів (англ. experiment designs), та вибірки (англ. samples) для обстежування. Репрезентативне вибирання забезпечує можливість розумного розширення висновків та рішень з цієї вибірки на сукупність в цілому. Експериментальне дослідження (англ. experimental study) включає здійснення вимірювань досліджуваної системи, маніпулювання цією системою, а потім здійснення додаткових вимірювань із застосуванням тієї ж процедури, щоби визначити, чи змінило маніпулювання значення цих вимірювань. На противагу цьому, [en] (англ. observational study) не включає експериментального маніпулювання.
В аналізі даних використовують два основні статистичні методи: описову статистику (англ. descriptive statistics), яка узагальнює дані з вибірки із застосуванням [en], таких як середнє значення та стандартне відхилення, та індуктивну статистику (англ. inferential statistics), яка робить висновки з даних, що піддаються випадковій мінливості (наприклад, похибкам спостережень, варіюванню вибірки). Описова статистика часто найбільше цікавиться двома наборами властивостей розподілу (вибірки або загальної сукупності): центральна тенденція (або положення) прагне схарактеризувати центральне або типове значення цього розподілу, тоді як дисперсія (або мінливість) характеризує міру, до якої члени цього розподілу відхиляються від його центру, та один від одного. Висновування в математичній статистиці здійснюють в рамках теорії ймовірностей, що займається аналізом випадкових явищ.
Стандартна статистична процедура включає збирання даних, що веде до перевірки взаємозв'язку між двома наборами статистичних даних, або набором даних та синтетичними даними, отриманими з ідеалізованої моделі. Для статистичного взаємозв'язку між двома наборами даних пропонують гіпотезу, і порівнюють її, як [en], з ідеалізованою нульовою гіпотезою (англ. null hypothesis) про відсутність взаємозв'язку між цими двома наборами даних. Відхиляння або спростування нульової гіпотези здійснюють із застосуванням статистичних критеріїв (англ. statistical tests), що кількісно виражають сенс, в якому хибність нульової гіпотези можливо вважати доведеною за наданих даних, які використовують в цій перевірці. Працюючи від нульової гіпотези, розпізнаю́ть два основні види помилок: помилки I роду (нульову гіпотезу хибно відхиляють, що дає «хибно позитивне», англ. false positive), та помилки II роду (нульову гіпотезу не вдається відхилити, й справжній взаємозв'язок між сукупностями втрачається, що дає «хибно негативне», англ. false negative). З цією системою виявилося пов'язано численні проблеми: від отримування достатнього розміру вибірки, й до вказування адекватної нульової гіпотези.[]
Процеси вимірювання, що породжують статистичні дані, також піддаються помилкам. Багато з цих помилок класифікують як випадкові (шум, англ. noise) або систематичні (упередження, англ. bias), але можуть траплятися й інші типи помилок (наприклад, промахи, англ. blunder, такі як коли аналітик повідомляє неправильні одиниці вимірювання). Існування [en] або [en] може призводити до упереджених оцінок, й для подолання цих проблем було розроблено спеціальні методики.
Найраніші праці з імовірності та статистики, статистичних методів, що спираються на теорію ймовірностей, сходять до арабських математиків та [en], зокрема, Аль-Халіля (717—786) та Аль-Кінді (801—873). У XVIII сторіччі статистика також почала сильно живитися з диференціального та інтегрального числення. Останніми роками для вироблення цих критеріїв, таких як описовий аналіз, статистика покладалася більше на статистичне програмне забезпечення.
Вступ
Статистика — це математичний масив наукових знань, що стосуються збирання, аналізу, інтерпретування або пояснювання, та представлення даних, або одна з галузей математики. Дехто вважає статистику радше окремою математичною наукою, ніж галуззю математики. В той час як даними користуються багато наукових досліджень, статистика займається використанням даних в контексті невизначеності, та ухвалюванням рішень в умовах невизначеності.
В застосуванні статистики до задачі звичною практикою є починати з сукупності або процесу для дослідження. Сукупності можуть бути різноманітної тематики, такі як «всі люди, що мешкають у країні» або «кожен з атомів, що складають кристал». В ідеалі статистики збирають дані про всю сукупність (операція, звана переписом). Це може бути зорганізовано державними статистичними установами. Описову статистику можливо використовувати для узагальнювання даних про сукупність. До чисельних описувачів для неперервних типів даних (таких, як дохід) належать середнє значення та стандартне відхилення, тоді як в термінах описування категорійних даних (таких, як освіта) кориснішими є частота та відсоток.
Коли перепис є нездійсненним, досліджують обрану підмножину сукупності, звану вибіркою (англ. sample). Щойно визначено вибірку, яка для цієї сукупності є репрезентативною, дані для членів цієї вибірки збирають у спостережній або експериментальній постановці. Знов-таки, для узагальнювання цих вибіркових даних можливо застосовувати описову статистику. Проте, вибирання вибірки мало елементи випадковості, тож встановлені чисельні описувачі з цієї вибірки залежать від випадковості. Щоби все ж таки робити змістовні висновки про сукупність в цілому, потрібна індуктивна статистика. Вона використовує закономірності в даних вибірки, щоби робити висновки про представлену нею сукупність, з урахуванням випадковості. Ці висновки можуть набувати вигляду: відповідання на питання «так/ні» (перевіряння гіпотез, англ. hypothesis testing), оцінювання чисельних характеристик даних (оцінювання, англ. estimation), описування пов'язаностей (англ. associations) в даних (кореляція), та моделювання взаємозв'язків всередині даних (наприклад, із застосуванням регресійного аналізу). Висновування може розширюватися до прогнозування, передбачування, та оцінювання неспостережуваних змінних чи то всередині досліджуваної сукупності, чи пов'язаних із нею; до нього можуть належати екстраполювання та інтерполювання часових рядів та просторових даних, а також добування даних.
Математична статистика
Математична статистика — це застосування математики до статистики. До математичних методик, які для цього використовують, належать математичний аналіз, лінійна алгебра, стохастичний аналіз, диференціальні рівняння та [en].
Історія
Детальніші відомості з цієї теми ви можете знайти в статті [en] та [en].
Найраніші праці з імовірності та статистики сходять до арабських математиків та [en]Золотої доби ісламу між VIII та XIII сторіччями. Аль-Халіль (717—786) написав «Книгу таємної мови», що містить перше застосування [en] з метою перелічування всіх арабських слів з голосними та без них. Найранішою книгою зі статистики є «Трактат про дешифрування криптографічних повідомлень», написаний арабським вченим Аль-Кінді (801—873). У своїй книзі Аль-Кінді навів докладний опис того, як застосовувати статистику та частотний аналіз для розшифровування зашифрованих повідомлень. Цей текст заклав основи статистики та криптоаналізу. Аль-Кінді також здійснив найраніше з відомих застосування статистичного висновування, тоді як пізніші арабські криптографи розробили ранні статистичні методи для розкодовування зашифрованих повідомлень. [en] (1187—1268) пізніше зробив важливий внесок стосовно застосування в частотному аналізі розміру вибірки.
Найраніші європейські праці зі статистики сходять до 1663 року, публікації «Природні та політичні спостереження на списках померлих» Джона Ґраунта. Ранні застосування статистичного мислення оберталися довкола потреб держав (лат. statum) ґрунтувати політику на демографічних та економічних даних, звідси [en]. На початку XIX сторіччя сфера дисципліни статистики розширилася, включивши збирання та аналіз даних в цілому. Натепер статистику широко застосовують в урядуванні, бізнесі, а також природничих та соціальних науках.
Математичні основи сучасної статистики було закладено в XVII сторіччі з розробкою Джироламо Карданом, Блезом Паскалем та П'єром Ферма теорії ймовірностей. Математична теорія ймовірностей постала з досліджень ігор випадку, хоч поняття ймовірності й було вже досліджено в середньовічному праві, та філософами, такими як Хуан Карамуель.Метод найменших квадратів було вперше описано Адрієном-Марі Лежандром 1805 року.
Сучасна галузь статистики виникла наприкінці XIX — початку XX сторіччя в три етапи. Першу хвилю, на рубежі сторіч, очолила праця Френсіса Ґолтена та Карла Пірсона, які перетворили статистику на строгу математичну дисципліну, яку використовували для аналізу, і не лише в науці, але також і в промисловості та політиці. До внеску Ґолтена належать введення понять стандартного відхилення, кореляції, регресійного аналізу, та застосування цих методів до дослідження розмаїття людських характеристик — зросту, ваги, довжини вій тощо. Пірсон, серед іншого, розробив коефіцієнт кореляції моменту добутку Пірсона, визначений як момент добутку,метод моментів для допасовування розподілів до вибірок, та [en]. Ґолтен та Пірсон заснували «[en]» як перший журнал з математичної статистики та біостатистики (яку тоді називали біометрією), й пізніше заснували перший в світі університетський статистичний факультет в Університетськім коледжі Лондона.
Рональд Фішер під час експерименту «пані дегустує чай» закарбував термін нульова гіпотеза, яку «ніколи не доводять та не встановлюють, але, можливо, спростовують в ході експерименту».
Початок другій хвилі 1910-х та 20-х років поклав [en], й вона досягла своєї кульмінації в осяяннях Рональда Фішера, який написав підручники, що мали визначити цю академічну дисципліну в університетах по всьому світі. Найважливішими публікаціями Фішера були його засаднича праця 1918 року [en]» (яка була першою, де було застосовано статистичний термін «дисперсія», англ. variance), його класична праця 1925 року [en]», та його [en]» 1935 року, де він розробив строгі моделі планування експериментів. Він започаткував поняття достатності, [en], лінійного розрізнювача Фішера та інформації за Фішером. У своїй книзі 1930 року [en]» він застосував статистику до різних біологічних понять, таких як принцип Фішера (що його [en] назвав «імовірно найвизначнішим аргументом в еволюційній біології») та фішерова неконтрольованість, поняття в статевім доборі про афект неконтрольованого зворотного зв'язку, що виникає в еволюції.
Заключна хвиля, яка переважно бачила вдосконалення та розширення попередніх розробок, виникла в результаті спільної праці Еґона Пірсона та Єжи Неймана в 1930-х роках. Вони ввели поняття помилки «II роду», статистичної потужності критерію (англ. power of a test), та довірчих інтервалів. Єжи Нейман 1934 року показав, що стратифіковане випадкове вибирання було в цілому кращим методом оцінювання, аніж вибирання цілеспрямоване (квотне).
Сьогодні статистичні методи застосовують в усіх областях, які передбачають ухвалювання рішень, щоби отримувати точні висновки з консолідованого масиву даних для ухвалювання рішень в умовах невизначеності на основі статистичної методології. Використання сучасних комп'ютерів форсувало великомасштабні статистичні обчислення й також уможливило нові методи, що є недоцільними для виконання вручну. Статистика продовжує бути областю активних досліджень, наприклад, щодо проблеми аналізу великих даних.
Статистичні дані
Збирання даних
Вибирання
Коли зібрати дані повного перепису неможливо, статистики збирають вибіркові дані, розробляючи особливі плани експериментів та [en]. Статистика сама по собі також пропонує інструменти для передбачування та прогнозування за допомогою статистичних моделей. Ідея робити висновки на основі вибіркових даних виникла близько середини 1600-х у зв'язку з оцінюванням чисельності населення та розробки предтеч страхування життя.
Щоби використовувати вибірку як взірець для всієї сукупності, важливо, щоби вона справді представляла генеральну сукупність. Репрезентативне вибирання забезпечує можливість безпечного розширення висновків та рішень з цієї вибірки на сукупність в цілому. Основна проблема полягає у визначені міри, до якої обрана вибірка є насправді репрезентативною. Статистика пропонує методи для оцінювання та виправляння будь-яких упереджень у вибірці та процедурах збирання даних. Також існують методи планування експериментів для таких експериментів, що можуть зменшувати ці проблеми на початку дослідження, підсилюючи його здатність розпізнавати істину стосовно генеральної сукупності.
Теорія вибирання є частиною математичної дисципліни теорії ймовірності. Ймовірність використовують в математичній статистиці, щоби досліджувати вибіркові розподіли вибіркових статистик та, загальніше, властивості статистичних процедур. Використання будь-якого статистичного методу є правильним, коли система або сукупність, яку розглядають, задовольняє припущення цього методу. Різниця в поглядах класичної теорії ймовірності та теорії вибирання, грубо, полягає в тім, що теорія ймовірності починає з заданих параметрів генеральної сукупності для дедуктивного виведення ймовірностей, притаманних вибіркам. Проте статистичне висновування рухається в протилежному напрямку, індуктивно виводячи з вибірок параметри більшої або генеральної сукупності.
Експериментальні та спостережні дослідження
Загальною метою статистичного дослідницького проєкту є дослідження причинності, й зокрема висновування стосовно впливу змін значень передбачувачів чи незалежних змінних на залежні змінні. Існує два основні типи причиннісних статистичних досліджень: експериментальні дослідження, та [en]. В обох типах досліджень спостерігають за впливом відмінності в незалежній змінній (або змінних) на поведінку залежної змінної. Різниця між цими двома типами полягає в тім, як фактично здійснюють дослідження. Кожен з них може бути дуже дієвим. Експериментальне дослідження включає вимірювання досліджуваної системи, маніпулювання цією системою, а потім здійснення нових вимірювань з використанням тієї ж процедури, щоби визначити, чи змінило це маніпулювання значення вимірювань. На противагу цьому, спостережне дослідження не містить експериментального маніпулювання. Натомість збирають дані та досліджують кореляції між передбачувачами та відгуками. Й хоч інструменти аналізу даних найкраще працюють на даних з рандомізованих досліджень, їх також застосовують і до інших типів даних, таких як природні експерименти та [en], для яких статистик використовуватиме видозмінений, структурованіший метод оцінювання (наприклад, серед багатьох інших, [en] та інструментальні змінні), що вироблятиме слушні оцінювачі.
Експерименти
Основними етапами статистичного експерименту є:
- Планування дослідження, включно зі знаходженням числа повторювань дослідження, із застосуванням наступної інформації: попередніх оцінок стосовно розміру [en], [en], та оцінюваної експериментальної мінливості. Необхідним є розгляд вибору об'єктів експерименту та етики дослідження. Статистики радять, щоб експерименти порівнювали (щонайменше) один новий вплив зі стандартним впливом або керуванням, щоби уможливити неупереджену оцінку відмінності ефектів впливу.
- Планування експериментів, із застосуванням групування, щоби знижувати вплив змішувальних змінних, та [en] впливів до об'єктів, щоби уможливлювати ефектів впливів та експериментальної похибки. На цьому етапі експериментатори та статистики пишуть протокол експерименту (англ. experimental protocol), що керуватиме виконанням експерименту, й що визначатиме первинний аналіз (англ. primary analysis) експериментальних даних.
- Виконання експерименту згідно протоколу експерименту та аналізування даних згідно протоколу експерименту.
- Подальше вивчення набору даних у вторинних аналізах з метою висування нових гіпотез для майбутнього вивчення.
- Документування та представлення результатів дослідження.
Експерименти з людською поведінкою несуть особливі турботи. В знаменитім Готорнськім дослідженні вивчали зміни до робочого середовища на Готорнськім заводі компанії Western Electric. Дослідників цікавило визначити, чи призведе збільшення освітлення до збільшення продуктивності працівників [en]. Дослідники спочатку виміряли продуктивність заводу, потім змінили освітлення в одній області заводу, й перевірили, чи вплинули ці зміни в освітленні на продуктивність. Виявилося, що продуктивність і справді покращилася (в експериментальних умовах). Проте це дослідження сьогодні сильно критикують через помилки в процедурах експерименту, особливо через брак контрольної групи та сліпоти. Готорнський ефект стосується виявлення того, що результат (в цьому випадку — продуктивність працівників) змінився через саме спостереження. Піддослідні в Готорнськім дослідженні стали продуктивнішими не через зміну освітлення, а через те, що за ними спостерігали.
Спостережне дослідження
Прикладом спостережного дослідження є таке, що вивчає пов'язаність паління та раку легенів. Цей тип дослідження зазвичай використовує опитування для збирання спостережень про цільову область, і потім виконує статистичний аналіз. В цьому випадку дослідники збирали би спостереження як про курців, так і про не курців, певно, шляхом когортного дослідження, а потім дивилися би на число випадків раку легенів у кожній з груп. Іншим типом спостережного дослідження є дослідження «випадок—контроль», в якому запрошують взяти участь людей з та без цільового результату (наприклад, раку легенів), і збирають їхні історії піддавання впливові.
Типи даних
Детальніші відомості з цієї теми ви можете знайти в статті [en] та Шкала.
Існувало чимало спроб виробити таксономію шкал вимірювання. Психолог [en] визначив номінальну (англ. nominal), порядкову (англ. ordinal), інтервальну (англ. interval) шкали, та шкалу відношень (англ. ratio scale). Номінальні вимірювання не мають змістовного порядку ранжування їхніх значень, й дозволяють будь-яке перетворення один-в-одного (ін'єктивне). Порядкові вимірювання мають неточні відмінності між послідовними значеннями, але мають змістовний порядок цих значень, й дозволяють будь-яке перетворення зі збереженням порядку. Інтервальні вимірювання мають визначені змістовні відстані між вимірюваннями, але нульове значення є довільним (як у випадках вимірювань довготи та температури в градусах Цельсія та Фаренгейта), й дозволяють будь-яке лінійне перетворення. Вимірювання відношень мають визначені змістовні як нульове значення, так і відстані між вимірюваннями, й дозволяють будь-яке перетворення масштабування.
Оскільки змінні, що відповідають лише номінальним та порядковим вимірюванням, раціонально виміряти числами неможливо, іноді їх об'єднують як категорійні змінні, тоді як відносні та інтервальні вимірювання об'єднують як кількісні змінні, що можуть бути або дискретними, або неперервними, в силу своєї числової природи. Таке розмежування часто може бути нестрого співвідносним з типом даних в інформатиці, оскільки дихотомні категорійні змінні може бути представлено логічним типом даних, багатозначні категорійні змінні — довільно призначуваними цілими числами в цілочисловім типі даних, а неперервні змінні — [en] із застосуванням обчислень з рухомою комою. Але відображення типів даних інформатики на типи статистичних даних залежить від того, яку категоризацію останніх втілюють.
Було запропоновано й інші категоризації. Наприклад, Мостеллер та Тьюкі (1997) розрізнювали ступені (англ. grades), ранги (англ. ranks), зліченні дроби (англ. counted fractions), кількості (англ. counts), суми (англ. amounts) та баланси (англ. balances). Нелдер (1990) описав неперервні кількості (англ. continuous counts), неперервні відношення (англ. continuous ratios), відношення кількостей (англ. count ratios), та категорійні види даних. Див. також Крісмана (1998), ван ден Берґа (1991).
Питання доречності чи недоречності застосування різних видів статистичних методів до даних, отриманих з різних видів процедур вимірювання, ускладнюється питаннями перетворювання змінних та точною інтерпретацією досліджуваних питань. «Взаємозв'язок між даними та тим, що вони описують, просто відображає той факт, що певні види статистичних висловлень можуть мати значення істинності, що не є інваріантними за деяких перетворень. Чи є доцільним розглядати певне перетворення, чи ні, залежить від питання, на яке намагаються відповісти.»
Статистичні методи
Описова статистика
Описо́ві стати́стики (в сенсі [en]англ. descriptive statistic в однині) — це зведені статистики, які кількісно описують або узагальнюють ознаки сукупності інформації, в той час як опис́ова стати́стика в сенсі незлічуваного іменника (англ. descriptive statistics) — це процес використання та аналізу цих статистик. Описова статистика відрізняється від висновувальної статистики (англ. inferential statistics, або індуктивної статистики, англ. inductive statistics) тим, що описова статистика має на меті узагальнювання вибірки, а не використання цих даних, щоб дізнатися щось про генеральну сукупність, яку, як вважають, ця вибірка даних представляє.
Індуктивна статистика
Статисти́чне висно́вування (англ. statistical inference) — це процес використання аналізу даних для встановлення властивостей розподілу ймовірності, що лежить в їх основі. Висновувальний статистичний аналіз робить висновки про властивості генеральної сукупності, наприклад, шляхом перевіряння гіпотез та отримування оцінок. Він виходить з припущення, що спостережувані дані є вибіркою з більшої сукупності. Індуктивну статистику можливо протиставляти описовій статистиці. Описова статистика цікавиться виключно властивостями спостережуваних даних, і не спирається на припущення, що ці дані походять із більшої сукупності.
Термінологія та теорія індуктивної статистики
Статистики, статистичні оцінки, та центральні величини
Розгляньмо незалежні однаково розподілені (н. о. р.) випадкові змінні із заданим розподілом ймовірності: стандартне статистичне висновування та теорія оцінювання визначає випадкову вибірку як випадковий вектор, заданий стовпчиковим вектором цих н. о. р. змінних. Досліджувану генеральну сукупність описують розподілом ймовірності, що може мати невідомі параметри.
Статистика (англ. statistic) — це випадкова змінна, що є функцією випадкової вибірки, але не функцією невідомих параметрів. Розподіл імовірності цієї статистики, проте, невідомі параметри мати може.
Розгляньмо тепер функцію невідомого параметра: статистична оцінка (англ. estimator) — це статистика, яку використовують для оцінювання цієї функції. До широко вживаних статистичних оцінок належать вибіркове середнє, незміщена дисперсія вибірки та [en].
Випадкову змінну, що є функцією випадкової вибірки та невідомого параметру, але чий розподіл імовірності не залежить від невідомого параметру, називають [en] (англ. pivotal quantity, pivot). До широко вживаних центральних величин належать z-оцінка, (статистика хі-квадрат) та (t-величина) Стьюдента.
Серед двох оцінок заданого параметру ефективнішою вважають ту, що має нижчу середньоквадратичну похибку. Крім того, оцінку називають незміщеною (англ. unbiased), якщо її математичне сподівання дорівнює істинному значенню оцінюваного невідомого параметра, й асимптотично незміщеною, якщо її математичне сподівання збігається до границі істинного значення такого параметра.
До інших бажаних властивостей статистичних оцінок належать: [en] (англ. UMVUE), що мають найнижчу дисперсію для всіх можливих значень оцінюваного параметра (це зазвичай є легшою властивістю для перевірки, ніж ефективність), та слушні оцінки (англ. consistent estimators), що збігаються за ймовірністю до істинного значення такого параметра.
Це все ще залишає відкритим питання, як отримувати статистичні оцінки в заданій ситуації та виконувати обчислення, було запропоновано декілька методів: метод моментів, метод максимальної правдоподібності, метод найменших квадратів, та новіший метод [en].
Нульова гіпотеза та альтернативна гіпотеза
Інтерпретування статистичної інформації часто може включати розробку нульової гіпотези (англ. null hypothesis), яка зазвичай (але не обов'язково) полягає у відсутності взаємозв'язку серед змінних, або що зміни з часом не відбуваються.
Найкращою ілюстрацією для новачка є утруднення, з яким зіткнувся кримінальний процес в суді присяжних. Нульова гіпотеза, H0, стверджує, що відповідач є невинним, тоді як альтернативна гіпотеза, H1, стверджує, що відповідач є винним. Висувається звинувачення через підозру в винності. H0 (статус кво) протистоїть H1, й підтримується, поки H1 не стане підтримано доказами «поза розумним сумнівом». Проте «нездатність відхилити H0» в цьому випадку означає не невинність, а лише те, що докази були недостатніми для засудження. Тож присяжні не обов'язково приймають H0, їм не вдається відхилити H0. І хоч «довести» нульову гіпотезу неможливо, її можливо перевірити на те, наскільки вона є близькою до істини, через статистичну потужність, яка робить перевірку на помилки другого роду.
Те, що статистики називають [en], — це просто гіпотеза, що суперечить нульовій гіпотезі.
Похибка
Працюючи від нульової гіпотези, розпізнаю́ть два основні види помилок:
- Помилки I роду (англ. type I errors), коли нульову гіпотезу хибно відхиляють, що дає «хибно позитивне» (англ. false positive)
- Помилки II роду (англ. type II errors), коли нульову гіпотезу не вдається відхилити, й справжня відмінність між сукупностями втрачається, що дає «хибно негативне» (англ. false negative)
Стандартне відхилення (англ. standard deviation) вказує на те, наскільки окремі спостереження в вибірці відрізняються від центрального значення, такого як середнє за вибіркою або середнє за генеральною сукупністю, тоді як (стандартна похибка) (англ. standard error) вказує на оцінку різниці між середніми за вибіркою та середнім за генеральною сукупністю.
(Статистична похибка) (англ. statistical error) — це величина, на яку спостереження відрізняються від їхнього математичного сподівання, (залишок) (англ. residual) — це величина, на яку спостереження відрізняються від значення, якого набуває статистична оцінка очікуваного значення на заданому зразкові (яку також називають передбаченням).
Середньоквадратичну похибку (англ. mean squared error) використовують для отримування ефективних оцінок, широко вживаного класу статистичних оцінок. [en] (англ. root mean square error) є просто квадратним коренем середньоквадратичної похибки.
Багато статистичних методів прагнуть мінімізувати [en] (англ. residual sum of squares), і їх називають методами найменших квадратів (англ. methods of least squares), на противагу до [en] (англ. least absolute deviations). Останні надають однакової ваги як маленьким, так і великим похибкам, тоді як перші надають великим похибкам більшої ваги. Також, залишкова сума квадратів є диференційовною, що забезпечує зручну властивість для виконання регресії. Найменші квадрати в застосуванні до лінійної регресії називають [en] (англ. ordinary least squares method), а найменші квадрати в застосуванні до [en] називають [en] (англ. non-linear least squares). Також, в лінійній регресійній моделі недетерміновану частину моделі називають членом похибки (англ. error term), збуренням (англ. disturbance), або просто шумом (англ. noise). Як лінійну, так і нелінійну регресію розглядають у поліноміальнім методі найменших квадратів (англ. polynomial least squares), що також описує дисперсію в передбаченні залежної змінної (вісь y) як функцію від незалежної змінної (вісь x) та відхилень (похибок, шуму, збурення) відносно оцінюваної (допасовуваної) кривої.
Процеси вимірювання, що породжують статистичні дані, також є схильними до похибок. Багато з цих похибок класифікують як випадкові (англ. random, шум) та систематичні (англ. systematic, зсув), але важливими можуть бути й інші типи похибок (наприклад, промахи, такі як коли аналітик повідомляє неправильні одиниці вимірювання). Існування [en] або [en] може призводити до упереджених оцінок, й для подолання цих проблем було розроблено спеціальні методики.
Інтервальне оцінювання
Детальніші відомості з цієї теми ви можете знайти в статті [en].
Більшість досліджень вибирають лише частину генеральної сукупності, тож результати не представляють всю генеральну сукупність вповні. Будь-які оцінки, отримані з такої вибірки, лише наближують значення генеральної сукупності. Довірчі інтервали (англ. confidence intervals) дозволяють статистикам виражати те, наскільки близько вибіркова оцінка відповідає істинному значенню для всієї генеральної сукупності. Часто їх виражають як 95-відсоткові довірчі інтервали. Формально, 95 %-вий довірчий інтервал для значення є діапазоном, який, якщо вибирання та аналіз повторювати за таких же умов (отримуючи відмінний набір даних), включатиме істинне значення (генеральної сукупності) в 95 % всіх можливих випадків. Це не означає, що ймовірність перебування істинного значення в цьому довірчому інтервалі становить 95 %. З частотницької точки зору таке твердження не має сенсу, оскільки істинне значення не є випадковою змінною. Істинне значення або перебуває в даному інтервалі, або ні. Проте, істинним є те, що до того, як буде вибрано якісь дані, і за заданого плану побудови довірчого інтервалу, ймовірність того, що інтервал, який ще належить обчислити, покриватиме істинне значення, становить 95 %: в цей момент межі інтервалу є випадковими змінними, які ще належить проспостерігати. Одним із підходів, що видає інтервал, який можливо інтерпретувати як такий, що має задану ймовірність вміщування істинного значення, є застосування ймовірних інтервалів (англ. credible intervals) з баєсової статистики: цей підхід залежить від відмінного способу інтерпретування того, що мається на увазі під «імовірністю», а саме, баєсової ймовірності.
Довірчі інтервали, в принципі, можуть бути симетричними та асиметричними. Інтервал може бути асиметричним, бо він працює як нижня та верхня межі для параметру (лівобічний та правобічний інтервали), але він також може бути асиметричним, оскільки цей двобічний інтервал будують із порушенням симетрії навколо оцінки. Іноді межі асимптотичного інтервалу досягають асимптотично, й використовують їх для наближення істинних меж.
Значущість
Статистика рідко дає на аналізоване питання просту відповідь на кшталт Так/Ні. Інтерпретація часто зводиться до рівня статистичної значущості (англ. statistical significance), застосовуваного до чисел, і часто посилається на ймовірність значення, що точно відкидає нульову гіпотезу (яку іноді називають p-значенням).
Стандартним підходом є перевіряти нульову гіпотезу відносно альтернативної гіпотези. (Критична область) є множиною значень оцінювача, які ведуть до спростування нульової гіпотези. Ймовірність помилки I роду є відтак ймовірністю того, що оцінювач лежить у критичній області за умови, що нульова гіпотеза є істинною (статистична значущість), а ймовірність помилки II роду є ймовірністю того, що оцінювач не належить до критичної області за умови, що істинною є альтернативна гіпотеза. Статистична потужність (англ. statistical power) критерію є ймовірністю того, що він належним чином відхиляє нульову гіпотезу, коли ця нульова гіпотеза є хибною.
Посилання на статистичну значущість не обов'язково означає, що загальний результат є значущим в термінах реального світу. Наприклад, у великому дослідженні лікарського засобу може бути показано, що цей медикамент має статистично значущий, але дуже маленький сприятливий ефект, такий, що він навряд чи може помітно допомагати пацієнтові.
І хоча в принципі прийнятний рівень статистичної значущості може бути предметом обговорення, p-значення є найменшим рівнем значущості, який дозволяє критерію відхиляти нульову гіпотезу. Цей критерій є логічно рівнозначним твердженню, що p-значення є ймовірністю спостерігання результату, щонайменше настільки ж екстремального, як і статистика критерію, за умови, що нульова гіпотеза є істинною. Таким чином, що меншим є p-значення, то нижчою є ймовірність трапляння помилки I роду.
Деякі проблеми, зазвичай пов'язувані з цією системою (див. [en]):
- Відмінність, яка має високу статистичну значущість, може все одно не мати практичної значущості, але можливо належно формулювати критерії, щоби враховувати це. Одна з відповідей передбачає вихід за межі повідомляння лише рівня значущості, шляхом включання p-значення при звітуванні про відхилення чи прийняття гіпотези. Проте, p-значення не показує [en] чи важливості спостережуваного ефекту, а також може створювати враження перебільшеної важливості незначних відмінностей у великих дослідженнях. Кращим і все поширенішим підходом є повідомляти довірчі інтервали. Незважаючи на те, що їх отримують із тих же обчислень, що й статистичні критерії гіпотез та p-значення, вони описують розмір як самого ефекту, так і невизначеності, що його оточує.
- Хиба транспонованого обумовлення, вона ж помилка прокурора: критика виникає через те, що цей підхід перевірки гіпотез змушує віддавати перевагу одній з гіпотез (нульовій), оскільки оцінюють ймовірність спостережуваного результату за умови нульової гіпотези, а не ймовірність нульової гіпотези за спостереженого результату. Альтернативу цьому підходові запропоновано баєсовим висновуванням, хоча воно вимагає встановлювання апріорної ймовірності.
- Відхилення нульової гіпотези не доводить автоматично альтернативну гіпотезу.
- Як і все в індуктивній статистиці, вона покладається на розмір вибірки, й відтак за [en]p-значення може бути обчислювано сильно помилково.[]
Приклади
Деякі відомі статистичні критерії та процедури:
Розвідувальний аналіз даних
Розві́дувальний ана́ліз да́них (РАД, англ. exploratory data analysis, EDA) — це один з підходів до аналізу наборів даних для узагальнювання їхніх основних характеристик, часто за допомогою візуальних методів. Статистичну модель можуть використовувати чи ні, але в першу чергу РАД призначено, щоби побачити, що дані можуть сказати нам за межами формальної задачі моделювання та перевірки гіпотез.
Неналежне застосування
Детальніші відомості з цієї теми ви можете знайти в статті Неналежне застосування статистики.
Неналежне застосування статистики може спричинювати тонкі, але серйозні помилки в описі та інтерпретації — тонкі в тому сенсі, що навіть досвідчені фахівці можуть робити такі помилки, а серйозні в тому сенсі, що вони можуть призводити до руйнівних помилок в ухвалюванні рішень. Від належного застосування статистики залежать, наприклад, соціальна політика, медична практика та надійність таких споруд, як мости.
Навіть коли статистичні методики застосовують коректно, їхні результати можуть бути складними для інтерпретування для тих, кому бракує досвіду. Статистична значущість тенденції в даних, яка вимірює ступінь, до якого тенденцію може бути спричинено випадковою мінливістю вибірки, може узгоджуватися з інтуїтивним відчуттям її значущості, а може й не узгоджуватися. Набір базових статистичних навичок (та скептицизму), необхідних людям для належної роботи з інформацією у своєму повсякденному житті, називають [en].
Існує думка, що статистичні знання занадто часто цілеспрямовано застосовують неналежним чином, шукаючи шляхи інтерпретувати лише ті дані, що є сприятливими для доповідача. Недовіра та нерозуміння статистики пов'язані з цитатою «Існує три види брехні: брехня, нахабна брехня й статистика». Неналежне застосування статистики може бути як ненавмисним, так і навмисним, й ряд міркувань окреслено в книзі «Як брехати за допомогою статистики». В намаганні пролити світло на належне та неналежне застосування статистики проводять перегляди статистичних методик, використовуваних в певних областях (наприклад, Варн, Лазо, Рамос і Ріттер (2012)).
До способів запобігання неналежному застосуванню статистики належать застосування правильних діаграм та запобігання упередженню. Неналежне застосування може траплятися, коли висновки переузагальнюють, і претендують, що вони є репрезентативними для більшого, ніж вони є насправді, часто через навмисне або ненавмисне не враховування упередженості вибірки.Стовпчикові діаграми є, мабуть, найпростішими діаграмами для застосування та розуміння, й їх можливо робити вручну або за допомогою простих комп'ютерних програм. На жаль, більшість людей не дивляться на упередження та помилки, тож вони лишаються непоміченими. Таким чином, люди можуть часто вірити в те, що щось є істинним, навіть якщо воно не є достатньо репрезентативним. Щоби зібрані зі статистики дані були правдоподібними та точними, здійснювана вибірка мусить бути репрезентативною для генеральної сукупності в цілому. Згідно Гаффа, «Надійність вибірки може бути зруйновано [упередженістю]… дозволяйте собі певну міру скептицизму.»
Для допомоги в розумінні статистики Гафф запропонував ряд питань, які слід задавати в кожному випадку:
- Хто так каже? (Чи має він/вона корисливу мету?)
- Звідки він/вона знає? (Чи має він/вона ресурси, щоби знати ці факти?)
- Що упущено? (Чи надали він/вона повну картину?)
- Чи не змінив хтось тему? (Чи пропонують нам він/вона правильну відповідь на не ту задачу?)
- Чи має це сенс? (Чи є його/її висновок логічним та узгодженим з тим, що ми вже знаємо?)
[en], американський професор медицини, який викладає статистику студентам медичного профілю, автор ряду курсів та книг зі статистики та колишній редактор [en]», зазначає, що близько 50 % публікацій, які надходять в редакцію журналу, містять статистичні помилки отримання та обробки медичних даних. Основними причинами є недостовірність отриманих даних (неправильно поставлені експерименти або ж взяті непрезентабельні дані), а також незнання та неправильне застосування статистичних методів. Також він зазначає, що часто дослідник та особи, причетні до експерименту, можуть підсвідомо видавати бажане за дійсне. Причому ненавмисне підтасування даних може відбуватися як на етапі постановки експерименту, збору даних, так і на етапі аналізу даних. Виходом є максимальне врахування та усунення сторонніх чинників, які можуть вплинути на процес експерименту та на аналіз даних. Він пропонує якомога ширше використовувати «сліпий метод» чи навіть «подвійно сліпий метод», коли ані піддослідні, ані дослідники (чи помічники дослідників) достеменно не знають, що на якій групі хворих досліджується, і навіть аналіз даних бажано щоб робила особа, незацікавлена у некоректній інтерпретації даних, чи, ще краще, якщо вона буде необізнаною в конкретних деталях експерименту. В будь-якому разі, в постановці, зборі та аналізі даних повинні брати участь особи, які добре володіють прикладними статистичними методами.
Неналежна інтерпретація: кореляція
Поняття кореляції особливо привертає увагу потенційною плутаниною, яку воно може спричинювати. Статистичний аналіз набору даних часто виявляє, що дві змінні (властивості) досліджуваної генеральної сукупності мають схильність змінюватися разом, так, ніби вони пов'язані. Наприклад, дослідження річного доходу, яке також дивиться на вік смерті, може виявити, що тривалість життя в бідних людей схильна бути меншою, ніж у заможних. Про ці дві змінні кажуть, що вони корелюють, проте, вони можуть бути, а можуть і не бути причиною одна одної. Явище кореляції може бути спричинено третім, раніше не розгляданим явищем, що називають неявною змінною (англ. lurking variable) або змішувальною змінною (англ. confounding variable). З цієї причини немає можливості негайно зробити висновок про існування причинно-наслідкового зв'язку між цими двома змінними. (Див. корелювання не означає спричинювання.)
Застосування
Прикладна статистика, теоретична статистика та математична статистика
Прикладна статистика включає описову статистику та застосування індуктивної статистики.Теоретична статистика розглядає логічні аргументи, що лежать в основі обґрунтування підходів до статистичного висновування, а також охоплює математичну статистику. Математична статистика включає не лише маніпулювання розподілами ймовірності, необхідними, щоби виводити результати, пов'язані з методами оцінювання та висновування, але також і різні аспекти [en] та планування експериментів.
[en] можуть допомагати організаціям та компаніям, які не мають власної компетенції, що стосується їхніх конкретних питань.
Машинне навчання та добування даних
Моделі машинного навчання — це статистичні та ймовірнісні моделі, що фіксують закономірності в даних через застосування обчислювальних алгоритмів.
Статистика в академічнім середовищі
Статистику застосовують до широкого спектру академічних дисциплін, включно з природничими та суспільними науками, урядуванням та бізнесом. Бізнесова статистика застосовує статистичні методи в економетрії, аудиті, виробництві та операційній діяльності, включно з удосконаленням обслуговування та маркетинговими дослідженнями. В галузі біологічних наук 12-ма найчастішими статистичними критеріями є: дисперсійний аналіз (англ. ANOVA), критерій хі-квадрат, t-критерій Стьюдента, лінійна регресія, коефіцієнт кореляції Пірсона, U-критерій Манна — Уітні, [en], індекс різноманітності Шеннона, [en], кластерний аналіз, коефіцієнт кореляції рангу Спірмена та метод головних компонент.
Типовий курс статистики охоплює описову статистику, ймовірність, біноміальний та нормальний розподіли, перевірку гіпотез та довірчих інтервалів, лінійну регресію та кореляцію. Сучасні фундаментальні курси статистики для студентів останнього курсу зосереджуються на правильному обиранні критеріїв, інтерпретації результатів, та застосуванні [en].
Статистичні обчислення
Детальніші відомості з цієї теми ви можете знайти в статті [en].
На практику статистичної науки, починаючи з другої половини XX сторіччя, суттєво вплинуло швидке й стійке зростання обчислювальної потужності. Ранні статистичні моделі майже завжди походили з класу [en], але потужні комп'ютери, в поєднанні з відповідними чисельними алгоритмами, спричинили зростання зацікавлення [en] (такими як нейронні мережі), а також створення нових типів, таких як [en] та [en].
Збільшення обчислювальної потужності також призвело до зростання популярності обчислювально містких методів, що ґрунтуються на [en], таких як пермутаційний тест та натяжка, тоді як такі методики, як [en], зробили здійсненнішим застосування баєсових моделей. Комп'ютерна революція має наслідки для майбутнього статистики з новим акцентом на «експериментальній» та «емпіричній» статистиці. Наразі є доступною велика кількість [en] як загального, так і спеціального призначення. До прикладів доступного програмного забезпечення, здатного до складних статистичних обчислень, належать такі програми як Mathematica, [en], SPSS та R.
Застосування статистики в математиці та мистецтві
Традиційно статистика займалася висновуванням із застосуванням напівстандартизованої методології, що була «обов'язковою для вивчення» в більшості наук.[] Ця традиція змінилася із застосуванням статистики в не висновувальних контекстах. На те, що колись було нудною темою, обов'язковою для отримання ступеня в багатьох галузях, тепер дивляться з ентузіазмом.[] Висміювану спершу деякими математичними пуристами, її тепер вважають важливою методологією в певних областях.
- В теорії чисел точкові діаграми даних, породжуваних функцією розподілу, може бути перетворювано за допомогою звичних інструментів, які використовують у статистиці, щоби розкривати закономірності, що лежать в їх основі, що може потім вести до гіпотез.
- Методи статистики, включено з передбачувальними методами в прогнозуванні, поєднують з теорією хаосу та фрактальною геометрією, щоби створювати, як вважається, дуже красиві відео.[]
- [en]Джексона Поллока покладався на живописові експерименти, завдяки яким художньо розкривалися розподіли, що лежать в основі природи.[] З появою комп'ютерів для формалізування таких ведених розподілами природних процесів було застосовано статистичні методи для створення та аналізу анімованого відеомистецтва.[]
- Методи статистики можуть використовувати предикативно в мистецтві перформансу, як-от у фокусі з гральними картами, заснованому на марковському процесі, що працює лише деякий час, настання якого можливо передбачувати, використовуючи статистичну методологію.
- Статистику можливо використовувати для предикативного створювання творів мистецтва, як у статистичній або стохастичній музиці, винайденій Янісом Ксенакісом, де музика є залежною від кожного виконання. І хоч цей тип мистецтва не завжди виходить таким, як очікувалося, він поводиться таким чином, що є передбачуваним та налаштовуваним із застосуванням статистики.
Спеціалізовані дисципліни
Статистичні методики використовують в широкому спектрі типів наукових та суспільних досліджень, включно з біологічною статистикою, обчислювальною біологією, обчислювальною соціологією, [en], суспільствознавством, соціологією та суспільствознавчими дослідженнями. В деяких областях досліджень прикладну статистику використовують настільки широко, що вони мають спеціалізовану термінологію. До цих дисциплін належать:
- Актуарна математика (оцінює ризик в страховій та фінансовій галузях)
- [en] (статистичне оцінювання астрономічних даних)
- Біологічна статистика
- Географія та геоінформаційні системи, конкретно в просторовім аналізі
- Демографія (статистичне дослідження населення)
- Добування даних (застосування статистики та розпізнавання образів для виявляння знань в даних)
- Економетрія (статистичний аналіз економічних даних)
- Епідеміологія (статистичний аналіз захворюваності)
- Медична статистика
- Наука про дані
- Обробка зображень
- Політологія
- Прикладна інформаційна економіка
- [en]
- [en]
- [en]
- Статистична механіка
- [en]
- Хемометрія (для аналізу даних у хімії)
- [en] (право)
- Фізичне виховання та спорт
Крім того, існують певні типи статистичного аналізу, в яких також було розроблено свою власну спеціалізовану термінологію та методологію:
- Аналіз виживаності
- Багатовимірна статистика
- Методологія опитування
- [en]
- Натяжкова / складано-ножева [en]
- Статистична класифікація
- [en]
- Статистика в багатьох видах спорту, зокрема, у [en], відома як [en], та [en]
- Методи Тагучі
Статистика також є ключовим базовим інструментом у бізнесі та виробництві. Її використовують для розуміння варіативності систем вимірювання, керування процесами (як у статистичнім керуванні процесами, англ. statistical process control, SPC), узагальнювання даних, та для здійснення керованих даними рішень. В цих ролях вона є ключовим, і, можливо, єдиним надійним інструментом.
Див. також
- [en]
- Наука про дані
- [en]
- [en]
- [en]
- [en]
- [en] (програмного забезпечення)
- [en]
- [en]
- [en]
- Всесвітній день статистики
- Засади та головні області статистики
- [en]
- [en]
- [en]
- [en]
Література
- Карташов М. В. Імовірність, процеси, статистика. — Київ : ВПЦ Київський університет, 2007. — 504 с.
- Lydia Denworth, «A Significant Problem: Standard scientific methods are under fire. Will anything change?», Scientific American, vol. 321, no. 4 (October 2019), pp. 62–67. (англ.) «Використання p-значень протягом майже сторіччя [з 1925 року] для визначення статистичної значущості результатів експериментів посприяло ілюзії впевненості та кризі відтворюваності в багатьох наукових галузях. Існує все більша рішучість до реформування статистичного аналізу… Деякі [дослідники] пропонують змінювати статистичні методи, тоді як інші покінчили би з порогом для визначення „значущих“ результатів.» (с. 63)
- Barbara Illowsky; Susan Dean (2014). . OpenStax CNX. ISBN . Архів оригіналу за 21 липня 2021. Процитовано 13 вересня 2020. (англ.)
- Stockburger, David W. . [en] (вид. 3rd Web). Архів оригіналу за 28 травня 2020. (англ.)
- OpenIntro Statistics [ 16 червня 2019 у Wayback Machine.], 3rd edition by Diez, Barr, and Cetinkaya-Rundel (англ.)
- Stephen Jones, 2010. Statistics in Psychology: Explanations without Equations [ 27 липня 2020 у Wayback Machine.]. Palgrave Macmillan. . (англ.)
- Cohen, J (1990). (PDF). American Psychologist. 45: 1304—1312. doi:10.1037/0003-066x.45.12.1304. Архів оригіналу (PDF) за 18 жовтня 2017. (англ.)
- Gigerenzer, G (2004). Mindless statistics. Journal of Socio-Economics. 33: 587—606. doi:10.1016/j.socec.2004.09.033. (англ.)
- Ioannidis, J.P.A. (2005). Why most published research findings are false. PLoS Medicine. 2: 696—701. doi:10.1371/journal.pmed.0040168. PMC 1855693. PMID 17456002.
{{}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом () (англ.) - Нариси з історії статистики України / Авт. кол.: О. Г. Осауленко (гол. ред.), В. І. Карпов, М. В. Пугачова та ін.; Держкомстат України, НДІ статистики. — 2-е вид., випр. та доп. — К., 1999. — 188 с.: іл. — Бібліогр.: с. 147—152 (133 назви).
- Статистика: навчальний посібник / С. О. Матковский, М. Л. Вдовин, Т. В. Панчишин. — Львів: Видавничий центр ЛНУ імені Івана Франка, 2010. — 344 с.
- Статистика: навч. посіб. для студ. екон. спец. вищ. навч. закл. / С. О. Матковський, Л. І. Гальків, О. С. Гринькевич, О. З. Сорочак. — 2-ге вид., доповн. і виправл. — Л. : Новий Світ-2000, 2011. — 429, [3] с. : іл. — (Вища освіта в Україні). — Бібліогр. в кінці розділів. —
- Статистика: навч. посіб. / Р. В. Фещур, В. П. Кічор, А. Ф. Барвінський, М. Р. Тимощук ; М-во освіти і науки України, Нац. ун-т «Львів. політехніка». — 4-те вид., оновл. і доповн. — Л. : Бух. центр «Ажур», 2010. — 256 с. : іл., табл. — Бібліогр.: с. 251—252 (20 назв). —
- Статистика ринку товарів та послуг: Навч. посіб. / Л. І. Крамченко; Укоопспілка. — Л., 2002. — 188 c. — Бібліогр.: 32 назви.
Посилання
- (Електронна версія): TIBCO Software Inc. (2020). Data Science Textbook [ 14 серпня 2020 у Wayback Machine.]. (англ.)
- Online Statistics Education: An Interactive Multimedia Course of Study [ 15 серпня 2020 у Wayback Machine.]. (англ.) Розроблено Університетом Райса (провідний розробник), [en], Університетом Тафтса та Національним науковим фондом США.
- (англ.)
- Philosophy of Statistics [ 1 листопада 2020 у Wayback Machine.] від Стенфордської філософської енциклопедії (англ.)
- Орлов А. И. Прикладная статистика. Учебник [ 4 квітня 2013 у Wayback Machine.]. — М.: Издательство «Экзамен», 2004. — 656 с. (рос.)
- Учебно-методический комплекс дисциплины «Статистика» — часть 2(рос.)
Примітки
- . Архів оригіналу за 3 вересня 2020. Процитовано 13 вересня 2020. (англ.)
- Romijn, Jan-Willem (2014). . Stanford Encyclopedia of Philosophy. Архів оригіналу за 19 жовтня 2021. Процитовано 13 вересня 2020. (англ.)
- . Архів оригіналу за 22 листопада 2020. Процитовано 13 вересня 2020. (англ.)
- Статистика [ 2 грудня 2020 у Wayback Machine.] // Юридична енциклопедія : [у 6 т.] / ред. кол.: Ю. С. Шемшученко (відп. ред.) [та ін.]. — К. : Українська енциклопедія ім. М. П. Бажана, 2003. — Т. 5 : П — С. — 736 с. — .
- Dodge, Y. (2006) The Oxford Dictionary of Statistical Terms, Oxford University Press. (англ.)
- Lund Research Ltd. . statistics.laerd.com. Архів оригіналу за 26 жовтня 2020. Процитовано 23 березня 2014. (англ.)
- Романчиков, В.І. (2007). (PDF). К.: Центр учбової літератури. с. 132, 146. Архів оригіналу (PDF) за 29 листопада 2020. Процитовано 13 вересня 2020.
- . About.com Education. Архів оригіналу за 27 лютого 2017. Процитовано 27 листопада 2015. (англ.)
- Broemeling, Lyle D. (1 листопада 2011). An Account of Early Statistical Inference in Arab Cryptology. The American Statistician. 65 (4): 255—257. doi:10.1198/tas.2011.10191. (англ.)
- (2000). (вид. 1st Anchor Books). New York: Anchor Books. ISBN . (англ.)
- Ibrahim A. Al-Kadi «The origins of cryptology: The Arab contributions», [en], 16(2) (April 1992) pp. 97–126. (англ.)
- . Answers Consulting. 3 лютого 2018. Архів оригіналу за 21 липня 2018. Процитовано 13 вересня 2020. (англ.)
- Moses, Lincoln E. (1986) Think and Explain with Statistics, Addison-Wesley, . pp. 1–3 (англ.)
- Hays, William Lee, (1973) Statistics for the Social Sciences, Holt, Rinehart and Winston, p.xii, (англ.)
- Moore, David (1992). Teaching Statistics as a Respectable Subject. У F. Gordon; S. Gordon (ред.). Statistics for the Twenty-First Century. Washington, DC: The Mathematical Association of America. с. 14–25. ISBN . (англ.)
- ; Rossman, Allan J. (2005). (PDF). Investigating Statistical Concepts, Applications, and Methods. Duxbury Press. ISBN . Архів оригіналу (PDF) за 22 листопада 2020. Процитовано 13 вересня 2020. (англ.)
- Lakshmikantham, ed. by D. Kannan, V. (2002). Handbook of stochastic analysis and applications. New York: M. Dekker. ISBN . (англ.)
- Schervish, Mark J. (1995). Theory of statistics (вид. Corr. 2nd print.). New York: Springer. ISBN . (англ.)
- Willcox, Walter (1938) "The Founder of Statistics". Review of the International Statistical Institute 5(4): 321–328. JSTOR 1400906 (англ.)
- J. Franklin, The Science of Conjecture: Evidence and Probability before Pascal, Johns Hopkins Univ Pr 2002 (англ.)
- Helen Mary Walker (1975). . Arno Press. ISBN . Архів оригіналу за 27 липня 2020. Процитовано 13 вересня 2020. (англ.)
- Galton, F (1877). Typical laws of heredity. Nature. 15 (388): 492—553. Bibcode:1877Natur..15..492.. doi:10.1038/015492a0. (англ.)
- Stigler, S.M. (1989). Francis Galton's Account of the Invention of Correlation. Statistical Science. 4 (2): 73—79. doi:10.1214/ss/1177012580. (англ.)
- Pearson, K. (1900). . Philosophical Magazine. Series 5. 50 (302): 157—175. doi:10.1080/14786440009463897. Архів оригіналу за 18 серпня 2020. Процитовано 13 вересня 2020. (англ.)
- . Department of Statistical Science – University College London. Архів оригіналу за 25 вересня 2008. (англ.)
- Fisher|1971|loc=Chapter II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment, Section 8. The Null Hypothesis (англ.)
- OED quote: 1935 R.A. Fisher, [en] ii. 19, "We may speak of this hypothesis as the 'null hypothesis', and the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation." (англ.)
- Box, JF (February 1980). R.A. Fisher and the Design of Experiments, 1922–1926. [en]. 34 (1): 1—7. doi:10.2307/2682986. JSTOR 2682986. (англ.)
- Yates, F (June 1964). Sir Ronald Fisher and the Design of Experiments. [en]. 20 (2): 307—321. doi:10.2307/2528399. JSTOR 2528399. (англ.)
- Stanley, Julian C. (1966). The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later. American Educational Research Journal. 3 (3): 223—229. doi:10.3102/00028312003003223. JSTOR 1161806. (англ.)
- Agresti, Alan; David B. Hichcock (2005). (PDF). Statistical Methods & Applications. 14 (3): 298. doi:10.1007/s10260-005-0121-y. Архів оригіналу (PDF) за 19 грудня 2013. Процитовано 13 вересня 2020. (англ.)
- Edwards, A.W.F. (1998). Natural Selection and the Sex Ratio: Fisher's Sources. American Naturalist. 151 (6): 564—569. doi:10.1086/286141. PMID 18811377. (англ.)
- Fisher, R.A. (1915) The evolution of sexual preference. Eugenics Review (7) 184:192 (англ.)
- Fisher, R.A. (1930) [en]. (англ.)
- Edwards, A.W.F. (2000) Perspectives: Anecdotal, Historial and Critical Commentaries on Genetics. The Genetics Society of America (154) 1419:1426 (англ.)
- Andersson, Malte (1994). . Princeton University Press. ISBN . Архів оригіналу за 27 липня 2020. Процитовано 13 вересня 2020. (англ.)
- Andersson, M. and Simmons, L.W. (2006) Sexual selection and mate choice. Trends, Ecology and Evolution (21) 296:302 (англ.)
- Gayon, J. (2010) Sexual selection: Another Darwinian process. Comptes Rendus Biologies (333) 134:144 (англ.)
- Neyman, J (1934). On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection. [en]. 97 (4): 557—625. doi:10.2307/2342192. JSTOR 2342192. (англ.)
- . Santa Fe Institute. Архів оригіналу за 30 травня 2016. Процитовано 13 вересня 2020. (англ.)
- Wolfram, Stephen (2002). A New Kind of Science. Wolfram Media, Inc. с. 1082. ISBN . (англ.)
- [en] (2005) Statistical Models: Theory and Practice, Cambridge University Press. (англ.)
- McCarney R, Warner J, Iliffe S, van Haselen R, Griffin M, Fisher P (2007). The Hawthorne Effect: a randomised, controlled trial. BMC Med Res Methodol. 7 (1): 30. doi:10.1186/1471-2288-7-30. PMC 1936999. PMID 17608932.
{{}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом () (англ.) - Rothman, Kenneth J; Greenland, Sander; Lash, Timothy, ред. (2008). 7. Modern Epidemiology (English) (вид. 3rd). Lippincott Williams & Wilkins. с. 100. (англ.)
- ; Tukey, J.W (1977). Data analysis and regression. Boston: Addison-Wesley. (англ.)
- [en] (1990). The knowledge needed to computerise the analysis and interpretation of statistical information. In Expert systems and artificial intelligence: the need for information about data. Library Association Report, London, March, 23–27. (англ.)
- Chrisman, Nicholas R (1998). Rethinking Levels of Measurement for Cartography. Cartography and Geographic Information Science. 25 (4): 231—242. doi:10.1559/152304098782383043. (англ.)
- van den Berg, G. (1991). Choosing an analysis method. Leiden: DSWO Press (англ.)
- Hand, D.J. (2004). Measurement theory and practice: The world through quantification. London: Arnold. (англ.)
- Mann, Prem S. (1995). Introductory Statistics (вид. 2nd). Wiley. ISBN . (англ.)
- (PDF). Сумський державний університет, Кафедра прикладної математики та моделювання складних систем факультету електроніки та інформаційних технологій. Архів оригіналу (PDF) за 29 серпня 2020. Процитовано 30 серпня 2020.
- Upton, G., Cook, I. (2008) Oxford Dictionary of Statistics, OUP. . (англ.)
- Piazza Elio, Probabilità e Statistica, Esculapio 2007 (італ.)
- Everitt, Brian (1998). The Cambridge Dictionary of Statistics. Cambridge, UK New York: Cambridge University Press. ISBN . (англ.)
- . YourStatsGuru.com. Архів оригіналу за 5 вересня 2015. Процитовано 13 вересня 2020. (англ.)
- Rubin, Donald B.; Little, Roderick J.A., Statistical analysis with missing data, New York: Wiley 2002 (англ.)
- (2005). Why Most Published Research Findings Are False. PLOS Medicine. 2 (8): e124. doi:10.1371/journal.pmed.0020124. PMC 1182327. PMID 16060722.
{{}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом () (англ.) - Ратинський, В.В. (2013). (PDF). Інноваційна економіка. 47 (9). Архів оригіналу (PDF) за 5 вересня 2020. Процитовано 5 вересня 2020.
- Huff, Darrell (1954) How to Lie with Statistics, WW Norton & Company, Inc. New York. (англ.)
- Warne, R. Lazo; Ramos, T.; Ritter, N. (2012). Statistical Methods Used in Gifted Education Journals, 2006–2010. Gifted Child Quarterly. 56 (3): 134—149. doi:10.1177/0016986212444122. (англ.)
- Drennan, Robert D. (2008). Statistics in archaeology. У Pearsall, Deborah M. (ред.). Encyclopedia of Archaeology. Elsevier Inc. с. 2093–2100. ISBN . (англ.)
- Cohen, Jerome B. (December 1938). Misuse of Statistics. Journal of the American Statistical Association. JSTOR. 33 (204): 657—674. doi:10.1080/01621459.1938.10502344. (англ.)
- (1988). Modern Elementary Statistics. Credo Reference. (англ.)
- Huff, Darrell; Irving Geis (1954). How to Lie with Statistics. New York: Norton.
The dependability of a sample can be destroyed by [bias]... allow yourself some degree of skepticism.
(англ.) - Стентон Гланц Медико-биологическая статистика — М., Практика, 1998. — С.405-406 (рос.)
- Nikoletseas, M.M. (2014) "Statistics: Concepts and Examples." (англ.)
- Anderson, D.R.; Sweeney, D.J.; Williams, T.A. (1994) Introduction to Statistics: Concepts and Applications, pp. 5–9. West Group. (англ.)
- . Journal of Business & Economic Statistics. Taylor & Francis. Архів оригіналу за 27 липня 2020. Процитовано 16 березня 2020. (англ.)
- Natalia Loaiza Velásquez, María Isabel González Lutz & Julián Monge-Nájera (2011). (PDF). Revista Biología Tropical. 59: 983—992. Архів оригіналу (PDF) за 19 жовтня 2020. Процитовано 13 вересня 2020. (англ.)
- Pekoz, Erol (2009). The Manager's Guide to Statistics. Erol Pekoz. ISBN . (англ.)
- . Архів оригіналу за 19 січня 2018. Процитовано 18 січня 2018.
- Aliberti, Sara; D'Elia, Francesca; Cherubini, Domenico (2023). Tips for Statistical Tools for Research Methods in Exercise and Sport Sciences. Physical Education Theory and Methodology. 23(3): 470—477. doi:10.17309/tmfv.2023.3.20. ISSN 1993-7989.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya pro naukovu disciplinu Pro chiselnu funkciyu vid vibirki div Statistika matematika Syudi perenapravlyayetsya zapit Statistik Na cyu temu potribna okrema stattya Stati stika angl statistics ce disciplina sho pracyuye nad zbirannyam organizuvannyam analizom interpretuvannyam ta predstavlennyam danih V zastosuvanni statistiki do naukovoyi promislovoyi abo socialnoyi zadachi ye zvichnim pochinati z generalnoyi sukupnosti angl statistical population abo statistichnoyi modeli dlya doslidzhennya Generalni sukupnosti mozhut buti riznomanitnimi grupami lyudej abo ob yektiv takimi yak vsi lyudi sho zhivut v yakijs krayini abo kozhen z atomiv sho skladayut kristal Statistika pracyuye zi vsima aspektami danih vklyuchno z planuvannyam zbirannya danih v terminah planuvannya obstezhen angl surveys ta eksperimentiv Div en Normalnij rozpodil duzhe poshirena gustina jmovirnosti korisna cherez centralnu granichnu teoremu Tochkovi diagrami v opisovij statistici vikoristovuyut shobi pokazuvati sposterezhuvani vzayemozv yazki mizh riznimi zminnimi tut iz zastosuvannyam naboru danih irisiv Fishera Koli zibrati dani perepisu angl census nemozhlivo statistiki zbirayut dani rozroblyayuchi specialni plani eksperimentiv angl experiment designs ta vibirki angl samples dlya obstezhuvannya Reprezentativne vibirannya zabezpechuye mozhlivist rozumnogo rozshirennya visnovkiv ta rishen z ciyeyi vibirki na sukupnist v cilomu Eksperimentalne doslidzhennya angl experimental study vklyuchaye zdijsnennya vimiryuvan doslidzhuvanoyi sistemi manipulyuvannya ciyeyu sistemoyu a potim zdijsnennya dodatkovih vimiryuvan iz zastosuvannyam tiyeyi zh proceduri shobi viznachiti chi zminilo manipulyuvannya znachennya cih vimiryuvan Na protivagu comu en angl observational study ne vklyuchaye eksperimentalnogo manipulyuvannya V analizi danih vikoristovuyut dva osnovni statistichni metodi opisovu statistiku angl descriptive statistics yaka uzagalnyuye dani z vibirki iz zastosuvannyam en takih yak serednye znachennya ta standartne vidhilennya ta induktivnu statistiku angl inferential statistics yaka robit visnovki z danih sho piddayutsya vipadkovij minlivosti napriklad pohibkam sposterezhen variyuvannyu vibirki Opisova statistika chasto najbilshe cikavitsya dvoma naborami vlastivostej rozpodilu vibirki abo zagalnoyi sukupnosti centralna tendenciya abo polozhennya pragne sharakterizuvati centralne abo tipove znachennya cogo rozpodilu todi yak dispersiya abo minlivist harakterizuye miru do yakoyi chleni cogo rozpodilu vidhilyayutsya vid jogo centru ta odin vid odnogo Visnovuvannya v matematichnij statistici zdijsnyuyut v ramkah teoriyi jmovirnostej sho zajmayetsya analizom vipadkovih yavish Standartna statistichna procedura vklyuchaye zbirannya danih sho vede do perevirki vzayemozv yazku mizh dvoma naborami statistichnih danih abo naborom danih ta sintetichnimi danimi otrimanimi z idealizovanoyi modeli Dlya statistichnogo vzayemozv yazku mizh dvoma naborami danih proponuyut gipotezu i porivnyuyut yiyi yak en z idealizovanoyu nulovoyu gipotezoyu angl null hypothesis pro vidsutnist vzayemozv yazku mizh cimi dvoma naborami danih Vidhilyannya abo sprostuvannya nulovoyi gipotezi zdijsnyuyut iz zastosuvannyam statistichnih kriteriyiv angl statistical tests sho kilkisno virazhayut sens v yakomu hibnist nulovoyi gipotezi mozhlivo vvazhati dovedenoyu za nadanih danih yaki vikoristovuyut v cij perevirci Pracyuyuchi vid nulovoyi gipotezi rozpiznayu t dva osnovni vidi pomilok pomilki I rodu nulovu gipotezu hibno vidhilyayut sho daye hibno pozitivne angl false positive ta pomilki II rodu nulovu gipotezu ne vdayetsya vidhiliti j spravzhnij vzayemozv yazok mizh sukupnostyami vtrachayetsya sho daye hibno negativne angl false negative Z ciyeyu sistemoyu viyavilosya pov yazano chislenni problemi vid otrimuvannya dostatnogo rozmiru vibirki j do vkazuvannya adekvatnoyi nulovoyi gipotezi dzherelo Procesi vimiryuvannya sho porodzhuyut statistichni dani takozh piddayutsya pomilkam Bagato z cih pomilok klasifikuyut yak vipadkovi shum angl noise abo sistematichni uperedzhennya angl bias ale mozhut traplyatisya j inshi tipi pomilok napriklad promahi angl blunder taki yak koli analitik povidomlyaye nepravilni odinici vimiryuvannya Isnuvannya en abo en mozhe prizvoditi do uperedzhenih ocinok j dlya podolannya cih problem bulo rozrobleno specialni metodiki Najranishi praci z imovirnosti ta statistiki statistichnih metodiv sho spirayutsya na teoriyu jmovirnostej shodyat do arabskih matematikiv ta en zokrema Al Halilya 717 786 ta Al Kindi 801 873 U XVIII storichchi statistika takozh pochala silno zhivitisya z diferencialnogo ta integralnogo chislennya Ostannimi rokami dlya viroblennya cih kriteriyiv takih yak opisovij analiz statistika pokladalasya bilshe na statistichne programne zabezpechennya VstupDokladnishe Naris teoriyi statistiki Statistika ce matematichnij masiv naukovih znan sho stosuyutsya zbirannya analizu interpretuvannya abo poyasnyuvannya ta predstavlennya danih abo odna z galuzej matematiki Dehto vvazhaye statistiku radshe okremoyu matematichnoyu naukoyu nizh galuzzyu matematiki V toj chas yak danimi koristuyutsya bagato naukovih doslidzhen statistika zajmayetsya vikoristannyam danih v konteksti neviznachenosti ta uhvalyuvannyam rishen v umovah neviznachenosti V zastosuvanni statistiki do zadachi zvichnoyu praktikoyu ye pochinati z sukupnosti abo procesu dlya doslidzhennya Sukupnosti mozhut buti riznomanitnoyi tematiki taki yak vsi lyudi sho meshkayut u krayini abo kozhen z atomiv sho skladayut kristal V ideali statistiki zbirayut dani pro vsyu sukupnist operaciya zvana perepisom Ce mozhe buti zorganizovano derzhavnimi statistichnimi ustanovami Opisovu statistiku mozhlivo vikoristovuvati dlya uzagalnyuvannya danih pro sukupnist Do chiselnih opisuvachiv dlya neperervnih tipiv danih takih yak dohid nalezhat serednye znachennya ta standartne vidhilennya todi yak v terminah opisuvannya kategorijnih danih takih yak osvita korisnishimi ye chastota ta vidsotok Koli perepis ye nezdijsnennim doslidzhuyut obranu pidmnozhinu sukupnosti zvanu vibirkoyu angl sample Shojno viznacheno vibirku yaka dlya ciyeyi sukupnosti ye reprezentativnoyu dani dlya chleniv ciyeyi vibirki zbirayut u sposterezhnij abo eksperimentalnij postanovci Znov taki dlya uzagalnyuvannya cih vibirkovih danih mozhlivo zastosovuvati opisovu statistiku Prote vibirannya vibirki malo elementi vipadkovosti tozh vstanovleni chiselni opisuvachi z ciyeyi vibirki zalezhat vid vipadkovosti Shobi vse zh taki robiti zmistovni visnovki pro sukupnist v cilomu potribna induktivna statistika Vona vikoristovuye zakonomirnosti v danih vibirki shobi robiti visnovki pro predstavlenu neyu sukupnist z urahuvannyam vipadkovosti Ci visnovki mozhut nabuvati viglyadu vidpovidannya na pitannya tak ni pereviryannya gipotez angl hypothesis testing ocinyuvannya chiselnih harakteristik danih ocinyuvannya angl estimation opisuvannya pov yazanostej angl associations v danih korelyaciya ta modelyuvannya vzayemozv yazkiv vseredini danih napriklad iz zastosuvannyam regresijnogo analizu Visnovuvannya mozhe rozshiryuvatisya do prognozuvannya peredbachuvannya ta ocinyuvannya nesposterezhuvanih zminnih chi to vseredini doslidzhuvanoyi sukupnosti chi pov yazanih iz neyu do nogo mozhut nalezhati ekstrapolyuvannya ta interpolyuvannya chasovih ryadiv ta prostorovih danih a takozh dobuvannya danih Matematichna statistika Dokladnishe Matematichna statistika Matematichna statistika ce zastosuvannya matematiki do statistiki Do matematichnih metodik yaki dlya cogo vikoristovuyut nalezhat matematichnij analiz linijna algebra stohastichnij analiz diferencialni rivnyannya ta en IstoriyaDzhirolamo Kardano pioner matematiki jmovirnosti Detalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en ta en Najranishi praci z imovirnosti ta statistiki shodyat do arabskih matematikiv ta en Zolotoyi dobi islamu mizh VIII ta XIII storichchyami Al Halil 717 786 napisav Knigu tayemnoyi movi sho mistit pershe zastosuvannya en z metoyu perelichuvannya vsih arabskih sliv z golosnimi ta bez nih Najranishoyu knigoyu zi statistiki ye Traktat pro deshifruvannya kriptografichnih povidomlen napisanij arabskim vchenim Al Kindi 801 873 U svoyij knizi Al Kindi naviv dokladnij opis togo yak zastosovuvati statistiku ta chastotnij analiz dlya rozshifrovuvannya zashifrovanih povidomlen Cej tekst zaklav osnovi statistiki ta kriptoanalizu Al Kindi takozh zdijsniv najranishe z vidomih zastosuvannya statistichnogo visnovuvannya todi yak piznishi arabski kriptografi rozrobili ranni statistichni metodi dlya rozkodovuvannya zashifrovanih povidomlen en 1187 1268 piznishe zrobiv vazhlivij vnesok stosovno zastosuvannya v chastotnomu analizi rozmiru vibirki Najranishi yevropejski praci zi statistiki shodyat do 1663 roku publikaciyi Prirodni ta politichni sposterezhennya na spiskah pomerlih Dzhona Graunta Ranni zastosuvannya statistichnogo mislennya obertalisya dovkola potreb derzhav lat statum gruntuvati politiku na demografichnih ta ekonomichnih danih zvidsi en Na pochatku XIX storichchya sfera disciplini statistiki rozshirilasya vklyuchivshi zbirannya ta analiz danih v cilomu Nateper statistiku shiroko zastosovuyut v uryaduvanni biznesi a takozh prirodnichih ta socialnih naukah Matematichni osnovi suchasnoyi statistiki bulo zakladeno v XVII storichchi z rozrobkoyu Dzhirolamo Kardanom Blezom Paskalem ta P yerom Ferma teoriyi jmovirnostej Matematichna teoriya jmovirnostej postala z doslidzhen igor vipadku hoch ponyattya jmovirnosti j bulo vzhe doslidzheno v serednovichnomu pravi ta filosofami takimi yak Huan Karamuel Metod najmenshih kvadrativ bulo vpershe opisano Adriyenom Mari Lezhandrom 1805 roku Karl Pirson zasnovnik matematichnoyi statistiki Suchasna galuz statistiki vinikla naprikinci XIX pochatku XX storichchya v tri etapi Pershu hvilyu na rubezhi storich ocholila pracya Frensisa Goltena ta Karla Pirsona yaki peretvorili statistiku na strogu matematichnu disciplinu yaku vikoristovuvali dlya analizu i ne lishe v nauci ale takozh i v promislovosti ta politici Do vnesku Goltena nalezhat vvedennya ponyat standartnogo vidhilennya korelyaciyi regresijnogo analizu ta zastosuvannya cih metodiv do doslidzhennya rozmayittya lyudskih harakteristik zrostu vagi dovzhini vij tosho Pirson sered inshogo rozrobiv koeficiyent korelyaciyi momentu dobutku Pirsona viznachenij yak moment dobutku metod momentiv dlya dopasovuvannya rozpodiliv do vibirok ta en Golten ta Pirson zasnuvali en yak pershij zhurnal z matematichnoyi statistiki ta biostatistiki yaku todi nazivali biometriyeyu j piznishe zasnuvali pershij v sviti universitetskij statistichnij fakultet v Universitetskim koledzhi Londona Ronald Fisher pid chas eksperimentu pani degustuye chaj zakarbuvav termin nulova gipoteza yaku nikoli ne dovodyat ta ne vstanovlyuyut ale mozhlivo sprostovuyut v hodi eksperimentu Pochatok drugij hvili 1910 h ta 20 h rokiv poklav en j vona dosyagla svoyeyi kulminaciyi v osyayannyah Ronalda Fishera yakij napisav pidruchniki sho mali viznachiti cyu akademichnu disciplinu v universitetah po vsomu sviti Najvazhlivishimi publikaciyami Fishera buli jogo zasadnicha pracya 1918 roku en yaka bula pershoyu de bulo zastosovano statistichnij termin dispersiya angl variance jogo klasichna pracya 1925 roku en ta jogo en 1935 roku de vin rozrobiv strogi modeli planuvannya eksperimentiv Vin zapochatkuvav ponyattya dostatnosti en linijnogo rozriznyuvacha Fishera ta informaciyi za Fisherom U svoyij knizi 1930 roku en vin zastosuvav statistiku do riznih biologichnih ponyat takih yak princip Fishera sho jogo en nazvav imovirno najviznachnishim argumentom v evolyucijnij biologiyi ta fisherova nekontrolovanist ponyattya v statevim dobori pro afekt nekontrolovanogo zvorotnogo zv yazku sho vinikaye v evolyuciyi Zaklyuchna hvilya yaka perevazhno bachila vdoskonalennya ta rozshirennya poperednih rozrobok vinikla v rezultati spilnoyi praci Egona Pirsona ta Yezhi Nejmana v 1930 h rokah Voni vveli ponyattya pomilki II rodu statistichnoyi potuzhnosti kriteriyu angl power of a test ta dovirchih intervaliv Yezhi Nejman 1934 roku pokazav sho stratifikovane vipadkove vibirannya bulo v cilomu krashim metodom ocinyuvannya anizh vibirannya cilespryamovane kvotne Sogodni statistichni metodi zastosovuyut v usih oblastyah yaki peredbachayut uhvalyuvannya rishen shobi otrimuvati tochni visnovki z konsolidovanogo masivu danih dlya uhvalyuvannya rishen v umovah neviznachenosti na osnovi statistichnoyi metodologiyi Vikoristannya suchasnih komp yuteriv forsuvalo velikomasshtabni statistichni obchislennya j takozh umozhlivilo novi metodi sho ye nedocilnimi dlya vikonannya vruchnu Statistika prodovzhuye buti oblastyu aktivnih doslidzhen napriklad shodo problemi analizu velikih danih Statistichni daniDokladnishe Statistichni dani Zbirannya danih Vibirannya Koli zibrati dani povnogo perepisu nemozhlivo statistiki zbirayut vibirkovi dani rozroblyayuchi osoblivi plani eksperimentiv ta en Statistika sama po sobi takozh proponuye instrumenti dlya peredbachuvannya ta prognozuvannya za dopomogoyu statistichnih modelej Ideya robiti visnovki na osnovi vibirkovih danih vinikla blizko seredini 1600 h u zv yazku z ocinyuvannyam chiselnosti naselennya ta rozrobki predtech strahuvannya zhittya Shobi vikoristovuvati vibirku yak vzirec dlya vsiyeyi sukupnosti vazhlivo shobi vona spravdi predstavlyala generalnu sukupnist Reprezentativne vibirannya zabezpechuye mozhlivist bezpechnogo rozshirennya visnovkiv ta rishen z ciyeyi vibirki na sukupnist v cilomu Osnovna problema polyagaye u viznacheni miri do yakoyi obrana vibirka ye naspravdi reprezentativnoyu Statistika proponuye metodi dlya ocinyuvannya ta vipravlyannya bud yakih uperedzhen u vibirci ta procedurah zbirannya danih Takozh isnuyut metodi planuvannya eksperimentiv dlya takih eksperimentiv sho mozhut zmenshuvati ci problemi na pochatku doslidzhennya pidsilyuyuchi jogo zdatnist rozpiznavati istinu stosovno generalnoyi sukupnosti Teoriya vibirannya ye chastinoyu matematichnoyi disciplini teoriyi jmovirnosti Jmovirnist vikoristovuyut v matematichnij statistici shobi doslidzhuvati vibirkovi rozpodili vibirkovih statistik ta zagalnishe vlastivosti statistichnih procedur Vikoristannya bud yakogo statistichnogo metodu ye pravilnim koli sistema abo sukupnist yaku rozglyadayut zadovolnyaye pripushennya cogo metodu Riznicya v poglyadah klasichnoyi teoriyi jmovirnosti ta teoriyi vibirannya grubo polyagaye v tim sho teoriya jmovirnosti pochinaye z zadanih parametriv generalnoyi sukupnosti dlya deduktivnogo vivedennya jmovirnostej pritamannih vibirkam Prote statistichne visnovuvannya ruhayetsya v protilezhnomu napryamku induktivno vivodyachi z vibirok parametri bilshoyi abo generalnoyi sukupnosti Eksperimentalni ta sposterezhni doslidzhennya Zagalnoyu metoyu statistichnogo doslidnickogo proyektu ye doslidzhennya prichinnosti j zokrema visnovuvannya stosovno vplivu zmin znachen peredbachuvachiv chi nezalezhnih zminnih na zalezhni zminni Isnuye dva osnovni tipi prichinnisnih statistichnih doslidzhen eksperimentalni doslidzhennya ta en V oboh tipah doslidzhen sposterigayut za vplivom vidminnosti v nezalezhnij zminnij abo zminnih na povedinku zalezhnoyi zminnoyi Riznicya mizh cimi dvoma tipami polyagaye v tim yak faktichno zdijsnyuyut doslidzhennya Kozhen z nih mozhe buti duzhe diyevim Eksperimentalne doslidzhennya vklyuchaye vimiryuvannya doslidzhuvanoyi sistemi manipulyuvannya ciyeyu sistemoyu a potim zdijsnennya novih vimiryuvan z vikoristannyam tiyeyi zh proceduri shobi viznachiti chi zminilo ce manipulyuvannya znachennya vimiryuvan Na protivagu comu sposterezhne doslidzhennya ne mistit eksperimentalnogo manipulyuvannya Natomist zbirayut dani ta doslidzhuyut korelyaciyi mizh peredbachuvachami ta vidgukami J hoch instrumenti analizu danih najkrashe pracyuyut na danih z randomizovanih doslidzhen yih takozh zastosovuyut i do inshih tipiv danih takih yak prirodni eksperimenti ta en dlya yakih statistik vikoristovuvatime vidozminenij strukturovanishij metod ocinyuvannya napriklad sered bagatoh inshih en ta instrumentalni zminni sho viroblyatime slushni ocinyuvachi Eksperimenti Osnovnimi etapami statistichnogo eksperimentu ye Planuvannya doslidzhennya vklyuchno zi znahodzhennyam chisla povtoryuvan doslidzhennya iz zastosuvannyam nastupnoyi informaciyi poperednih ocinok stosovno rozmiru en en ta ocinyuvanoyi eksperimentalnoyi minlivosti Neobhidnim ye rozglyad viboru ob yektiv eksperimentu ta etiki doslidzhennya Statistiki radyat shob eksperimenti porivnyuvali shonajmenshe odin novij vpliv zi standartnim vplivom abo keruvannyam shobi umozhliviti neuperedzhenu ocinku vidminnosti efektiv vplivu Planuvannya eksperimentiv iz zastosuvannyam grupuvannya shobi znizhuvati vpliv zmishuvalnih zminnih ta en vpliviv do ob yektiv shobi umozhlivlyuvati efektiv vpliviv ta eksperimentalnoyi pohibki Na comu etapi eksperimentatori ta statistiki pishut protokol eksperimentu angl experimental protocol sho keruvatime vikonannyam eksperimentu j sho viznachatime pervinnij analiz angl primary analysis eksperimentalnih danih Vikonannya eksperimentu zgidno protokolu eksperimentu ta analizuvannya danih zgidno protokolu eksperimentu Podalshe vivchennya naboru danih u vtorinnih analizah z metoyu visuvannya novih gipotez dlya majbutnogo vivchennya Dokumentuvannya ta predstavlennya rezultativ doslidzhennya Eksperimenti z lyudskoyu povedinkoyu nesut osoblivi turboti V znamenitim Gotornskim doslidzhenni vivchali zmini do robochogo seredovisha na Gotornskim zavodi kompaniyi Western Electric Doslidnikiv cikavilo viznachiti chi prizvede zbilshennya osvitlennya do zbilshennya produktivnosti pracivnikiv en Doslidniki spochatku vimiryali produktivnist zavodu potim zminili osvitlennya v odnij oblasti zavodu j perevirili chi vplinuli ci zmini v osvitlenni na produktivnist Viyavilosya sho produktivnist i spravdi pokrashilasya v eksperimentalnih umovah Prote ce doslidzhennya sogodni silno kritikuyut cherez pomilki v procedurah eksperimentu osoblivo cherez brak kontrolnoyi grupi ta slipoti Gotornskij efekt stosuyetsya viyavlennya togo sho rezultat v comu vipadku produktivnist pracivnikiv zminivsya cherez same sposterezhennya Piddoslidni v Gotornskim doslidzhenni stali produktivnishimi ne cherez zminu osvitlennya a cherez te sho za nimi sposterigali Sposterezhne doslidzhennya Prikladom sposterezhnogo doslidzhennya ye take sho vivchaye pov yazanist palinnya ta raku legeniv Cej tip doslidzhennya zazvichaj vikoristovuye opituvannya dlya zbirannya sposterezhen pro cilovu oblast i potim vikonuye statistichnij analiz V comu vipadku doslidniki zbirali bi sposterezhennya yak pro kurciv tak i pro ne kurciv pevno shlyahom kogortnogo doslidzhennya a potim divilisya bi na chislo vipadkiv raku legeniv u kozhnij z grup Inshim tipom sposterezhnogo doslidzhennya ye doslidzhennya vipadok kontrol v yakomu zaproshuyut vzyati uchast lyudej z ta bez cilovogo rezultatu napriklad raku legeniv i zbirayut yihni istoriyi piddavannya vplivovi Tipi danih Detalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en ta Shkala Isnuvalo chimalo sprob virobiti taksonomiyu shkal vimiryuvannya Psiholog en viznachiv nominalnu angl nominal poryadkovu angl ordinal intervalnu angl interval shkali ta shkalu vidnoshen angl ratio scale Nominalni vimiryuvannya ne mayut zmistovnogo poryadku ranzhuvannya yihnih znachen j dozvolyayut bud yake peretvorennya odin v odnogo in yektivne Poryadkovi vimiryuvannya mayut netochni vidminnosti mizh poslidovnimi znachennyami ale mayut zmistovnij poryadok cih znachen j dozvolyayut bud yake peretvorennya zi zberezhennyam poryadku Intervalni vimiryuvannya mayut viznacheni zmistovni vidstani mizh vimiryuvannyami ale nulove znachennya ye dovilnim yak u vipadkah vimiryuvan dovgoti ta temperaturi v gradusah Celsiya ta Farengejta j dozvolyayut bud yake linijne peretvorennya Vimiryuvannya vidnoshen mayut viznacheni zmistovni yak nulove znachennya tak i vidstani mizh vimiryuvannyami j dozvolyayut bud yake peretvorennya masshtabuvannya Oskilki zminni sho vidpovidayut lishe nominalnim ta poryadkovim vimiryuvannyam racionalno vimiryati chislami nemozhlivo inodi yih ob yednuyut yak kategorijni zminni todi yak vidnosni ta intervalni vimiryuvannya ob yednuyut yak kilkisni zminni sho mozhut buti abo diskretnimi abo neperervnimi v silu svoyeyi chislovoyi prirodi Take rozmezhuvannya chasto mozhe buti nestrogo spivvidnosnim z tipom danih v informatici oskilki dihotomni kategorijni zminni mozhe buti predstavleno logichnim tipom danih bagatoznachni kategorijni zminni dovilno priznachuvanimi cilimi chislami v cilochislovim tipi danih a neperervni zminni en iz zastosuvannyam obchislen z ruhomoyu komoyu Ale vidobrazhennya tipiv danih informatiki na tipi statistichnih danih zalezhit vid togo yaku kategorizaciyu ostannih vtilyuyut Bulo zaproponovano j inshi kategorizaciyi Napriklad Mosteller ta Tyuki 1997 rozriznyuvali stupeni angl grades rangi angl ranks zlichenni drobi angl counted fractions kilkosti angl counts sumi angl amounts ta balansi angl balances Nelder 1990 opisav neperervni kilkosti angl continuous counts neperervni vidnoshennya angl continuous ratios vidnoshennya kilkostej angl count ratios ta kategorijni vidi danih Div takozh Krismana 1998 van den Berga 1991 Pitannya dorechnosti chi nedorechnosti zastosuvannya riznih vidiv statistichnih metodiv do danih otrimanih z riznih vidiv procedur vimiryuvannya uskladnyuyetsya pitannyami peretvoryuvannya zminnih ta tochnoyu interpretaciyeyu doslidzhuvanih pitan Vzayemozv yazok mizh danimi ta tim sho voni opisuyut prosto vidobrazhaye toj fakt sho pevni vidi statistichnih vislovlen mozhut mati znachennya istinnosti sho ne ye invariantnimi za deyakih peretvoren Chi ye docilnim rozglyadati pevne peretvorennya chi ni zalezhit vid pitannya na yake namagayutsya vidpovisti 82Statistichni metodiOpisova statistika Dokladnishe Opisova statistika Opiso vi stati stiki v sensi en angl descriptive statistic v odnini ce zvedeni statistiki yaki kilkisno opisuyut abo uzagalnyuyut oznaki sukupnosti informaciyi v toj chas yak opis ova stati stika v sensi nezlichuvanogo imennika angl descriptive statistics ce proces vikoristannya ta analizu cih statistik Opisova statistika vidriznyayetsya vid visnovuvalnoyi statistiki angl inferential statistics abo induktivnoyi statistiki angl inductive statistics tim sho opisova statistika maye na meti uzagalnyuvannya vibirki a ne vikoristannya cih danih shob diznatisya shos pro generalnu sukupnist yaku yak vvazhayut cya vibirka danih predstavlyaye Induktivna statistika Dokladnishe Statistichne visnovuvannya Statisti chne visno vuvannya angl statistical inference ce proces vikoristannya analizu danih dlya vstanovlennya vlastivostej rozpodilu jmovirnosti sho lezhit v yih osnovi Visnovuvalnij statistichnij analiz robit visnovki pro vlastivosti generalnoyi sukupnosti napriklad shlyahom pereviryannya gipotez ta otrimuvannya ocinok Vin vihodit z pripushennya sho sposterezhuvani dani ye vibirkoyu z bilshoyi sukupnosti Induktivnu statistiku mozhlivo protistavlyati opisovij statistici Opisova statistika cikavitsya viklyuchno vlastivostyami sposterezhuvanih danih i ne spirayetsya na pripushennya sho ci dani pohodyat iz bilshoyi sukupnosti Terminologiya ta teoriya induktivnoyi statistiki Statistiki statistichni ocinki ta centralni velichini Rozglyanmo nezalezhni odnakovo rozpodileni n o r vipadkovi zminni iz zadanim rozpodilom jmovirnosti standartne statistichne visnovuvannya ta teoriya ocinyuvannya viznachaye vipadkovu vibirku yak vipadkovij vektor zadanij stovpchikovim vektorom cih n o r zminnih Doslidzhuvanu generalnu sukupnist opisuyut rozpodilom jmovirnosti sho mozhe mati nevidomi parametri Statistika angl statistic ce vipadkova zminna sho ye funkciyeyu vipadkovoyi vibirki ale ne funkciyeyu nevidomih parametriv Rozpodil imovirnosti ciyeyi statistiki prote nevidomi parametri mati mozhe Rozglyanmo teper funkciyu nevidomogo parametra statistichna ocinka angl estimator ce statistika yaku vikoristovuyut dlya ocinyuvannya ciyeyi funkciyi Do shiroko vzhivanih statistichnih ocinok nalezhat vibirkove serednye nezmishena dispersiya vibirki ta en Vipadkovu zminnu sho ye funkciyeyu vipadkovoyi vibirki ta nevidomogo parametru ale chij rozpodil imovirnosti ne zalezhit vid nevidomogo parametru nazivayut en angl pivotal quantity pivot Do shiroko vzhivanih centralnih velichin nalezhat z ocinka statistika hi kvadrat ta t velichina Styudenta Sered dvoh ocinok zadanogo parametru efektivnishoyu vvazhayut tu sho maye nizhchu serednokvadratichnu pohibku Krim togo ocinku nazivayut nezmishenoyu angl unbiased yaksho yiyi matematichne spodivannya dorivnyuye istinnomu znachennyu ocinyuvanogo nevidomogo parametra j asimptotichno nezmishenoyu yaksho yiyi matematichne spodivannya zbigayetsya do granici istinnogo znachennya takogo parametra Do inshih bazhanih vlastivostej statistichnih ocinok nalezhat en angl UMVUE sho mayut najnizhchu dispersiyu dlya vsih mozhlivih znachen ocinyuvanogo parametra ce zazvichaj ye legshoyu vlastivistyu dlya perevirki nizh efektivnist ta slushni ocinki angl consistent estimators sho zbigayutsya za jmovirnistyu do istinnogo znachennya takogo parametra Ce vse she zalishaye vidkritim pitannya yak otrimuvati statistichni ocinki v zadanij situaciyi ta vikonuvati obchislennya bulo zaproponovano dekilka metodiv metod momentiv metod maksimalnoyi pravdopodibnosti metod najmenshih kvadrativ ta novishij metod en Nulova gipoteza ta alternativna gipoteza Interpretuvannya statistichnoyi informaciyi chasto mozhe vklyuchati rozrobku nulovoyi gipotezi angl null hypothesis yaka zazvichaj ale ne obov yazkovo polyagaye u vidsutnosti vzayemozv yazku sered zminnih abo sho zmini z chasom ne vidbuvayutsya Najkrashoyu ilyustraciyeyu dlya novachka ye utrudnennya z yakim zitknuvsya kriminalnij proces v sudi prisyazhnih Nulova gipoteza H0 stverdzhuye sho vidpovidach ye nevinnim todi yak alternativna gipoteza H1 stverdzhuye sho vidpovidach ye vinnim Visuvayetsya zvinuvachennya cherez pidozru v vinnosti H0 status kvo protistoyit H1 j pidtrimuyetsya poki H1 ne stane pidtrimano dokazami poza rozumnim sumnivom Prote nezdatnist vidhiliti H0 v comu vipadku oznachaye ne nevinnist a lishe te sho dokazi buli nedostatnimi dlya zasudzhennya Tozh prisyazhni ne obov yazkovo prijmayut H0 yim ne vdayetsya vidhiliti H0 I hoch dovesti nulovu gipotezu nemozhlivo yiyi mozhlivo pereviriti na te naskilki vona ye blizkoyu do istini cherez statistichnu potuzhnist yaka robit perevirku na pomilki drugogo rodu Te sho statistiki nazivayut en ce prosto gipoteza sho superechit nulovij gipotezi Pohibka Pracyuyuchi vid nulovoyi gipotezi rozpiznayu t dva osnovni vidi pomilok Pomilki I rodu angl type I errors koli nulovu gipotezu hibno vidhilyayut sho daye hibno pozitivne angl false positive Pomilki II rodu angl type II errors koli nulovu gipotezu ne vdayetsya vidhiliti j spravzhnya vidminnist mizh sukupnostyami vtrachayetsya sho daye hibno negativne angl false negative Standartne vidhilennya angl standard deviation vkazuye na te naskilki okremi sposterezhennya v vibirci vidriznyayutsya vid centralnogo znachennya takogo yak serednye za vibirkoyu abo serednye za generalnoyu sukupnistyu todi yak standartna pohibka angl standard error vkazuye na ocinku riznici mizh serednimi za vibirkoyu ta serednim za generalnoyu sukupnistyu Statistichna pohibka angl statistical error ce velichina na yaku sposterezhennya vidriznyayutsya vid yihnogo matematichnogo spodivannya zalishok angl residual ce velichina na yaku sposterezhennya vidriznyayutsya vid znachennya yakogo nabuvaye statistichna ocinka ochikuvanogo znachennya na zadanomu zrazkovi yaku takozh nazivayut peredbachennyam Serednokvadratichnu pohibku angl mean squared error vikoristovuyut dlya otrimuvannya efektivnih ocinok shiroko vzhivanogo klasu statistichnih ocinok en angl root mean square error ye prosto kvadratnim korenem serednokvadratichnoyi pohibki Dopasuvannya najmenshimi kvad ratami chervonim tochki dlya dopa sovuvannya sinim dopasovana liniya Bagato statistichnih metodiv pragnut minimizuvati en angl residual sum of squares i yih nazivayut metodami najmenshih kvadrativ angl methods of least squares na protivagu do en angl least absolute deviations Ostanni nadayut odnakovoyi vagi yak malenkim tak i velikim pohibkam todi yak pershi nadayut velikim pohibkam bilshoyi vagi Takozh zalishkova suma kvadrativ ye diferencijovnoyu sho zabezpechuye zruchnu vlastivist dlya vikonannya regresiyi Najmenshi kvadrati v zastosuvanni do linijnoyi regresiyi nazivayut en angl ordinary least squares method a najmenshi kvadrati v zastosuvanni do en nazivayut en angl non linear least squares Takozh v linijnij regresijnij modeli nedeterminovanu chastinu modeli nazivayut chlenom pohibki angl error term zburennyam angl disturbance abo prosto shumom angl noise Yak linijnu tak i nelinijnu regresiyu rozglyadayut u polinomialnim metodi najmenshih kvadrativ angl polynomial least squares sho takozh opisuye dispersiyu v peredbachenni zalezhnoyi zminnoyi vis y yak funkciyu vid nezalezhnoyi zminnoyi vis x ta vidhilen pohibok shumu zburennya vidnosno ocinyuvanoyi dopasovuvanoyi krivoyi Procesi vimiryuvannya sho porodzhuyut statistichni dani takozh ye shilnimi do pohibok Bagato z cih pohibok klasifikuyut yak vipadkovi angl random shum ta sistematichni angl systematic zsuv ale vazhlivimi mozhut buti j inshi tipi pohibok napriklad promahi taki yak koli analitik povidomlyaye nepravilni odinici vimiryuvannya Isnuvannya en abo en mozhe prizvoditi do uperedzhenih ocinok j dlya podolannya cih problem bulo rozrobleno specialni metodiki Intervalne ocinyuvannya Detalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en Dovirchi intervali chervona liniya ye istinnim znachennyam serednogo v comu prikladi a sini liniyi ye vipadkovimi dovirchimi intervalami dlya 100 realizacij Bilshist doslidzhen vibirayut lishe chastinu generalnoyi sukupnosti tozh rezultati ne predstavlyayut vsyu generalnu sukupnist vpovni Bud yaki ocinki otrimani z takoyi vibirki lishe nablizhuyut znachennya generalnoyi sukupnosti Dovirchi intervali angl confidence intervals dozvolyayut statistikam virazhati te naskilki blizko vibirkova ocinka vidpovidaye istinnomu znachennyu dlya vsiyeyi generalnoyi sukupnosti Chasto yih virazhayut yak 95 vidsotkovi dovirchi intervali Formalno 95 vij dovirchij interval dlya znachennya ye diapazonom yakij yaksho vibirannya ta analiz povtoryuvati za takih zhe umov otrimuyuchi vidminnij nabir danih vklyuchatime istinne znachennya generalnoyi sukupnosti v 95 vsih mozhlivih vipadkiv Ce ne oznachaye sho jmovirnist perebuvannya istinnogo znachennya v comu dovirchomu intervali stanovit 95 Z chastotnickoyi tochki zoru take tverdzhennya ne maye sensu oskilki istinne znachennya ne ye vipadkovoyu zminnoyu Istinne znachennya abo perebuvaye v danomu intervali abo ni Prote istinnim ye te sho do togo yak bude vibrano yakis dani i za zadanogo planu pobudovi dovirchogo intervalu jmovirnist togo sho interval yakij she nalezhit obchisliti pokrivatime istinne znachennya stanovit 95 v cej moment mezhi intervalu ye vipadkovimi zminnimi yaki she nalezhit prosposterigati Odnim iz pidhodiv sho vidaye interval yakij mozhlivo interpretuvati yak takij sho maye zadanu jmovirnist vmishuvannya istinnogo znachennya ye zastosuvannya jmovirnih intervaliv angl credible intervals z bayesovoyi statistiki cej pidhid zalezhit vid vidminnogo sposobu interpretuvannya togo sho mayetsya na uvazi pid imovirnistyu a same bayesovoyi jmovirnosti Dovirchi intervali v principi mozhut buti simetrichnimi ta asimetrichnimi Interval mozhe buti asimetrichnim bo vin pracyuye yak nizhnya ta verhnya mezhi dlya parametru livobichnij ta pravobichnij intervali ale vin takozh mozhe buti asimetrichnim oskilki cej dvobichnij interval buduyut iz porushennyam simetriyi navkolo ocinki Inodi mezhi asimptotichnogo intervalu dosyagayut asimptotichno j vikoristovuyut yih dlya nablizhennya istinnih mezh Znachushist Dokladnishe Statistichna znachushist Statistika ridko daye na analizovane pitannya prostu vidpovid na kshtalt Tak Ni Interpretaciya chasto zvoditsya do rivnya statistichnoyi znachushosti angl statistical significance zastosovuvanogo do chisel i chasto posilayetsya na jmovirnist znachennya sho tochno vidkidaye nulovu gipotezu yaku inodi nazivayut p znachennyam V comu grafiku chorna liniya ye rozpodilom jmovirnosti dlya statistiki kriteriyu kritichna oblast ye mnozhinoyu znachen pravoruch vid sposterezhuvanoyi tochki danih sposterezhuvanogo znachennya statistichnogo kriteriyu a p znachennya predstavleno zelenoyu plosheyu Standartnim pidhodom ye pereviryati nulovu gipotezu vidnosno alternativnoyi gipotezi Kritichna oblast ye mnozhinoyu znachen ocinyuvacha yaki vedut do sprostuvannya nulovoyi gipotezi Jmovirnist pomilki I rodu ye vidtak jmovirnistyu togo sho ocinyuvach lezhit u kritichnij oblasti za umovi sho nulova gipoteza ye istinnoyu statistichna znachushist a jmovirnist pomilki II rodu ye jmovirnistyu togo sho ocinyuvach ne nalezhit do kritichnoyi oblasti za umovi sho istinnoyu ye alternativna gipoteza Statistichna potuzhnist angl statistical power kriteriyu ye jmovirnistyu togo sho vin nalezhnim chinom vidhilyaye nulovu gipotezu koli cya nulova gipoteza ye hibnoyu Posilannya na statistichnu znachushist ne obov yazkovo oznachaye sho zagalnij rezultat ye znachushim v terminah realnogo svitu Napriklad u velikomu doslidzhenni likarskogo zasobu mozhe buti pokazano sho cej medikament maye statistichno znachushij ale duzhe malenkij spriyatlivij efekt takij sho vin navryad chi mozhe pomitno dopomagati paciyentovi I hocha v principi prijnyatnij riven statistichnoyi znachushosti mozhe buti predmetom obgovorennya p znachennya ye najmenshim rivnem znachushosti yakij dozvolyaye kriteriyu vidhilyati nulovu gipotezu Cej kriterij ye logichno rivnoznachnim tverdzhennyu sho p znachennya ye jmovirnistyu sposterigannya rezultatu shonajmenshe nastilki zh ekstremalnogo yak i statistika kriteriyu za umovi sho nulova gipoteza ye istinnoyu Takim chinom sho menshim ye p znachennya to nizhchoyu ye jmovirnist traplyannya pomilki I rodu Deyaki problemi zazvichaj pov yazuvani z ciyeyu sistemoyu div en Vidminnist yaka maye visoku statistichnu znachushist mozhe vse odno ne mati praktichnoyi znachushosti ale mozhlivo nalezhno formulyuvati kriteriyi shobi vrahovuvati ce Odna z vidpovidej peredbachaye vihid za mezhi povidomlyannya lishe rivnya znachushosti shlyahom vklyuchannya p znachennya pri zvituvanni pro vidhilennya chi prijnyattya gipotezi Prote p znachennya ne pokazuye en chi vazhlivosti sposterezhuvanogo efektu a takozh mozhe stvoryuvati vrazhennya perebilshenoyi vazhlivosti neznachnih vidminnostej u velikih doslidzhennyah Krashim i vse poshirenishim pidhodom ye povidomlyati dovirchi intervali Nezvazhayuchi na te sho yih otrimuyut iz tih zhe obchislen sho j statistichni kriteriyi gipotez ta p znachennya voni opisuyut rozmir yak samogo efektu tak i neviznachenosti sho jogo otochuye Hiba transponovanogo obumovlennya vona zh pomilka prokurora kritika vinikaye cherez te sho cej pidhid perevirki gipotez zmushuye viddavati perevagu odnij z gipotez nulovij oskilki ocinyuyut jmovirnist sposterezhuvanogo rezultatu za umovi nulovoyi gipotezi a ne jmovirnist nulovoyi gipotezi za sposterezhenogo rezultatu Alternativu comu pidhodovi zaproponovano bayesovim visnovuvannyam hocha vono vimagaye vstanovlyuvannya apriornoyi jmovirnosti Vidhilennya nulovoyi gipotezi ne dovodit avtomatichno alternativnu gipotezu Yak i vse v induktivnij statistici vona pokladayetsya na rozmir vibirki j vidtak za en p znachennya mozhe buti obchislyuvano silno pomilkovo proyasniti Prikladi Deyaki vidomi statistichni kriteriyi ta proceduri Dispersijnij analiz angl ANOVA Kriterij hi kvadrat Korelyaciya Faktornij analiz U Manna Uitni en angl MSWD Koeficiyent korelyaciyi momentu dobutku Pirsona Regresijnij analiz Koeficiyent korelyaciyi rangu Spirmena t kriterij Styudenta Analiz chasovih ryadiv en Rozviduvalnij analiz danih Dokladnishe Rozviduvalnij analiz danih Rozvi duvalnij ana liz da nih RAD angl exploratory data analysis EDA ce odin z pidhodiv do analizu naboriv danih dlya uzagalnyuvannya yihnih osnovnih harakteristik chasto za dopomogoyu vizualnih metodiv Statistichnu model mozhut vikoristovuvati chi ni ale v pershu chergu RAD priznacheno shobi pobachiti sho dani mozhut skazati nam za mezhami formalnoyi zadachi modelyuvannya ta perevirki gipotez Nenalezhne zastosuvannyaDetalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti Nenalezhne zastosuvannya statistiki Nenalezhne zastosuvannya statistiki mozhe sprichinyuvati tonki ale serjozni pomilki v opisi ta interpretaciyi tonki v tomu sensi sho navit dosvidcheni fahivci mozhut robiti taki pomilki a serjozni v tomu sensi sho voni mozhut prizvoditi do rujnivnih pomilok v uhvalyuvanni rishen Vid nalezhnogo zastosuvannya statistiki zalezhat napriklad socialna politika medichna praktika ta nadijnist takih sporud yak mosti Navit koli statistichni metodiki zastosovuyut korektno yihni rezultati mozhut buti skladnimi dlya interpretuvannya dlya tih komu brakuye dosvidu Statistichna znachushist tendenciyi v danih yaka vimiryuye stupin do yakogo tendenciyu mozhe buti sprichineno vipadkovoyu minlivistyu vibirki mozhe uzgodzhuvatisya z intuyitivnim vidchuttyam yiyi znachushosti a mozhe j ne uzgodzhuvatisya Nabir bazovih statistichnih navichok ta skepticizmu neobhidnih lyudyam dlya nalezhnoyi roboti z informaciyeyu u svoyemu povsyakdennomu zhitti nazivayut en Isnuye dumka sho statistichni znannya zanadto chasto cilespryamovano zastosovuyut nenalezhnim chinom shukayuchi shlyahi interpretuvati lishe ti dani sho ye spriyatlivimi dlya dopovidacha Nedovira ta nerozuminnya statistiki pov yazani z citatoyu Isnuye tri vidi brehni brehnya nahabna brehnya j statistika Nenalezhne zastosuvannya statistiki mozhe buti yak nenavmisnim tak i navmisnim j ryad mirkuvan okresleno v knizi Yak brehati za dopomogoyu statistiki V namaganni proliti svitlo na nalezhne ta nenalezhne zastosuvannya statistiki provodyat pereglyadi statistichnih metodik vikoristovuvanih v pevnih oblastyah napriklad Varn Lazo Ramos i Ritter 2012 Do sposobiv zapobigannya nenalezhnomu zastosuvannyu statistiki nalezhat zastosuvannya pravilnih diagram ta zapobigannya uperedzhennyu Nenalezhne zastosuvannya mozhe traplyatisya koli visnovki pereuzagalnyuyut i pretenduyut sho voni ye reprezentativnimi dlya bilshogo nizh voni ye naspravdi chasto cherez navmisne abo nenavmisne ne vrahovuvannya uperedzhenosti vibirki Stovpchikovi diagrami ye mabut najprostishimi diagramami dlya zastosuvannya ta rozuminnya j yih mozhlivo robiti vruchnu abo za dopomogoyu prostih komp yuternih program Na zhal bilshist lyudej ne divlyatsya na uperedzhennya ta pomilki tozh voni lishayutsya nepomichenimi Takim chinom lyudi mozhut chasto viriti v te sho shos ye istinnim navit yaksho vono ne ye dostatno reprezentativnim Shobi zibrani zi statistiki dani buli pravdopodibnimi ta tochnimi zdijsnyuvana vibirka musit buti reprezentativnoyu dlya generalnoyi sukupnosti v cilomu Zgidno Gaffa Nadijnist vibirki mozhe buti zrujnovano uperedzhenistyu dozvolyajte sobi pevnu miru skepticizmu Dlya dopomogi v rozuminni statistiki Gaff zaproponuvav ryad pitan yaki slid zadavati v kozhnomu vipadku Hto tak kazhe Chi maye vin vona korislivu metu Zvidki vin vona znaye Chi maye vin vona resursi shobi znati ci fakti Sho upusheno Chi nadali vin vona povnu kartinu Chi ne zminiv htos temu Chi proponuyut nam vin vona pravilnu vidpovid na ne tu zadachu Chi maye ce sens Chi ye jogo yiyi visnovok logichnim ta uzgodzhenim z tim sho mi vzhe znayemo en amerikanskij profesor medicini yakij vikladaye statistiku studentam medichnogo profilyu avtor ryadu kursiv ta knig zi statistiki ta kolishnij redaktor en zaznachaye sho blizko 50 publikacij yaki nadhodyat v redakciyu zhurnalu mistyat statistichni pomilki otrimannya ta obrobki medichnih danih Osnovnimi prichinami ye nedostovirnist otrimanih danih nepravilno postavleni eksperimenti abo zh vzyati neprezentabelni dani a takozh neznannya ta nepravilne zastosuvannya statistichnih metodiv Takozh vin zaznachaye sho chasto doslidnik ta osobi prichetni do eksperimentu mozhut pidsvidomo vidavati bazhane za dijsne Prichomu nenavmisne pidtasuvannya danih mozhe vidbuvatisya yak na etapi postanovki eksperimentu zboru danih tak i na etapi analizu danih Vihodom ye maksimalne vrahuvannya ta usunennya storonnih chinnikiv yaki mozhut vplinuti na proces eksperimentu ta na analiz danih Vin proponuye yakomoga shirshe vikoristovuvati slipij metod chi navit podvijno slipij metod koli ani piddoslidni ani doslidniki chi pomichniki doslidnikiv dostemenno ne znayut sho na yakij grupi hvorih doslidzhuyetsya i navit analiz danih bazhano shob robila osoba nezacikavlena u nekorektnij interpretaciyi danih chi she krashe yaksho vona bude neobiznanoyu v konkretnih detalyah eksperimentu V bud yakomu razi v postanovci zbori ta analizi danih povinni brati uchast osobi yaki dobre volodiyut prikladnimi statistichnimi metodami Problema zmishuvalnoyi zminnoyi X ta Y mozhut korelyuvati ne cherez isnuvannya prichinovo naslidkovogo zv yazku mizh nimi a cherez te sho obidvi zalezhat vid tretoyi zminnoyi Z Z nazivayut zmishuvalnim faktorom angl confounding factor Nenalezhna interpretaciya korelyaciya Ponyattya korelyaciyi osoblivo privertaye uvagu potencijnoyu plutaninoyu yaku vono mozhe sprichinyuvati Statistichnij analiz naboru danih chasto viyavlyaye sho dvi zminni vlastivosti doslidzhuvanoyi generalnoyi sukupnosti mayut shilnist zminyuvatisya razom tak nibi voni pov yazani Napriklad doslidzhennya richnogo dohodu yake takozh divitsya na vik smerti mozhe viyaviti sho trivalist zhittya v bidnih lyudej shilna buti menshoyu nizh u zamozhnih Pro ci dvi zminni kazhut sho voni korelyuyut prote voni mozhut buti a mozhut i ne buti prichinoyu odna odnoyi Yavishe korelyaciyi mozhe buti sprichineno tretim ranishe ne rozglyadanim yavishem sho nazivayut neyavnoyu zminnoyu angl lurking variable abo zmishuvalnoyu zminnoyu angl confounding variable Z ciyeyi prichini nemaye mozhlivosti negajno zrobiti visnovok pro isnuvannya prichinno naslidkovogo zv yazku mizh cimi dvoma zminnimi Div korelyuvannya ne oznachaye sprichinyuvannya ZastosuvannyaPrikladna statistika teoretichna statistika ta matematichna statistika Prikladna statistika vklyuchaye opisovu statistiku ta zastosuvannya induktivnoyi statistiki Teoretichna statistika rozglyadaye logichni argumenti sho lezhat v osnovi obgruntuvannya pidhodiv do statistichnogo visnovuvannya a takozh ohoplyuye matematichnu statistiku Matematichna statistika vklyuchaye ne lishe manipulyuvannya rozpodilami jmovirnosti neobhidnimi shobi vivoditi rezultati pov yazani z metodami ocinyuvannya ta visnovuvannya ale takozh i rizni aspekti en ta planuvannya eksperimentiv en mozhut dopomagati organizaciyam ta kompaniyam yaki ne mayut vlasnoyi kompetenciyi sho stosuyetsya yihnih konkretnih pitan Mashinne navchannya ta dobuvannya danih Modeli mashinnogo navchannya ce statistichni ta jmovirnisni modeli sho fiksuyut zakonomirnosti v danih cherez zastosuvannya obchislyuvalnih algoritmiv Statistika v akademichnim seredovishi Statistiku zastosovuyut do shirokogo spektru akademichnih disciplin vklyuchno z prirodnichimi ta suspilnimi naukami uryaduvannyam ta biznesom Biznesova statistika zastosovuye statistichni metodi v ekonometriyi auditi virobnictvi ta operacijnij diyalnosti vklyuchno z udoskonalennyam obslugovuvannya ta marketingovimi doslidzhennyami V galuzi biologichnih nauk 12 ma najchastishimi statistichnimi kriteriyami ye dispersijnij analiz angl ANOVA kriterij hi kvadrat t kriterij Styudenta linijna regresiya koeficiyent korelyaciyi Pirsona U kriterij Manna Uitni en indeks riznomanitnosti Shennona en klasternij analiz koeficiyent korelyaciyi rangu Spirmena ta metod golovnih komponent Tipovij kurs statistiki ohoplyuye opisovu statistiku jmovirnist binomialnij ta normalnij rozpodili perevirku gipotez ta dovirchih intervaliv linijnu regresiyu ta korelyaciyu Suchasni fundamentalni kursi statistiki dlya studentiv ostannogo kursu zoseredzhuyutsya na pravilnomu obiranni kriteriyiv interpretaciyi rezultativ ta zastosuvanni en Statistichni obchislennya en priklad en Detalnishi vidomosti z ciyeyi temi vi mozhete znajti v statti en Na praktiku statistichnoyi nauki pochinayuchi z drugoyi polovini XX storichchya suttyevo vplinulo shvidke j stijke zrostannya obchislyuvalnoyi potuzhnosti Ranni statistichni modeli majzhe zavzhdi pohodili z klasu en ale potuzhni komp yuteri v poyednanni z vidpovidnimi chiselnimi algoritmami sprichinili zrostannya zacikavlennya en takimi yak nejronni merezhi a takozh stvorennya novih tipiv takih yak en ta en Zbilshennya obchislyuvalnoyi potuzhnosti takozh prizvelo do zrostannya populyarnosti obchislyuvalno mistkih metodiv sho gruntuyutsya na en takih yak permutacijnij test ta natyazhka todi yak taki metodiki yak en zrobili zdijsnennishim zastosuvannya bayesovih modelej Komp yuterna revolyuciya maye naslidki dlya majbutnogo statistiki z novim akcentom na eksperimentalnij ta empirichnij statistici Narazi ye dostupnoyu velika kilkist en yak zagalnogo tak i specialnogo priznachennya Do prikladiv dostupnogo programnogo zabezpechennya zdatnogo do skladnih statistichnih obchislen nalezhat taki programi yak Mathematica en SPSS ta R Zastosuvannya statistiki v matematici ta mistectvi Tradicijno statistika zajmalasya visnovuvannyam iz zastosuvannyam napivstandartizovanoyi metodologiyi sho bula obov yazkovoyu dlya vivchennya v bilshosti nauk dzherelo Cya tradiciya zminilasya iz zastosuvannyam statistiki v ne visnovuvalnih kontekstah Na te sho kolis bulo nudnoyu temoyu obov yazkovoyu dlya otrimannya stupenya v bagatoh galuzyah teper divlyatsya z entuziazmom na chiyu dumku Vismiyuvanu spershu deyakimi matematichnimi puristami yiyi teper vvazhayut vazhlivoyu metodologiyeyu v pevnih oblastyah V teoriyi chisel tochkovi diagrami danih porodzhuvanih funkciyeyu rozpodilu mozhe buti peretvoryuvano za dopomogoyu zvichnih instrumentiv yaki vikoristovuyut u statistici shobi rozkrivati zakonomirnosti sho lezhat v yih osnovi sho mozhe potim vesti do gipotez Metodi statistiki vklyucheno z peredbachuvalnimi metodami v prognozuvanni poyednuyut z teoriyeyu haosu ta fraktalnoyu geometriyeyu shobi stvoryuvati yak vvazhayetsya duzhe krasivi video dzherelo en Dzheksona Polloka pokladavsya na zhivopisovi eksperimenti zavdyaki yakim hudozhno rozkrivalisya rozpodili sho lezhat v osnovi prirodi dzherelo Z poyavoyu komp yuteriv dlya formalizuvannya takih vedenih rozpodilami prirodnih procesiv bulo zastosovano statistichni metodi dlya stvorennya ta analizu animovanogo videomistectva dzherelo Metodi statistiki mozhut vikoristovuvati predikativno v mistectvi performansu yak ot u fokusi z gralnimi kartami zasnovanomu na markovskomu procesi sho pracyuye lishe deyakij chas nastannya yakogo mozhlivo peredbachuvati vikoristovuyuchi statistichnu metodologiyu Statistiku mozhlivo vikoristovuvati dlya predikativnogo stvoryuvannya tvoriv mistectva yak u statistichnij abo stohastichnij muzici vinajdenij Yanisom Ksenakisom de muzika ye zalezhnoyu vid kozhnogo vikonannya I hoch cej tip mistectva ne zavzhdi vihodit takim yak ochikuvalosya vin povoditsya takim chinom sho ye peredbachuvanim ta nalashtovuvanim iz zastosuvannyam statistiki Specializovani discipliniDokladnishe Spisok oblastej zastosuvannya statistiki Statistichni metodiki vikoristovuyut v shirokomu spektri tipiv naukovih ta suspilnih doslidzhen vklyuchno z biologichnoyu statistikoyu obchislyuvalnoyu biologiyeyu obchislyuvalnoyu sociologiyeyu en suspilstvoznavstvom sociologiyeyu ta suspilstvoznavchimi doslidzhennyami V deyakih oblastyah doslidzhen prikladnu statistiku vikoristovuyut nastilki shiroko sho voni mayut specializovanu terminologiyu Do cih disciplin nalezhat Aktuarna matematika ocinyuye rizik v strahovij ta finansovij galuzyah en statistichne ocinyuvannya astronomichnih danih Biologichna statistika Geografiya ta geoinformacijni sistemi konkretno v prostorovim analizi Demografiya statistichne doslidzhennya naselennya Dobuvannya danih zastosuvannya statistiki ta rozpiznavannya obraziv dlya viyavlyannya znan v danih Ekonometriya statistichnij analiz ekonomichnih danih Epidemiologiya statistichnij analiz zahvoryuvanosti Medichna statistika Nauka pro dani Obrobka zobrazhen Politologiya Prikladna informacijna ekonomika en en en Statistichna mehanika en Hemometriya dlya analizu danih u himiyi en pravo Fizichne vihovannya ta sport Krim togo isnuyut pevni tipi statistichnogo analizu v yakih takozh bulo rozrobleno svoyu vlasnu specializovanu terminologiyu ta metodologiyu Analiz vizhivanosti Bagatovimirna statistika Metodologiya opituvannya en Natyazhkova skladano nozheva en Statistichna klasifikaciya en Statistika v bagatoh vidah sportu zokrema u en vidoma yak en ta en Metodi Taguchi Statistika takozh ye klyuchovim bazovim instrumentom u biznesi ta virobnictvi Yiyi vikoristovuyut dlya rozuminnya variativnosti sistem vimiryuvannya keruvannya procesami yak u statistichnim keruvanni procesami angl statistical process control SPC uzagalnyuvannya danih ta dlya zdijsnennya kerovanih danimi rishen V cih rolyah vona ye klyuchovim i mozhlivo yedinim nadijnim instrumentom Div takozhDokladnishe Naris teoriyi statistiki en Nauka pro dani en en en en en programnogo zabezpechennya en en en Vsesvitnij den statistiki Zasadi ta golovni oblasti statistiki en en en en LiteraturaKartashov M V Imovirnist procesi statistika Kiyiv VPC Kiyivskij universitet 2007 504 s Lydia Denworth A Significant Problem Standard scientific methods are under fire Will anything change Scientific American vol 321 no 4 October 2019 pp 62 67 angl Vikoristannya p znachen protyagom majzhe storichchya z 1925 roku dlya viznachennya statistichnoyi znachushosti rezultativ eksperimentiv pospriyalo ilyuziyi vpevnenosti ta krizi vidtvoryuvanosti v bagatoh naukovih galuzyah Isnuye vse bilsha rishuchist do reformuvannya statistichnogo analizu Deyaki doslidniki proponuyut zminyuvati statistichni metodi todi yak inshi pokinchili bi z porogom dlya viznachennya znachushih rezultativ s 63 Barbara Illowsky Susan Dean 2014 OpenStax CNX ISBN 9781938168208 Arhiv originalu za 21 lipnya 2021 Procitovano 13 veresnya 2020 angl Stockburger David W en vid 3rd Web Arhiv originalu za 28 travnya 2020 angl OpenIntro Statistics 16 chervnya 2019 u Wayback Machine 3rd edition by Diez Barr and Cetinkaya Rundel angl Stephen Jones 2010 Statistics in Psychology Explanations without Equations 27 lipnya 2020 u Wayback Machine Palgrave Macmillan ISBN 9781137282392 angl Cohen J 1990 PDF American Psychologist 45 1304 1312 doi 10 1037 0003 066x 45 12 1304 Arhiv originalu PDF za 18 zhovtnya 2017 angl Gigerenzer G 2004 Mindless statistics Journal of Socio Economics 33 587 606 doi 10 1016 j socec 2004 09 033 angl Ioannidis J P A 2005 Why most published research findings are false PLoS Medicine 2 696 701 doi 10 1371 journal pmed 0040168 PMC 1855693 PMID 17456002 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite journal title Shablon Cite journal cite journal a Obslugovuvannya CS1 Storinki iz nepoznachenim DOI z bezkoshtovnim dostupom posilannya angl Narisi z istoriyi statistiki Ukrayini Avt kol O G Osaulenko gol red V I Karpov M V Pugachova ta in Derzhkomstat Ukrayini NDI statistiki 2 e vid vipr ta dop K 1999 188 s il Bibliogr s 147 152 133 nazvi Statistika navchalnij posibnik S O Matkovskij M L Vdovin T V Panchishin Lviv Vidavnichij centr LNU imeni Ivana Franka 2010 344 s Statistika navch posib dlya stud ekon spec vish navch zakl S O Matkovskij L I Galkiv O S Grinkevich O Z Sorochak 2 ge vid dopovn i vipravl L Novij Svit 2000 2011 429 3 s il Visha osvita v Ukrayini Bibliogr v kinci rozdiliv ISBN 978 966 418 089 1 Statistika navch posib R V Feshur V P Kichor A F Barvinskij M R Timoshuk M vo osviti i nauki Ukrayini Nac un t Lviv politehnika 4 te vid onovl i dopovn L Buh centr Azhur 2010 256 s il tabl Bibliogr s 251 252 20 nazv ISBN 978 966 1688 05 5 Statistika rinku tovariv ta poslug Navch posib L I Kramchenko Ukoopspilka L 2002 188 c Bibliogr 32 nazvi PosilannyaStatistics u sestrinskih VikiproyektahCitati u Vikicitatah Statistics u Vikimandrah Statistics u Vikishovishi Elektronna versiya TIBCO Software Inc 2020 Data Science Textbook 14 serpnya 2020 u Wayback Machine angl Online Statistics Education An Interactive Multimedia Course of Study 15 serpnya 2020 u Wayback Machine angl Rozrobleno Universitetom Rajsa providnij rozrobnik en Universitetom Taftsa ta Nacionalnim naukovim fondom SShA angl Philosophy of Statistics 1 listopada 2020 u Wayback Machine vid Stenfordskoyi filosofskoyi enciklopediyi angl Orlov A I Prikladnaya statistika Uchebnik 4 kvitnya 2013 u Wayback Machine M Izdatelstvo Ekzamen 2004 656 s ros Uchebno metodicheskij kompleks discipliny Statistika chast 2 ros Primitki Arhiv originalu za 3 veresnya 2020 Procitovano 13 veresnya 2020 angl Romijn Jan Willem 2014 Stanford Encyclopedia of Philosophy Arhiv originalu za 19 zhovtnya 2021 Procitovano 13 veresnya 2020 angl Arhiv originalu za 22 listopada 2020 Procitovano 13 veresnya 2020 angl Statistika 2 grudnya 2020 u Wayback Machine Yuridichna enciklopediya u 6 t red kol Yu S Shemshuchenko vidp red ta in K Ukrayinska enciklopediya im M P Bazhana 2003 T 5 P S 736 s ISBN 966 7492 05 2 Dodge Y 2006 The Oxford Dictionary of Statistical Terms Oxford University Press ISBN 0 19 920613 9 angl Lund Research Ltd statistics laerd com Arhiv originalu za 26 zhovtnya 2020 Procitovano 23 bereznya 2014 angl Romanchikov V I 2007 PDF K Centr uchbovoyi literaturi s 132 146 Arhiv originalu PDF za 29 listopada 2020 Procitovano 13 veresnya 2020 About com Education Arhiv originalu za 27 lyutogo 2017 Procitovano 27 listopada 2015 angl Broemeling Lyle D 1 listopada 2011 An Account of Early Statistical Inference in Arab Cryptology The American Statistician 65 4 255 257 doi 10 1198 tas 2011 10191 angl 2000 vid 1st Anchor Books New York Anchor Books ISBN 978 0 385 49532 5 angl Ibrahim A Al Kadi The origins of cryptology The Arab contributions en 16 2 April 1992 pp 97 126 angl Answers Consulting 3 lyutogo 2018 Arhiv originalu za 21 lipnya 2018 Procitovano 13 veresnya 2020 angl Moses Lincoln E 1986 Think and Explain with Statistics Addison Wesley ISBN 978 0 201 15619 5 pp 1 3 angl Hays William Lee 1973 Statistics for the Social Sciences Holt Rinehart and Winston p xii ISBN 978 0 03 077945 9 angl Moore David 1992 Teaching Statistics as a Respectable Subject U F Gordon S Gordon red Statistics for the Twenty First Century Washington DC The Mathematical Association of America s 14 25 ISBN 978 0 88385 078 7 angl Rossman Allan J 2005 PDF Investigating Statistical Concepts Applications and Methods Duxbury Press ISBN 978 0 495 05064 3 Arhiv originalu PDF za 22 listopada 2020 Procitovano 13 veresnya 2020 angl Lakshmikantham ed by D Kannan V 2002 Handbook of stochastic analysis and applications New York M Dekker ISBN 0824706609 angl Schervish Mark J 1995 Theory of statistics vid Corr 2nd print New York Springer ISBN 0387945466 angl Willcox Walter 1938 The Founder of Statistics Review of the International Statistical Institute 5 4 321 328 JSTOR 1400906 angl J Franklin The Science of Conjecture Evidence and Probability before Pascal Johns Hopkins Univ Pr 2002 angl Helen Mary Walker 1975 Arno Press ISBN 9780405066283 Arhiv originalu za 27 lipnya 2020 Procitovano 13 veresnya 2020 angl Galton F 1877 Typical laws of heredity Nature 15 388 492 553 Bibcode 1877Natur 15 492 doi 10 1038 015492a0 angl Stigler S M 1989 Francis Galton s Account of the Invention of Correlation Statistical Science 4 2 73 79 doi 10 1214 ss 1177012580 angl Pearson K 1900 Philosophical Magazine Series 5 50 302 157 175 doi 10 1080 14786440009463897 Arhiv originalu za 18 serpnya 2020 Procitovano 13 veresnya 2020 angl Department of Statistical Science University College London Arhiv originalu za 25 veresnya 2008 angl Fisher 1971 loc Chapter II The Principles of Experimentation Illustrated by a Psycho physical Experiment Section 8 The Null Hypothesis angl OED quote 1935 R A Fisher en ii 19 We may speak of this hypothesis as the null hypothesis and the null hypothesis is never proved or established but is possibly disproved in the course of experimentation angl Box JF February 1980 R A Fisher and the Design of Experiments 1922 1926 en 34 1 1 7 doi 10 2307 2682986 JSTOR 2682986 angl Yates F June 1964 Sir Ronald Fisher and the Design of Experiments en 20 2 307 321 doi 10 2307 2528399 JSTOR 2528399 angl Stanley Julian C 1966 The Influence of Fisher s The Design of Experiments on Educational Research Thirty Years Later American Educational Research Journal 3 3 223 229 doi 10 3102 00028312003003223 JSTOR 1161806 angl Agresti Alan David B Hichcock 2005 PDF Statistical Methods amp Applications 14 3 298 doi 10 1007 s10260 005 0121 y Arhiv originalu PDF za 19 grudnya 2013 Procitovano 13 veresnya 2020 angl Edwards A W F 1998 Natural Selection and the Sex Ratio Fisher s Sources American Naturalist 151 6 564 569 doi 10 1086 286141 PMID 18811377 angl Fisher R A 1915 The evolution of sexual preference Eugenics Review 7 184 192 angl Fisher R A 1930 en ISBN 0 19 850440 3 angl Edwards A W F 2000 Perspectives Anecdotal Historial and Critical Commentaries on Genetics The Genetics Society of America 154 1419 1426 angl Andersson Malte 1994 Princeton University Press ISBN 0 691 00057 3 Arhiv originalu za 27 lipnya 2020 Procitovano 13 veresnya 2020 angl Andersson M and Simmons L W 2006 Sexual selection and mate choice Trends Ecology and Evolution 21 296 302 angl Gayon J 2010 Sexual selection Another Darwinian process Comptes Rendus Biologies 333 134 144 angl Neyman J 1934 On the two different aspects of the representative method The method of stratified sampling and the method of purposive selection en 97 4 557 625 doi 10 2307 2342192 JSTOR 2342192 angl Santa Fe Institute Arhiv originalu za 30 travnya 2016 Procitovano 13 veresnya 2020 angl Wolfram Stephen 2002 A New Kind of Science Wolfram Media Inc s 1082 ISBN 1 57955 008 8 angl en 2005 Statistical Models Theory and Practice Cambridge University Press ISBN 978 0 521 67105 7 angl McCarney R Warner J Iliffe S van Haselen R Griffin M Fisher P 2007 The Hawthorne Effect a randomised controlled trial BMC Med Res Methodol 7 1 30 doi 10 1186 1471 2288 7 30 PMC 1936999 PMID 17608932 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite journal title Shablon Cite journal cite journal a Obslugovuvannya CS1 Storinki iz nepoznachenim DOI z bezkoshtovnim dostupom posilannya angl Rothman Kenneth J Greenland Sander Lash Timothy red 2008 7 Modern Epidemiology English vid 3rd Lippincott Williams amp Wilkins s 100 angl Tukey J W 1977 Data analysis and regression Boston Addison Wesley angl en 1990 The knowledge needed to computerise the analysis and interpretation of statistical information In Expert systems and artificial intelligence the need for information about data Library Association Report London March 23 27 angl Chrisman Nicholas R 1998 Rethinking Levels of Measurement for Cartography Cartography and Geographic Information Science 25 4 231 242 doi 10 1559 152304098782383043 angl van den Berg G 1991 Choosing an analysis method Leiden DSWO Press angl Hand D J 2004 Measurement theory and practice The world through quantification London Arnold angl Mann Prem S 1995 Introductory Statistics vid 2nd Wiley ISBN 0 471 31009 3 angl PDF Sumskij derzhavnij universitet Kafedra prikladnoyi matematiki ta modelyuvannya skladnih sistem fakultetu elektroniki ta informacijnih tehnologij Arhiv originalu PDF za 29 serpnya 2020 Procitovano 30 serpnya 2020 Upton G Cook I 2008 Oxford Dictionary of Statistics OUP ISBN 978 0 19 954145 4 angl Piazza Elio Probabilita e Statistica Esculapio 2007 ital Everitt Brian 1998 The Cambridge Dictionary of Statistics Cambridge UK New York Cambridge University Press ISBN 0521593468 angl YourStatsGuru com Arhiv originalu za 5 veresnya 2015 Procitovano 13 veresnya 2020 angl Rubin Donald B Little Roderick J A Statistical analysis with missing data New York Wiley 2002 angl 2005 Why Most Published Research Findings Are False PLOS Medicine 2 8 e124 doi 10 1371 journal pmed 0020124 PMC 1182327 PMID 16060722 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite journal title Shablon Cite journal cite journal a Obslugovuvannya CS1 Storinki iz nepoznachenim DOI z bezkoshtovnim dostupom posilannya angl Ratinskij V V 2013 PDF Innovacijna ekonomika 47 9 Arhiv originalu PDF za 5 veresnya 2020 Procitovano 5 veresnya 2020 Huff Darrell 1954 How to Lie with Statistics WW Norton amp Company Inc New York ISBN 0 393 31072 8 angl Warne R Lazo Ramos T Ritter N 2012 Statistical Methods Used in Gifted Education Journals 2006 2010 Gifted Child Quarterly 56 3 134 149 doi 10 1177 0016986212444122 angl Drennan Robert D 2008 Statistics in archaeology U Pearsall Deborah M red Encyclopedia of Archaeology Elsevier Inc s 2093 2100 ISBN 978 0 12 373962 9 angl Cohen Jerome B December 1938 Misuse of Statistics Journal of the American Statistical Association JSTOR 33 204 657 674 doi 10 1080 01621459 1938 10502344 angl 1988 Modern Elementary Statistics Credo Reference angl Huff Darrell Irving Geis 1954 How to Lie with Statistics New York Norton The dependability of a sample can be destroyed by bias allow yourself some degree of skepticism angl Stenton Glanc Mediko biologicheskaya statistika M Praktika 1998 S 405 406 ros Nikoletseas M M 2014 Statistics Concepts and Examples ISBN 978 1500815684 angl Anderson D R Sweeney D J Williams T A 1994 Introduction to Statistics Concepts and Applications pp 5 9 West Group ISBN 978 0 314 03309 3 angl Journal of Business amp Economic Statistics Taylor amp Francis Arhiv originalu za 27 lipnya 2020 Procitovano 16 bereznya 2020 angl Natalia Loaiza Velasquez Maria Isabel Gonzalez Lutz amp Julian Monge Najera 2011 PDF Revista Biologia Tropical 59 983 992 Arhiv originalu PDF za 19 zhovtnya 2020 Procitovano 13 veresnya 2020 angl Pekoz Erol 2009 The Manager s Guide to Statistics Erol Pekoz ISBN 9780979570438 angl Arhiv originalu za 19 sichnya 2018 Procitovano 18 sichnya 2018 Aliberti Sara D Elia Francesca Cherubini Domenico 2023 Tips for Statistical Tools for Research Methods in Exercise and Sport Sciences Physical Education Theory and Methodology 23 3 470 477 doi 10 17309 tmfv 2023 3 20 ISSN 1993 7989