Хибне використання статистики відбувається, коли статистичний аргумент стверджує неправду. Статистика, якщо її використовувати в хибний спосіб, може змусити випадкового спостерігача повірити в щось інше, ніж те, що показують дані. У деяких випадках неправильне використання може бути випадковим. В інших — це цілеспрямовано та з метою наживи зловмисника. Якщо залучене статистичне судження хибне або неправильно застосоване, це є статистичною помилкою.
Використати статистику помилково дуже легко. Професійних вчених, навіть математиків і професійних статистиків, можна обдурити навіть якимись простими методами, навіть якщо вони ретельно все перевіряють. Відомо, що вчені обманюють себе статистикою через брак знань теорії ймовірностей і брак стандартизації своїх тестів.
Визначення, обмеження та контекст
Одне з визначень, яке можна використовувати, таке: «Зловживання статистичними даними: використання чисел таким чином, що або навмисно, або через незнання чи необережність, висновки є невиправданими або неправильними». «Цифри» містять оманливу графіку, про яку йдеться в інших місцях. Цей термін рідко зустрічається в статистичних текстах, і невідомо жодного авторитетного визначення. Це узагальнення брехні за допомогою статистики, яка була багато описана на прикладах статистиків 60 років тому.
Визначення стикається з деякими проблемами (деякі вирішуються в джерелі):
- Статистика зазвичай виробляє ймовірності; висновки тимчасові
- Попередні висновки містять похибки та рівень похибок. Зазвичай 5 % попередніх висновків перевірки значущості є помилковими
- Статистики не зовсім згодні щодо ідеальних методів
- Статистичні методи базуються на припущеннях, які рідко повністю виконуються
- Збір даних зазвичай обмежується етичними, практичними та фінансовими обмеженнями.
Як брехати за допомогою статистики визнає, що статистика може мати різні форми. Про те, чи показує статистика, що продукт «легкий і економічний» чи «неміцний і дешевий», можна говорити незалежно від цифр. Дехто заперечує проти заміни статистичною коректністю морального лідерства (наприклад) як цілі. Покласти провину за зловживання часто важко, оскільки вчені, соціологи, статистики та репортери часто є найманими працівниками або консультантами.
Підступне зловживання статистикою завершується слухачем/спостерігачем/аудиторією/присяжним. Постачальник надає «статистику» у вигляді чисел або графіки (або фотографій до/після), що дозволяє споживачеві зробити (можливо, невиправдані чи неправильні) висновки. Поганий стан [en] та нестатистична природа людської інтуїції дозволяють вводити в оману без явного отримання помилкових висновків.
Історик перерахував понад 100 помилок у дюжині категорій, включаючи помилки узагальнення та помилки причинно-наслідкових зв'язків. Деякі з помилок є явно або потенційно статистичними, включаючи помилки вибірки, статистичну нісенітницю, статистичну ймовірність, хибну екстраполяцію, хибну інтерполяцію та підступне узагальнення. Усі технічні/математичні проблеми застосування ймовірності вписуються в єдину зазначену помилку статистичної ймовірності. Багато помилок можуть бути пов'язані зі статистичним аналізом, допускаючи можливість помилкового висновку, що випливає з бездоганного статистичного аналізу.
Прикладом використання статистики є аналіз медичних досліджень. Процес включаєпланування експерименту, проведення експерименту, аналіз даних, складання логічних висновків і презентацію/звітування. Звіт підсумовано популярною пресою та рекламодавцями. Хибне використання статистики може бути результатом проблем на будь-якому етапі процесу. Статистичні стандарти, які ідеально застосовуються до наукового звіту, значно відрізняються від стандартів, які застосовуються до популярної преси та рекламодавців; однак існують випадки, коли [en].
Прості причини
Багато хибних використань статистики відбувається тому, що
- Джерело є фахівцем у певній галузі, а не експертом зі статистики. Джерело може неправильно використовувати метод або неправильно інтерпретувати результат.
- Джерело є статистиком, а не фахівцем. Експерт повинен знати, коли порівнювані числа описують різні речі. Цифри змінюються, як не змінюється реальність, коли змінюються юридичні визначення чи політичні кордони.
- Предмет, який вивчається, не є чітко визначеним , або деякі його аспекти легко визначити кількісно, тоді як інші важко визначити, або не існує відомого методу кількісного визначення (див. помилку Макнамари). Наприклад:
- Незважаючи на те, що тести на IQ є чисельними, важко визначити, що вони вимірюють, оскільки інтелект — це невловиме поняття.
- «Впливовість» видання має ту саму проблему. Наукові статті та наукові журнали часто оцінюють за «впливовістю», яку кількісно визначається як кількість цитувань у пізніших публікацій. Математики та статистики дійшли висновку, що показник впливовості (хоч і відносно об'єктивний) не є дуже значущим показником. «Єдина опора на дані цитування забезпечують в кращому випадку неповне і часто поверхове розуміння досліждення. Цифри за своєю суттю не є вищими за розумні судження».
- Здавалося б, просте питання про кількість слів в англійській мові відразу натикається на питання про архаїчні форми, облік префіксів і суфіксів, багатозначність слова, варіанти написання, діалекти, вигадливі твори (як ектопластика з ектоплазми і статистика) , технічну лексику тощо.
- Якість даних низька. Прикладом є розміри одягу. Люди мають широкий діапазон розмірів і форм тіла. Очевидно, що розміри одягу повинні бути багатовимірними. Натомість вони складні несподіваним чином. Деякий одяг продається лише за розміром (без прямого врахування форми тіла), розміри залежать від країни та виробника, а деякі розміри навмисно вводять в оману. Хоча розміри є числовими, за умови обережного використання числових значень розмірів, можливий лише найгрубіший статистичний аналіз.
- Популярна преса має обмежений досвід і змішані мотиви. Якщо факти «не заслуговують на висвітлення у новинах» (що може вимагати перебільшення), вони можуть бути не опубліковані. Мотиви рекламістів ще більш неоднозначні.
- «Політики використовують статистику так само, як п'яниця використовує ліхтарні стовпи — для підтримки, а не для освітлення» — Ендрю Ленг (WikiQuote) «Чого ми дізнаємося з цих двох способів розгляду тих самих цифр? Ми дізнаємося, що розумний пропагандист, праворуч чи ліворуч, майже завжди може знайти спосіб представити дані про економічне зростання, які, здається, підтверджують її аргументи. Тому ми також навчимося сприймати будь-який статистичний аналіз із сильно політичного джерела жменями солі». Термін «статистика» походить від чисел, які генеруються та використовуються державою. Хороший уряд може потребувати точних цифр, але популістичний уряд може потребувати підтримуючих цифр (не обов'язково однакових). «Використання та зловживання статистичними даними урядами є давнім мистецтвом».
Види неправильного використання
Відкидання несприятливих спостережень
Все, що компанія повинна зробити для просування нейтрального (некорисного) продукту, це знайти або провести, наприклад, 40 досліджень з рівнем довіри 95 %. Якщо продукт справді марний, це в середньому призведе до одного дослідження, яке показує, що продукт був корисним, одного дослідження, яке показує, що він шкідливий, і тридцяти восьми безрезультатних досліджень (38 — це 95 % із 40). Ця тактика стає ефективнішою, чим більше доступних досліджень. Організації, які не публікують кожне дослідження, яке вони проводять, наприклад тютюнові компанії, які заперечують зв'язок між курінням і раком, групи захисту інтересів проти куріння та засоби масової інформації, які намагаються довести зв'язок між курінням і різними захворюваннями, або продавці чудодійних таблеток, ймовірно, використовувати цю тактику.
Рональд Фішер розглянув це питання у своєму прикладі експерименту знаменитої жінки, яка куштує чай (з його книги 1935 року [en]). Стосовно повторних експериментів він сказав: «Це було б явно незаконним і позбавило б наші розрахунки основи, якби всі невдалі результати не були враховані».
Інший термін, пов'язаний з цим поняттям, — вибіркові докази.
Ігнорування важливих ознак
Багатоваріантні набори даних мають дві або більше ознак/вимірів. Якщо для аналізу вибрано занадто мало з цих ознак (наприклад, якщо вибрано лише одну ознаку та виконується проста лінійна регресія замість множинної лінійної регресії), результати можуть ввести в оману. Це робить аналітика вразливим до будь-якого з різноманітних або в деяких (не у всіх) випадках хибної причинності, як показано нижче.
Навантажені питання
Відповідями на опитування часто можна маніпулювати, формулюючи питання таким чином, щоб спровокувати перевагу певної відповіді респондента. Наприклад, під час опитування на підтримку війни запитання:
- Чи підтримуєте ви спробу США принести свободу та демократію в інші місця світу?
- Чи підтримуєте ви неспровоковані військові дії США?
ймовірно, дані будуть спотворені в різні боки, хоча вони обидва опитують щодо підтримки війни. Краще сформулювати запитання так: «Чи підтримуєте ви поточні військові дії США за кордоном?» Ще більш нейтральний спосіб поставити це питання: «Яка ваша думка щодо поточних військових дій США за кордоном?» Справа в тому, що особа, яку запитують, не може здогадатися з формулювання, що запитувач може хотіти почути.
Інший спосіб зробити це — передати до запитання інформацію, яка підтверджує «бажану» відповідь. Наприклад, більше людей, ймовірно, відповість «так» на запитання «Враховуючи зростаючий тягар податків для сімей середнього класу, чи підтримуєте ви зниження податку на прибуток?» ніж на запитання «Враховуючи зростаючий дефіцит федерального бюджету та відчайдушну потребу в додаткових надходженнях, чи підтримуєте ви скорочення прибуткового податку?»
Правильна постановка питань може бути дуже тонкою. Відповіді на два запитання можуть сильно відрізнятися залежно від порядку їх постановки. «Опитування, яке запитувало про „володіння акціями“, показало, що більшість власників ранчо Техасу володіли акціями, хоча, ймовірно, не такими, якими торгують на Нью-Йоркській фондовій біржі».
Надмірне узагальнення
Надмірне узагальнення — це помилка, яка виникає, коли стверджується, що статистичні дані щодо певної сукупності відповідають членам групи, для якої вихідна сукупність не є репрезентативною вибіркою.
Наприклад, припустимо, що влітку 100 % яблук червоні. Твердження «Усі яблука червоні» було б прикладом надмірного узагальнення, оскільки початкова статистика була вірною лише для певної підмножини яблук (тих, що були влітку), які, як очікується, не будуть репрезентативними для сукупності яблук загалом.
Реальний приклад помилки надмірного узагальнення можна спостерігати як артефакт сучасних методів опитування, які забороняють дзвонити на мобільні телефони для політичних опитувань по телефону. Оскільки молоді люди частіше, ніж інші демографічні групи, не володіють звичайним «стаціонарним» телефоном, телефонне опитування, у якому беруть участь виключно відповіді на дзвінки зі стаціонарних телефонів, може призвести до того, що результати опитування занизять вибірку поглядів молодих людей, якщо не вжити інших заходів щоб врахувати цей перекіс вибірки. Таким чином, опитування, яке вивчає виборчі переваги молодих людей за допомогою цієї методики, може бути не зовсім точним відображенням справжніх виборчих уподобань молодих людей у цілому без надмірного узагальнення, оскільки використана вибірка виключає молодих людей, які носять лише мобільні телефони, які можуть або можуть не мати виборчих уподобань, які відрізняються від решти населення.
Надмірне узагальнення часто відбувається, коли інформація передається через нетехнічні джерела, зокрема засоби масової інформації.
Упереджені вибірки
Приклад: ефект плацебо (розум над тілом) дуже потужний. У 100 % суб'єктів з'явилася висипка під час впливу інертної речовини, яка помилково називалася отруйним плющем, тоді як у небагатьох з'явилася висипка на «нешкідливому» предметі, який насправді був отруйним плющем. Дослідники борються з цим ефектом шляхом подвійних сліпих рандомізованих порівняльних експериментів. Статистики зазвичай більше турбуються про достовірність даних, ніж про аналіз. Це відображено в галузі дослідження статистики, відомої як планування експериментів.
Вибірковий вплив стільникових телефонів на збір даних (обговорюється в розділі «Надмірне узагальнення») є одним із потенційних прикладів; Якщо молоді люди зі звичайними телефонами не є репрезентативними, вибірка може бути необ'єктивною. Вибіркові опитування мають багато підводних каменів і вимагають особливої обережності у виконанні. Одна спроба вимагала майже 3000 телефонних дзвінків, щоб отримати 1000 відповідей. Проста випадкова вибірка генеральної сукупності «не проста і не може бути випадковою».
Невірне повідомлення або неправильне розуміння оцінки помилки
Якщо дослідницька група хоче знати, як 300 мільйонів людей ставляться до певної теми, було б недоцільно запитувати їх усіх. Однак, якщо команда обере випадкову вибірку приблизно з 1000 осіб, вона може бути досить впевнена, що результати, надані цією групою, є репрезентативними щодо того, що сказала б більша група, якби їх усіх запитали.
Цю впевненість насправді можна кількісно визначити центральною граничною теоремою та іншими математичними результатами. Впевненість виражається як ймовірність того, що справжній результат (для більшої групи) знаходиться в межах певного діапазону оцінки (цифра для меншої групи). Це цифра «плюс-мінус», яку часто цитують у статистичних дослідженнях. Імовірнісна частина рівня довіри зазвичай не згадується; якщо так, то вважається, що це стандартне число, наприклад 95 %.
Ці два числа пов'язані. Якщо опитування має оцінену похибку ±5 % при достовірності 95 %, воно також має оцінену помилку ±6,6 % при довірчій достовірності 99 %. ± % при 95 % достовірності завжди дорівнює ± % при 99 % достовірності для нормально розподіленої сукупності.
Чим менша оцінена помилка, тим більша необхідна вибірка при заданому рівні достовірності; наприклад, з довірою 95,4 % :
- ±1 % потребує 10 000 осіб.
- ±2 % потребує 2500 осіб.
- ±3 % вимагатиме 1111 осіб.
- ±4 % потребує 625 осіб.
- ±5 % потребує 400 осіб.
- ±10 % потребує 100 осіб.
- ±20 % потребує 25 осіб.
- ±25 % потребує 16 осіб.
- ±50 % потребує 4 осіб.
Люди можуть припустити, оскільки цифра достовірності пропущена, що існує 100 % впевненість, що справжній результат знаходиться в межах оціненої похибки. Це не є математично правильним.
Багато людей можуть не усвідомлювати, що випадковість вибірки дуже важлива. На практиці багато опитувань громадської думки проводяться телефоном, що декількома способами спотворює вибірку, включаючи виключення людей, які не мають телефонів, перевагу включення людей, які мають більше одного телефону, перевагу включення людей, які готові участь у телефонному опитуванні над тими, хто відмовляється тощо. Невипадкова вибірка робить оцінену помилку ненадійною.
З іншого боку, люди можуть вважати, що статистика за своєю суттю ненадійна, тому що не всіх викликають або тому, що їх самих ніколи не опитують. Люди можуть подумати, що неможливо отримати дані про думку десятків мільйонів людей, просто опитавши кілька тисяч. Це теж неточно. Опитування з ідеальною неупередженою вибіркою та правдивими відповідями має математично визначену межу похибки, яка залежить лише від кількості опитаних людей.
Однак часто для опитування повідомляється лише про одну похибку. Коли повідомляються результати для підгруп населення, застосовуватиметься більша похибка, але це може бути неясно. Наприклад, опитування 1000 осіб може містити 100 осіб певної етнічної чи економічної групи. Результати, зосереджені на цій групі, будуть набагато менш надійними, ніж результати для всієї сукупності. Якщо похибка для повної вибірки становила, скажімо, 4 %, то похибка для такої підгрупи може становити близько 13 %.
Існує також багато інших проблем вимірювання в опитуваннях населення.
Зазначені вище проблеми стосуються всіх статистичних експериментів, а не лише опитувань населення.
Помилкова причинність
Коли статистичний тест показує кореляцію між A і B, зазвичай є шість можливостей:
- А є причиною В.
- В є причиною А.
- A і B частково спричиняють один одного.
- А і В спричинені третім фактором, С.
- B спричинено C, який корелює з A.
- Спостережувана кореляція була цілком випадковою.
Шоста можливість може бути визначена кількісно за допомогою статистичних тестів, які можуть обчислити ймовірність того, що спостережувана кореляція буде такою ж великою, як і випадкова, якщо фактично між змінними немає зв'язку. Однак, навіть якщо така можливість має невелику ймовірність, все одно існують п'ять інших.
Якщо кількість людей, які купують морозиво на пляжі, статистично пов'язана з кількістю людей, які потонули на пляжі, тоді ніхто не стане стверджувати, що морозиво викликає потоплення, оскільки очевидно, що це не так. (У цьому випадку як утоплення, так і купівля морозива чітко пов'язані третім фактором: кількістю людей на пляжі).
Цю помилку можна використати, наприклад, щоб довести, що вплив хімічної речовини викликає рак. Замініть «кількість людей, які купують морозиво» на «кількість людей, які зазнали впливу хімікату Х», а «кількість людей, які потонули» на «кількість людей, які захворіли на рак», і багато людей вам повірять. У такій ситуації може існувати статистична кореляція, навіть якщо реального ефекту немає. Наприклад, якщо існує думка, що хімічний завод є «небезпечним» (навіть якщо це насправді не так), вартість власності в цьому районі знизиться, що спонукатиме більше сімей з низьким рівнем доходу переїхати в цей район. Якщо сім'ї з низьким рівнем доходу мають більше шансів захворіти на рак, ніж сім'ї з високим рівнем доходу (через погане харчування, наприклад, або обмежений доступ до медичної допомоги), то рівень раку зростатиме, навіть якщо хімічна речовина сама по собі не є небезпечною. Вважається, що саме це сталося з деякими ранніми дослідженнями, які показали зв'язок між ЕМП (електромагнітними полями) від ліній електропередач і раком.
У добре спланованих дослідженнях ефект хибного причинно-наслідкового зв'язку можна усунути шляхом розподілу деяких людей у «групу лікування», а деяких людей у «контрольну групу» випадковим чином, призначаючи групі лікування лікування, і не даючи контрольній групі лікування. У наведеному вище прикладі дослідник може піддати дії хімічної речовини Х одну групу людей і залишити другу групу без впливу. Якщо в першій групі були вищі показники раку, дослідник знає, що немає третього фактора, який би вплинув на те, чи була людина піддана дії речовини, оскільки він контролював, хто був підданий дії речовини чи ні, і він випадковим чином розподіляв людей на групи, які піддавалися дії речовини, і до груп, що не піддавалися дії речовини. Однак у багатьох додатках фактичне проведення експерименту таким чином є або надмірно дорогим, нездійсненним, неетичним, незаконним або просто неможливим. Наприклад, дуже малоймовірно, що прийме експеримент, який передбачає навмисне піддавання людей дії небезпечної речовини з метою перевірки її токсичності. Очевидні етичні наслідки таких типів експериментів обмежують здатність дослідників емпірично перевіряти причинно-наслідковий зв'язок.
Доказ нульової гіпотези
У статистичному тесті нульова гіпотеза () вважається дійсною, доки достатньо даних не підтвердить її неправильність. Потім відхиляється, а альтернативна гіпотеза () вважається доведеною як правильна. Випадково це може статися, хоча вірно, з ймовірністю позначеною (рівень значущості). Це можна порівняти з судовим процесом, де обвинувачений вважається невинним () доки вину не буде доведено () поза розумним сумнівом ().
Але якщо дані не дають нам достатньо доказів, щоб відхилити , це автоматично не доводить правильності . Якщо, наприклад, виробник тютюну бажає продемонструвати, що його продукція безпечна, він може легко провести тест із невеликою вибіркою курців проти невеликої вибірки некурців. Малоймовірно, що хтось із них захворіє на рак легенів (і навіть якщо це станеться, різниця між групами має бути дуже великою, щоб відхилити ). Тому цілком ймовірно, що наш тест не відхилить , навіть коли куріння небезпечне. Якщо прийнято, це не означає автоматично, що куріння доведено нешкідливим. Тест має недостатню потужність для відхилення , тому тест марний і значення «доказу» також є нульовим.
Це можна — використовуючи наведений вище судовий аналог — порівняти з дійсно винним підсудним, якого звільняють лише тому, що доказів недостатньо для винесення обвинувального вироку. Це не доводить невинуватість підсудного, а лише те, що доказів недостатньо для винесення обвинувального вироку.
«…нульова гіпотеза ніколи не доведена або встановлена, але вона, можливо, спростовується в ході експерименту. Можна сказати, що кожен експеримент існує лише для того, щоб дати фактам шанс спростувати нульову гіпотезу». (Фішер у [en]) Існує багато причин для плутанини, включаючи використання подвійної негативної логіки та термінології, що є результатом злиття Фішерового «перевірки значущості» (де нульова гіпотеза ніколи не приймається) з «перевіркою гіпотези» (де деяка гіпотеза завжди приймається).
Плутання статистичної значущості з практичною значущістю
Статистична значущість є мірою ймовірності; практичне значення є мірою ефекту. Лікування облисіння є статистично значущим, якщо рідкісний персиковий пух зазвичай покриває раніше голу шкіру голови. Лікування є практично значущим, коли шапка більше не потрібна в холодну погоду, а перукар запитує, скільки знімати зверху. Лисі хочуть лікування, яке є як статистично, так і практично значущим. Ймовірно, це спрацює, і якщо це спрацює, це матиме великий ефект волосся. Наукова публікація часто вимагає лише статистичної значущості. Це призвело до скарг (за останні 50 років), що перевірка статистичної значущості є неправильним використанням статистики.
Просіювання даних
Просіювання даних є зловживанням інтелектуальним аналізом даних. Під час просіювання даних досліджуються великі компіляції даних, щоб знайти кореляцію, без будь-якого попередньо визначеного вибору гіпотези для перевірки. Оскільки необхідний довірчий інтервал для встановлення зв'язку між двома параметрами зазвичай вибирається рівним 95 % (це означає, що існує 95 % ймовірність того, що спостережуваний зв'язок не є випадковим), таким чином існує 5 % шанс знайти кореляцію між будь-якими двома наборами абсолютно випадкових змінних. З огляду на те, що спроби просіювання даних зазвичай вивчають великі набори даних із багатьма змінними, а отже, навіть більшу кількість пар змінних, будь-яке таке дослідження майже напевно одержить помилкові, але, очевидно, статистично значущі результати.
Зауважте, що просіювання даних є дійсним способом пошуку можливої гіпотези, але цю гіпотезу потрібно потім перевірити з даними, які не використовувалися в початковому просіюванні. Зловживання виникає, коли цю гіпотезу висловлюють як факт без подальшого підтвердження.
«Ви не можете законно перевірити гіпотезу на тих самих даних, на яких вперше висунули цю гіпотезу. Засіб зрозумілий. Коли у вас є гіпотеза, розробіть дослідження для конкретного пошуку ефекту, який, на вашу думку, є. Якщо результат цього тесту є статистично значущим, у вас нарешті є реальні докази»
Маніпулювання даними
Ця практика, неофіційно названа «підробкою даних», включає вибіркове звітування (див. також упередженість публікації) і навіть просто створення неправдивих даних.
Прикладів вибіркового звітування чимало. Найпростіші та найпоширеніші приклади включають вибір групи результатів, які відповідають шаблону, узгодженому з переважною гіпотезою, ігноруючи при цьому інші результати або «прогони даних», які суперечать гіпотезі.
Вчені, як правило, сумніваються в достовірності результатів дослідження, які не можуть бути відтворені іншими дослідниками. Однак деякі вчені відмовляються публікувати свої дані та методи.
Маніпулювання даними є серйозною проблемою/розглядом у найчеснішому статистичному аналізі. Викиди, відсутні дані та відхилення від норми можуть негативно вплинути на достовірність статистичного аналізу. Доцільно вивчити дані та усунути реальні проблеми перед початком аналізу. «[На] будь-якій точковій діаграмі будуть деякі точки, більш-менш відокремлені від основної частини хмари: ці точки слід відхиляти лише з причини».
Інші помилки
[en] — технічна помилка, пов'язана з дисперсійним аналізом . Складність приховує той факт, що статистичний аналіз намагається провести на одній вибірці (N=1). Для цього виродженого випадку дисперсія не може бути обчислена (поділ на нуль). (N=1) завжди дасть досліднику найвищу статистичну кореляцію між упередженням наміру та фактичними результатами.
Помилка гравця припускає, що подія, для якої можна виміряти майбутню ймовірність, мала таку саму ймовірність відбутися, коли вона вже сталася. Таким чином, якщо хтось уже кинув 9 монет, і кожна з них вийшла орелами, люди схильні припускати, що ймовірність того, що десятий підкидок також буде орелами, становить 1023 до 1 проти (що було до того, як було підкинуто першу монету), хоча насправді ймовірність десятої голови становить 50 % (припускаючи, що монета неупереджена).
Помилка прокурора припускає, що ймовірність того, що очевидно злочинна подія є випадковою, дорівнює ймовірності того, що підозрюваний невинний. Яскравим прикладом у Великобританії є незаконне засудження [en] за вбивство двох її синів, які, як видається, померли від синдрому раптової дитячої смерті (СРДС). У своїх експертних свідченнях нині дискредитований професор сер [en] стверджував, що через рідкість СРДС ймовірність того, що Кларк буде невинним, становить 1 до 73 мільйонів. Пізніше Королівське статистичне товариство поставило це під сумнів; якщо припустити, що цифра Медоуз була точною, потрібно зважити всі можливі пояснення одне проти одного, щоб зробити висновок, що, найімовірніше, спричинило незрозумілу смерть двох дітей. Наявні дані свідчать про те, що шанси будуть на користь подвійного СРДС порівняно з подвійним вбивством у дев'ять разів. Цифра 1 на 73 мільйони також вводила в оману, оскільки її було отримано шляхом визначення ймовірності смерті дитини від СРДС із заможної сім'ї, яка не палить, і зведення її до квадрата: це помилково розглядає кожну смерть як статистично незалежну, припускаючи, що фактор не існує., як-от генетика, що підвищить імовірність смерті двох братів і сестер від СРДС. Це також приклад екологічної помилки, оскільки припускається, що ймовірність СРДС у родині Кларка була такою ж, як середня для всіх заможних сімей, які не палили; соціальний клас — це дуже складне й багатогранне поняття, що включає багато інших змінних, таких як освіта, вид роботи та багато іншого. Припущення, що окрема особа матиме ті самі якості, що й решта даної групи, не враховує вплив інших змінних, які, у свою чергу, можуть ввести в оману. Засудження Саллі Кларк зрештою було скасовано, а Медоуз було вилучено з медичного реєстру.
[en]. Імовірності базуються на простих моделях, які ігнорують реальні (якщо віддалені) можливості. Гравці в покер не вважають, що опонент може взяти пістолет, а не карту. Страхувальники (і уряди) припускають, що страховики залишаться платоспроможними, але бачать AIG і [en].
Інші види зловживання
Інші зловживання включають порівняння яблук і апельсинів, використання неправильного середнього,регресію до середнього значення та фразу-парасольку сміття на вході, сміття на виході . Деякі статистичні дані просто не мають відношення до проблеми.
Квартет Анскомба — це вигаданий набір даних, який демонструє недоліки простої описової статистики (та цінність побудови даних перед чисельним аналізом).
Див. також
- Обман
- Екологічна помилка
- [en]
- Метанаука
- [en]
- Оманлива графіка
- Post hoc аналіз
- Парадокс Сімпсона
- [en]
Примітки
Зноски
- Some data on accuracy of polls is available. Regarding one important poll by the U.S. government, "Relatively speaking, both [en] and non-sampling [bias] error are tiny." The difference between the votes predicted by one private poll and the actually tally for American presidential elections is available for comparison at «Election Year Presidential Preferences: Gallup Poll Accuracy Record: 1936—2012». The predictions were typically calculated on the basis of less than 5000 opinions by likely voters.
Джерела
- Spirer, Spirer та Jaffe, 1998, с. 1.
- Gardenier, John; Resnik, David (2002). The misuse of statistics: concepts, tools, and a research agenda. Accountability in Research: Policies and Quality Assurance. 9 (2): 65—74. doi:10.1080/08989620212968. PMID 12625352.
- Fischer, David (1979). Historians' fallacies: toward a logic of historical thought. New York: Harper & Row. с. 337—338. ISBN .
- Strasak, Alexander M.; Qamruz Zaman; Karl P. Pfeiffer; Georg Göbel; Hanno Ulmer (2007). Statistical errors in the medical research-a review of common pitfalls. Swiss Medical Weekly. 137 (3–4): 44—49. doi:10.4414/smw.2007.11587. PMID 17299669. In this article anything less than the best statistical practice is equated to the potential misuse of statistics. In a few pages 47 potential statistical errors are discussed; errors in study design, data analysis, documentation, presentation and interpretation. «[S]tatisticians should be involved early in study design, as mistakes at this point can have major repercussions, negatively affecting all subsequent stages of medical research.»
- Indrayan, Abhaya (2007). Statistical fallacies in orthopedic research. Indian Journal of Orthopaedics. 41 (1): 37—46. doi:10.4103/0019-5413.30524. PMC 2981893. PMID 21124681.
{{}}
: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом () Contains a rich list of medical misuses of statistics of all types. - Spirer, Spirer та Jaffe, 1998, chapters 7 & 8.
- Spirer, Spirer та Jaffe, 1998, chapter 3.
- Spirer, Spirer та Jaffe, 1998, chapter 4.
- Adler, Robert; John Ewing; Peter Taylor (2009). Citation statistics. Statistical Science. 24 (1): 1—14. doi:10.1214/09-STS285.
- Spirer, Spirer та Jaffe, 1998, chapter title.
- Spirer, Spirer та Jaffe, 1998, chapter 5.
- Weatherburn, Don (November 2011), (PDF), Crime and Justice Bulletin: Contemporary Issues in Crime and Justice, NSW Bureau of Crime Statistics and Research, 153, ISBN , ISSN 1030-1046, архів оригіналу (PDF) за 21 червня 2014 This Australian report on crime statistics provides numerous examples of interpreting and misinterpreting the data. «The increase in media access to information about crime has not been matched by an increase in the quality of media reporting on crime. The misuse of crime statistics by the media has impeded rational debate about law and order.» Among the alleged media abuses: selective use of data, selective reporting of facts, misleading commentary, misrepresentation of facts and misleading headlines. Police and politicians also abused the statistics.
- Krugman, Paul (1994). Peddling prosperity: economic sense and nonsense in the age of diminished expectations. New York: W.W. Norton. с. 111. ISBN .
- Spirer, Spirer та Jaffe, 1998.
- Kahneman, 2013, с. 102.
- Moore та Notz, 2006, с. 59.
- Moore та Notz, 2006, с. 97.
- Moore та McCabe, 2003, с. 252—254.
- Moore та Notz, 2006, с. 53, Sample surveys in the real world.
- Freedman, Pisani та Purves, 1998, chapter 22: Measuring Employment and Unemployment, p. 405.
- Freedman, Pisani та Purves, 1998, с. 389—390.
- Farley, John W. (2003). (ред.). Power Lines and Cancer: Nothing to Fear. Quackwatch.
- Vince, Gaia (3 червня 2005). . New Scientist. Архів оригіналу за 16 серпня 2014. Cites: Draper, G. (2005). Childhood cancer in relation to distance from high voltage power lines in England and Wales: a case-control study. BMJ. 330 (7503): 1290. doi:10.1136/bmj.330.7503.1290. PMC 558197. PMID 15933351.
- Moore та McCabe, 2003, с. 463.
- Rozeboom, William W. (1960). The fallacy of the null-hypothesis significance test. Psychological Bulletin. 57 (5): 416—428. doi:10.1037/h0042040. PMID 13744252.
- Moore та McCabe, 2003, с. 466.
- Neylon, C (2009). . Research Information. Europa Science. 41: 22—23. ISSN 1744-8026. Архів оригіналу за 3 грудня 2013.
- Freedman, Pisani та Purves, 1998
- Seife, Charles (2011). Proofiness: how you're being fooled by the numbers. New York: Penguin. с. 203–205 and Appendix C. ISBN . Discusses the notorious British case.
- Royal Statistical Society (23 October 2001). « (PDF). Архів оригіналу (PDF) за 24 серпня 2011. (28.0 KB)»
- Hill, R. (2004). Multiple sudden infant deaths – coincidence or beyond coincidence?. Paediatric and Perinatal Epidemiology. 18 (5): 320—6. doi:10.1111/j.1365-3016.2004.00560.x. PMID 15367318.
- Beyond reasonable doubt. Plus Maths (англ.). Процитовано 1 квітня 2022.
- Watkins, Stephen J. (1 січня 2000). Conviction by mathematical error?: Doctors and lawyers should get probability theory right. BMJ (англ.). 320 (7226): 2—3. doi:10.1136/bmj.320.7226.2. ISSN 0959-8138. PMC 1117305. PMID 10617504.
- Dyer, Clare (21 липня 2005). Professor Roy Meadow struck off. BMJ (англ.). 331 (7510): 177. doi:10.1136/bmj.331.7510.177. ISSN 0959-8138. PMC 1179752. PMID 16037430.
- Huff, 1954, chapter 2.
- Kahneman, 2013, chapter 17.
- Hooke, 1983, §50.
- Campbell, 1974, chapter 3: Meaningless statistics.
Подальше читання
- Campbell, Stephen (1974). Flaws and fallacies in statistical thinking. Prentice Hall. ISBN .
- Christensen, R.; Reichert, T. (1976). Unit Measure Violations in Pattern Recognition, Ambiguity and Irrelevancy. Pattern Recognition. 8 (4): 239—245. Bibcode:1976PatRe...8..239C. doi:10.1016/0031-3203(76)90044-3.
- Ercan I, Yazici B, Yang Y, Ozkaya G, Cangur S, Ediz B, Kan I (2007). (PDF). European Journal of General Medicine. 4 (3): 127—133. doi:10.29333/ejgm/82507. Архів оригіналу (PDF) за 13 листопада 2014.
- Ercan I, Yazici B, Ocakoglu G, Sigirli D, Kan I (2007). (PDF). InterStat. Архів оригіналу (PDF) за 28 серпня 2013.
- Freedman, David; Pisani, Robert; Purves, Roger (1998). Statistics (вид. 3rd). W.W. Norton. ISBN .
- Hooke, Robert (1983). How to tell the liars from the statisticians. New York: M. Dekker. ISBN .
- Huff, Darrell (1954). How to Lie with Statistics. W. W. Norton & Company. LCCN 53013322. OL 6138576M.
- Kahneman, Daniel (2013). Thinking, fast and slow. New York: Farrar, Straus and Giroux. ISBN .
- Moore, David; McCabe, George P. (2003). Introduction to the practice of statistics (вид. 4th). New York: W.H. Freeman and Co. ISBN .
- Moore, David; Notz, William I. (2006). Statistics: concepts and controversies (вид. 6th). New York: W.H. Freeman. ISBN .
- Spirer, Herbert; Spirer, Louise; Jaffe, A. J. (1998). Misused statistics (вид. revised and expanded 2nd). New York: M. Dekker. ISBN . The book is based on several hundred examples of misuse.
- Oldberg, T. and R. Christensen (1995) «Erratic Measure» in NDE for the Energy Industry 1995, The American Society of Mechanical Engineers. (pages 1–6) Republished on the Web by ndt.net
- Oldberg, T. (2005) "An Ethical Problem in the Statistics of Defect Detection Test Reliability, " Speech to the Golden Gate Chapter of the American Society for Nondestructive Testing. Published on the Web by ndt.net
- Stone, M. (2009) Failing to Figure: Whitehall's Costly Neglect of Statistical Reasoning, Civitas, London.
- Galbraith, J.; Stone, M. (2011). The abuse of regression in the National Health Service allocation formulae: Response to the Department of Health's 2007 'resource allocation research paper'. . 174 (3): 517—528. doi:10.1111/j.1467-985X.2010.00700.x.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Hibne vikoristannya statistiki vidbuvayetsya koli statistichnij argument stverdzhuye nepravdu Statistika yaksho yiyi vikoristovuvati v hibnij sposib mozhe zmusiti vipadkovogo sposterigacha poviriti v shos inshe nizh te sho pokazuyut dani U deyakih vipadkah nepravilne vikoristannya mozhe buti vipadkovim V inshih ce cilespryamovano ta z metoyu nazhivi zlovmisnika Yaksho zaluchene statistichne sudzhennya hibne abo nepravilno zastosovane ce ye statistichnoyu pomilkoyu Vikoristati statistiku pomilkovo duzhe legko Profesijnih vchenih navit matematikiv i profesijnih statistikiv mozhna obduriti navit yakimis prostimi metodami navit yaksho voni retelno vse pereviryayut Vidomo sho vcheni obmanyuyut sebe statistikoyu cherez brak znan teoriyi jmovirnostej i brak standartizaciyi svoyih testiv Viznachennya obmezhennya ta kontekstOdne z viznachen yake mozhna vikoristovuvati take Zlovzhivannya statistichnimi danimi vikoristannya chisel takim chinom sho abo navmisno abo cherez neznannya chi neoberezhnist visnovki ye nevipravdanimi abo nepravilnimi Cifri mistyat omanlivu grafiku pro yaku jdetsya v inshih miscyah Cej termin ridko zustrichayetsya v statistichnih tekstah i nevidomo zhodnogo avtoritetnogo viznachennya Ce uzagalnennya brehni za dopomogoyu statistiki yaka bula bagato opisana na prikladah statistikiv 60 rokiv tomu Viznachennya stikayetsya z deyakimi problemami deyaki virishuyutsya v dzhereli Statistika zazvichaj viroblyaye jmovirnosti visnovki timchasovi Poperedni visnovki mistyat pohibki ta riven pohibok Zazvichaj 5 poperednih visnovkiv perevirki znachushosti ye pomilkovimi Statistiki ne zovsim zgodni shodo idealnih metodiv Statistichni metodi bazuyutsya na pripushennyah yaki ridko povnistyu vikonuyutsya Zbir danih zazvichaj obmezhuyetsya etichnimi praktichnimi ta finansovimi obmezhennyami Yak brehati za dopomogoyu statistiki viznaye sho statistika mozhe mati rizni formi Pro te chi pokazuye statistika sho produkt legkij i ekonomichnij chi nemicnij i deshevij mozhna govoriti nezalezhno vid cifr Dehto zaperechuye proti zamini statistichnoyu korektnistyu moralnogo liderstva napriklad yak cili Poklasti provinu za zlovzhivannya chasto vazhko oskilki vcheni sociologi statistiki ta reporteri chasto ye najmanimi pracivnikami abo konsultantami Pidstupne zlovzhivannya statistikoyu zavershuyetsya sluhachem sposterigachem auditoriyeyu prisyazhnim Postachalnik nadaye statistiku u viglyadi chisel abo grafiki abo fotografij do pislya sho dozvolyaye spozhivachevi zrobiti mozhlivo nevipravdani chi nepravilni visnovki Poganij stan en ta nestatistichna priroda lyudskoyi intuyiciyi dozvolyayut vvoditi v omanu bez yavnogo otrimannya pomilkovih visnovkiv Istorik pererahuvav ponad 100 pomilok u dyuzhini kategorij vklyuchayuchi pomilki uzagalnennya ta pomilki prichinno naslidkovih zv yazkiv Deyaki z pomilok ye yavno abo potencijno statistichnimi vklyuchayuchi pomilki vibirki statistichnu nisenitnicyu statistichnu jmovirnist hibnu ekstrapolyaciyu hibnu interpolyaciyu ta pidstupne uzagalnennya Usi tehnichni matematichni problemi zastosuvannya jmovirnosti vpisuyutsya v yedinu zaznachenu pomilku statistichnoyi jmovirnosti Bagato pomilok mozhut buti pov yazani zi statistichnim analizom dopuskayuchi mozhlivist pomilkovogo visnovku sho viplivaye z bezdogannogo statistichnogo analizu Prikladom vikoristannya statistiki ye analiz medichnih doslidzhen Proces vklyuchayeplanuvannya eksperimentu provedennya eksperimentu analiz danih skladannya logichnih visnovkiv i prezentaciyu zvituvannya Zvit pidsumovano populyarnoyu presoyu ta reklamodavcyami Hibne vikoristannya statistiki mozhe buti rezultatom problem na bud yakomu etapi procesu Statistichni standarti yaki idealno zastosovuyutsya do naukovogo zvitu znachno vidriznyayutsya vid standartiv yaki zastosovuyutsya do populyarnoyi presi ta reklamodavciv odnak isnuyut vipadki koli en Prosti prichiniBagato hibnih vikoristan statistiki vidbuvayetsya tomu sho Dzherelo ye fahivcem u pevnij galuzi a ne ekspertom zi statistiki Dzherelo mozhe nepravilno vikoristovuvati metod abo nepravilno interpretuvati rezultat Dzherelo ye statistikom a ne fahivcem Ekspert povinen znati koli porivnyuvani chisla opisuyut rizni rechi Cifri zminyuyutsya yak ne zminyuyetsya realnist koli zminyuyutsya yuridichni viznachennya chi politichni kordoni Predmet yakij vivchayetsya ne ye chitko viznachenim abo deyaki jogo aspekti legko viznachiti kilkisno todi yak inshi vazhko viznachiti abo ne isnuye vidomogo metodu kilkisnogo viznachennya div pomilku Maknamari Napriklad Nezvazhayuchi na te sho testi na IQ ye chiselnimi vazhko viznachiti sho voni vimiryuyut oskilki intelekt ce nevlovime ponyattya Vplivovist vidannya maye tu samu problemu Naukovi statti ta naukovi zhurnali chasto ocinyuyut za vplivovistyu yaku kilkisno viznachayetsya yak kilkist cituvan u piznishih publikacij Matematiki ta statistiki dijshli visnovku sho pokaznik vplivovosti hoch i vidnosno ob yektivnij ne ye duzhe znachushim pokaznikom Yedina opora na dani cituvannya zabezpechuyut v krashomu vipadku nepovne i chasto poverhove rozuminnya doslizhdennya Cifri za svoyeyu suttyu ne ye vishimi za rozumni sudzhennya Zdavalosya b proste pitannya pro kilkist sliv v anglijskij movi vidrazu natikayetsya na pitannya pro arhayichni formi oblik prefiksiv i sufiksiv bagatoznachnist slova varianti napisannya dialekti vigadlivi tvori yak ektoplastika z ektoplazmi i statistika tehnichnu leksiku tosho Yakist danih nizka Prikladom ye rozmiri odyagu Lyudi mayut shirokij diapazon rozmiriv i form tila Ochevidno sho rozmiri odyagu povinni buti bagatovimirnimi Natomist voni skladni nespodivanim chinom Deyakij odyag prodayetsya lishe za rozmirom bez pryamogo vrahuvannya formi tila rozmiri zalezhat vid krayini ta virobnika a deyaki rozmiri navmisno vvodyat v omanu Hocha rozmiri ye chislovimi za umovi oberezhnogo vikoristannya chislovih znachen rozmiriv mozhlivij lishe najgrubishij statistichnij analiz Populyarna presa maye obmezhenij dosvid i zmishani motivi Yaksho fakti ne zaslugovuyut na visvitlennya u novinah sho mozhe vimagati perebilshennya voni mozhut buti ne opublikovani Motivi reklamistiv she bilsh neodnoznachni Politiki vikoristovuyut statistiku tak samo yak p yanicya vikoristovuye lihtarni stovpi dlya pidtrimki a ne dlya osvitlennya Endryu Leng WikiQuote Chogo mi diznayemosya z cih dvoh sposobiv rozglyadu tih samih cifr Mi diznayemosya sho rozumnij propagandist pravoruch chi livoruch majzhe zavzhdi mozhe znajti sposib predstaviti dani pro ekonomichne zrostannya yaki zdayetsya pidtverdzhuyut yiyi argumenti Tomu mi takozh navchimosya sprijmati bud yakij statistichnij analiz iz silno politichnogo dzherela zhmenyami soli Termin statistika pohodit vid chisel yaki generuyutsya ta vikoristovuyutsya derzhavoyu Horoshij uryad mozhe potrebuvati tochnih cifr ale populistichnij uryad mozhe potrebuvati pidtrimuyuchih cifr ne obov yazkovo odnakovih Vikoristannya ta zlovzhivannya statistichnimi danimi uryadami ye davnim mistectvom Vidi nepravilnogo vikoristannyaVidkidannya nespriyatlivih sposterezhen Vse sho kompaniya povinna zrobiti dlya prosuvannya nejtralnogo nekorisnogo produktu ce znajti abo provesti napriklad 40 doslidzhen z rivnem doviri 95 Yaksho produkt spravdi marnij ce v serednomu prizvede do odnogo doslidzhennya yake pokazuye sho produkt buv korisnim odnogo doslidzhennya yake pokazuye sho vin shkidlivij i tridcyati vosmi bezrezultatnih doslidzhen 38 ce 95 iz 40 Cya taktika staye efektivnishoyu chim bilshe dostupnih doslidzhen Organizaciyi yaki ne publikuyut kozhne doslidzhennya yake voni provodyat napriklad tyutyunovi kompaniyi yaki zaperechuyut zv yazok mizh kurinnyam i rakom grupi zahistu interesiv proti kurinnya ta zasobi masovoyi informaciyi yaki namagayutsya dovesti zv yazok mizh kurinnyam i riznimi zahvoryuvannyami abo prodavci chudodijnih tabletok jmovirno vikoristovuvati cyu taktiku Ronald Fisher rozglyanuv ce pitannya u svoyemu prikladi eksperimentu znamenitoyi zhinki yaka kushtuye chaj z jogo knigi 1935 roku en Stosovno povtornih eksperimentiv vin skazav Ce bulo b yavno nezakonnim i pozbavilo b nashi rozrahunki osnovi yakbi vsi nevdali rezultati ne buli vrahovani Inshij termin pov yazanij z cim ponyattyam vibirkovi dokazi Ignoruvannya vazhlivih oznak Bagatovariantni nabori danih mayut dvi abo bilshe oznak vimiriv Yaksho dlya analizu vibrano zanadto malo z cih oznak napriklad yaksho vibrano lishe odnu oznaku ta vikonuyetsya prosta linijna regresiya zamist mnozhinnoyi linijnoyi regresiyi rezultati mozhut vvesti v omanu Ce robit analitika vrazlivim do bud yakogo z riznomanitnih abo v deyakih ne u vsih vipadkah hibnoyi prichinnosti yak pokazano nizhche Navantazheni pitannya Vidpovidyami na opituvannya chasto mozhna manipulyuvati formulyuyuchi pitannya takim chinom shob sprovokuvati perevagu pevnoyi vidpovidi respondenta Napriklad pid chas opituvannya na pidtrimku vijni zapitannya Chi pidtrimuyete vi sprobu SShA prinesti svobodu ta demokratiyu v inshi miscya svitu Chi pidtrimuyete vi nesprovokovani vijskovi diyi SShA jmovirno dani budut spotvoreni v rizni boki hocha voni obidva opituyut shodo pidtrimki vijni Krashe sformulyuvati zapitannya tak Chi pidtrimuyete vi potochni vijskovi diyi SShA za kordonom She bilsh nejtralnij sposib postaviti ce pitannya Yaka vasha dumka shodo potochnih vijskovih dij SShA za kordonom Sprava v tomu sho osoba yaku zapituyut ne mozhe zdogadatisya z formulyuvannya sho zapituvach mozhe hotiti pochuti Inshij sposib zrobiti ce peredati do zapitannya informaciyu yaka pidtverdzhuye bazhanu vidpovid Napriklad bilshe lyudej jmovirno vidpovist tak na zapitannya Vrahovuyuchi zrostayuchij tyagar podatkiv dlya simej serednogo klasu chi pidtrimuyete vi znizhennya podatku na pributok nizh na zapitannya Vrahovuyuchi zrostayuchij deficit federalnogo byudzhetu ta vidchajdushnu potrebu v dodatkovih nadhodzhennyah chi pidtrimuyete vi skorochennya pributkovogo podatku Pravilna postanovka pitan mozhe buti duzhe tonkoyu Vidpovidi na dva zapitannya mozhut silno vidriznyatisya zalezhno vid poryadku yih postanovki Opituvannya yake zapituvalo pro volodinnya akciyami pokazalo sho bilshist vlasnikiv rancho Tehasu volodili akciyami hocha jmovirno ne takimi yakimi torguyut na Nyu Jorkskij fondovij birzhi Nadmirne uzagalnennya Nadmirne uzagalnennya ce pomilka yaka vinikaye koli stverdzhuyetsya sho statistichni dani shodo pevnoyi sukupnosti vidpovidayut chlenam grupi dlya yakoyi vihidna sukupnist ne ye reprezentativnoyu vibirkoyu Napriklad pripustimo sho vlitku 100 yabluk chervoni Tverdzhennya Usi yabluka chervoni bulo b prikladom nadmirnogo uzagalnennya oskilki pochatkova statistika bula virnoyu lishe dlya pevnoyi pidmnozhini yabluk tih sho buli vlitku yaki yak ochikuyetsya ne budut reprezentativnimi dlya sukupnosti yabluk zagalom Realnij priklad pomilki nadmirnogo uzagalnennya mozhna sposterigati yak artefakt suchasnih metodiv opituvannya yaki zaboronyayut dzvoniti na mobilni telefoni dlya politichnih opituvan po telefonu Oskilki molodi lyudi chastishe nizh inshi demografichni grupi ne volodiyut zvichajnim stacionarnim telefonom telefonne opituvannya u yakomu berut uchast viklyuchno vidpovidi na dzvinki zi stacionarnih telefoniv mozhe prizvesti do togo sho rezultati opituvannya zanizyat vibirku poglyadiv molodih lyudej yaksho ne vzhiti inshih zahodiv shob vrahuvati cej perekis vibirki Takim chinom opituvannya yake vivchaye viborchi perevagi molodih lyudej za dopomogoyu ciyeyi metodiki mozhe buti ne zovsim tochnim vidobrazhennyam spravzhnih viborchih upodoban molodih lyudej u cilomu bez nadmirnogo uzagalnennya oskilki vikoristana vibirka viklyuchaye molodih lyudej yaki nosyat lishe mobilni telefoni yaki mozhut abo mozhut ne mati viborchih upodoban yaki vidriznyayutsya vid reshti naselennya Nadmirne uzagalnennya chasto vidbuvayetsya koli informaciya peredayetsya cherez netehnichni dzherela zokrema zasobi masovoyi informaciyi Uperedzheni vibirki Dokladnishe Uperedzhennya vibirki Priklad efekt placebo rozum nad tilom duzhe potuzhnij U 100 sub yektiv z yavilasya visipka pid chas vplivu inertnoyi rechovini yaka pomilkovo nazivalasya otrujnim plyushem todi yak u nebagatoh z yavilasya visipka na neshkidlivomu predmeti yakij naspravdi buv otrujnim plyushem Doslidniki boryutsya z cim efektom shlyahom podvijnih slipih randomizovanih porivnyalnih eksperimentiv Statistiki zazvichaj bilshe turbuyutsya pro dostovirnist danih nizh pro analiz Ce vidobrazheno v galuzi doslidzhennya statistiki vidomoyi yak planuvannya eksperimentiv Vibirkovij vpliv stilnikovih telefoniv na zbir danih obgovoryuyetsya v rozdili Nadmirne uzagalnennya ye odnim iz potencijnih prikladiv Yaksho molodi lyudi zi zvichajnimi telefonami ne ye reprezentativnimi vibirka mozhe buti neob yektivnoyu Vibirkovi opituvannya mayut bagato pidvodnih kameniv i vimagayut osoblivoyi oberezhnosti u vikonanni Odna sproba vimagala majzhe 3000 telefonnih dzvinkiv shob otrimati 1000 vidpovidej Prosta vipadkova vibirka generalnoyi sukupnosti ne prosta i ne mozhe buti vipadkovoyu Nevirne povidomlennya abo nepravilne rozuminnya ocinki pomilki Yaksho doslidnicka grupa hoche znati yak 300 miljoniv lyudej stavlyatsya do pevnoyi temi bulo b nedocilno zapituvati yih usih Odnak yaksho komanda obere vipadkovu vibirku priblizno z 1000 osib vona mozhe buti dosit vpevnena sho rezultati nadani ciyeyu grupoyu ye reprezentativnimi shodo togo sho skazala b bilsha grupa yakbi yih usih zapitali Cyu vpevnenist naspravdi mozhna kilkisno viznachiti centralnoyu granichnoyu teoremoyu ta inshimi matematichnimi rezultatami Vpevnenist virazhayetsya yak jmovirnist togo sho spravzhnij rezultat dlya bilshoyi grupi znahoditsya v mezhah pevnogo diapazonu ocinki cifra dlya menshoyi grupi Ce cifra plyus minus yaku chasto cituyut u statistichnih doslidzhennyah Imovirnisna chastina rivnya doviri zazvichaj ne zgaduyetsya yaksho tak to vvazhayetsya sho ce standartne chislo napriklad 95 Ci dva chisla pov yazani Yaksho opituvannya maye ocinenu pohibku 5 pri dostovirnosti 95 vono takozh maye ocinenu pomilku 6 6 pri dovirchij dostovirnosti 99 x displaystyle x pri 95 dostovirnosti zavzhdi dorivnyuye 1 32x displaystyle 1 32x pri 99 dostovirnosti dlya normalno rozpodilenoyi sukupnosti Chim mensha ocinena pomilka tim bilsha neobhidna vibirka pri zadanomu rivni dostovirnosti napriklad z doviroyu 95 4 1 potrebuye 10 000 osib 2 potrebuye 2500 osib 3 vimagatime 1111 osib 4 potrebuye 625 osib 5 potrebuye 400 osib 10 potrebuye 100 osib 20 potrebuye 25 osib 25 potrebuye 16 osib 50 potrebuye 4 osib Lyudi mozhut pripustiti oskilki cifra dostovirnosti propushena sho isnuye 100 vpevnenist sho spravzhnij rezultat znahoditsya v mezhah ocinenoyi pohibki Ce ne ye matematichno pravilnim Bagato lyudej mozhut ne usvidomlyuvati sho vipadkovist vibirki duzhe vazhliva Na praktici bagato opituvan gromadskoyi dumki provodyatsya telefonom sho dekilkoma sposobami spotvoryuye vibirku vklyuchayuchi viklyuchennya lyudej yaki ne mayut telefoniv perevagu vklyuchennya lyudej yaki mayut bilshe odnogo telefonu perevagu vklyuchennya lyudej yaki gotovi uchast u telefonnomu opituvanni nad timi hto vidmovlyayetsya tosho Nevipadkova vibirka robit ocinenu pomilku nenadijnoyu Z inshogo boku lyudi mozhut vvazhati sho statistika za svoyeyu suttyu nenadijna tomu sho ne vsih viklikayut abo tomu sho yih samih nikoli ne opituyut Lyudi mozhut podumati sho nemozhlivo otrimati dani pro dumku desyatkiv miljoniv lyudej prosto opitavshi kilka tisyach Ce tezh netochno Opituvannya z idealnoyu neuperedzhenoyu vibirkoyu ta pravdivimi vidpovidyami maye matematichno viznachenu mezhu pohibki yaka zalezhit lishe vid kilkosti opitanih lyudej Odnak chasto dlya opituvannya povidomlyayetsya lishe pro odnu pohibku Koli povidomlyayutsya rezultati dlya pidgrup naselennya zastosovuvatimetsya bilsha pohibka ale ce mozhe buti neyasno Napriklad opituvannya 1000 osib mozhe mistiti 100 osib pevnoyi etnichnoyi chi ekonomichnoyi grupi Rezultati zoseredzheni na cij grupi budut nabagato mensh nadijnimi nizh rezultati dlya vsiyeyi sukupnosti Yaksho pohibka dlya povnoyi vibirki stanovila skazhimo 4 to pohibka dlya takoyi pidgrupi mozhe stanoviti blizko 13 Isnuye takozh bagato inshih problem vimiryuvannya v opituvannyah naselennya Zaznacheni vishe problemi stosuyutsya vsih statistichnih eksperimentiv a ne lishe opituvan naselennya Pomilkova prichinnist Koli statistichnij test pokazuye korelyaciyu mizh A i B zazvichaj ye shist mozhlivostej A ye prichinoyu V V ye prichinoyu A A i B chastkovo sprichinyayut odin odnogo A i V sprichineni tretim faktorom S B sprichineno C yakij korelyuye z A Sposterezhuvana korelyaciya bula cilkom vipadkovoyu Shosta mozhlivist mozhe buti viznachena kilkisno za dopomogoyu statistichnih testiv yaki mozhut obchisliti jmovirnist togo sho sposterezhuvana korelyaciya bude takoyu zh velikoyu yak i vipadkova yaksho faktichno mizh zminnimi nemaye zv yazku Odnak navit yaksho taka mozhlivist maye neveliku jmovirnist vse odno isnuyut p yat inshih Yaksho kilkist lyudej yaki kupuyut morozivo na plyazhi statistichno pov yazana z kilkistyu lyudej yaki potonuli na plyazhi todi nihto ne stane stverdzhuvati sho morozivo viklikaye potoplennya oskilki ochevidno sho ce ne tak U comu vipadku yak utoplennya tak i kupivlya moroziva chitko pov yazani tretim faktorom kilkistyu lyudej na plyazhi Cyu pomilku mozhna vikoristati napriklad shob dovesti sho vpliv himichnoyi rechovini viklikaye rak Zaminit kilkist lyudej yaki kupuyut morozivo na kilkist lyudej yaki zaznali vplivu himikatu H a kilkist lyudej yaki potonuli na kilkist lyudej yaki zahvorili na rak i bagato lyudej vam poviryat U takij situaciyi mozhe isnuvati statistichna korelyaciya navit yaksho realnogo efektu nemaye Napriklad yaksho isnuye dumka sho himichnij zavod ye nebezpechnim navit yaksho ce naspravdi ne tak vartist vlasnosti v comu rajoni znizitsya sho sponukatime bilshe simej z nizkim rivnem dohodu pereyihati v cej rajon Yaksho sim yi z nizkim rivnem dohodu mayut bilshe shansiv zahvoriti na rak nizh sim yi z visokim rivnem dohodu cherez pogane harchuvannya napriklad abo obmezhenij dostup do medichnoyi dopomogi to riven raku zrostatime navit yaksho himichna rechovina sama po sobi ne ye nebezpechnoyu Vvazhayetsya sho same ce stalosya z deyakimi rannimi doslidzhennyami yaki pokazali zv yazok mizh EMP elektromagnitnimi polyami vid linij elektroperedach i rakom U dobre splanovanih doslidzhennyah efekt hibnogo prichinno naslidkovogo zv yazku mozhna usunuti shlyahom rozpodilu deyakih lyudej u grupu likuvannya a deyakih lyudej u kontrolnu grupu vipadkovim chinom priznachayuchi grupi likuvannya likuvannya i ne dayuchi kontrolnij grupi likuvannya U navedenomu vishe prikladi doslidnik mozhe piddati diyi himichnoyi rechovini H odnu grupu lyudej i zalishiti drugu grupu bez vplivu Yaksho v pershij grupi buli vishi pokazniki raku doslidnik znaye sho nemaye tretogo faktora yakij bi vplinuv na te chi bula lyudina piddana diyi rechovini oskilki vin kontrolyuvav hto buv piddanij diyi rechovini chi ni i vin vipadkovim chinom rozpodilyav lyudej na grupi yaki piddavalisya diyi rechovini i do grup sho ne piddavalisya diyi rechovini Odnak u bagatoh dodatkah faktichne provedennya eksperimentu takim chinom ye abo nadmirno dorogim nezdijsnennim neetichnim nezakonnim abo prosto nemozhlivim Napriklad duzhe malojmovirno sho prijme eksperiment yakij peredbachaye navmisne piddavannya lyudej diyi nebezpechnoyi rechovini z metoyu perevirki yiyi toksichnosti Ochevidni etichni naslidki takih tipiv eksperimentiv obmezhuyut zdatnist doslidnikiv empirichno pereviryati prichinno naslidkovij zv yazok Dokaz nulovoyi gipotezi U statistichnomu testi nulova gipoteza H0 displaystyle H 0 vvazhayetsya dijsnoyu doki dostatno danih ne pidtverdit yiyi nepravilnist Potim H0 displaystyle H 0 vidhilyayetsya a alternativna gipoteza HA displaystyle H A vvazhayetsya dovedenoyu yak pravilna Vipadkovo ce mozhe statisya hocha H0 displaystyle H 0 virno z jmovirnistyu poznachenoyu a displaystyle alpha riven znachushosti Ce mozhna porivnyati z sudovim procesom de obvinuvachenij vvazhayetsya nevinnim H0 displaystyle H 0 doki vinu ne bude dovedeno HA displaystyle H A poza rozumnim sumnivom a displaystyle alpha Ale yaksho dani ne dayut nam dostatno dokaziv shob vidhiliti H0 displaystyle H 0 ce avtomatichno ne dovodit pravilnosti H0 displaystyle H 0 Yaksho napriklad virobnik tyutyunu bazhaye prodemonstruvati sho jogo produkciya bezpechna vin mozhe legko provesti test iz nevelikoyu vibirkoyu kurciv proti nevelikoyi vibirki nekurciv Malojmovirno sho htos iz nih zahvoriye na rak legeniv i navit yaksho ce stanetsya riznicya mizh grupami maye buti duzhe velikoyu shob vidhiliti H0 displaystyle H 0 Tomu cilkom jmovirno sho nash test ne vidhilit H0 displaystyle H 0 navit koli kurinnya nebezpechne Yaksho H0 displaystyle H 0 prijnyato ce ne oznachaye avtomatichno sho kurinnya dovedeno neshkidlivim Test maye nedostatnyu potuzhnist dlya vidhilennya H0 displaystyle H 0 tomu test marnij i znachennya dokazu H0 displaystyle H 0 takozh ye nulovim Ce mozhna vikoristovuyuchi navedenij vishe sudovij analog porivnyati z dijsno vinnim pidsudnim yakogo zvilnyayut lishe tomu sho dokaziv nedostatno dlya vinesennya obvinuvalnogo viroku Ce ne dovodit nevinuvatist pidsudnogo a lishe te sho dokaziv nedostatno dlya vinesennya obvinuvalnogo viroku nulova gipoteza nikoli ne dovedena abo vstanovlena ale vona mozhlivo sprostovuyetsya v hodi eksperimentu Mozhna skazati sho kozhen eksperiment isnuye lishe dlya togo shob dati faktam shans sprostuvati nulovu gipotezu Fisher u en Isnuye bagato prichin dlya plutanini vklyuchayuchi vikoristannya podvijnoyi negativnoyi logiki ta terminologiyi sho ye rezultatom zlittya Fisherovogo perevirki znachushosti de nulova gipoteza nikoli ne prijmayetsya z perevirkoyu gipotezi de deyaka gipoteza zavzhdi prijmayetsya Plutannya statistichnoyi znachushosti z praktichnoyu znachushistyu Statistichna znachushist ye miroyu jmovirnosti praktichne znachennya ye miroyu efektu Likuvannya oblisinnya ye statistichno znachushim yaksho ridkisnij persikovij puh zazvichaj pokrivaye ranishe golu shkiru golovi Likuvannya ye praktichno znachushim koli shapka bilshe ne potribna v holodnu pogodu a perukar zapituye skilki znimati zverhu Lisi hochut likuvannya yake ye yak statistichno tak i praktichno znachushim Jmovirno ce spracyuye i yaksho ce spracyuye ce matime velikij efekt volossya Naukova publikaciya chasto vimagaye lishe statistichnoyi znachushosti Ce prizvelo do skarg za ostanni 50 rokiv sho perevirka statistichnoyi znachushosti ye nepravilnim vikoristannyam statistiki Prosiyuvannya danih Prosiyuvannya danih ye zlovzhivannyam intelektualnim analizom danih Pid chas prosiyuvannya danih doslidzhuyutsya veliki kompilyaciyi danih shob znajti korelyaciyu bez bud yakogo poperedno viznachenogo viboru gipotezi dlya perevirki Oskilki neobhidnij dovirchij interval dlya vstanovlennya zv yazku mizh dvoma parametrami zazvichaj vibirayetsya rivnim 95 ce oznachaye sho isnuye 95 jmovirnist togo sho sposterezhuvanij zv yazok ne ye vipadkovim takim chinom isnuye 5 shans znajti korelyaciyu mizh bud yakimi dvoma naborami absolyutno vipadkovih zminnih Z oglyadu na te sho sprobi prosiyuvannya danih zazvichaj vivchayut veliki nabori danih iz bagatma zminnimi a otzhe navit bilshu kilkist par zminnih bud yake take doslidzhennya majzhe napevno oderzhit pomilkovi ale ochevidno statistichno znachushi rezultati Zauvazhte sho prosiyuvannya danih ye dijsnim sposobom poshuku mozhlivoyi gipotezi ale cyu gipotezu potribno potim pereviriti z danimi yaki ne vikoristovuvalisya v pochatkovomu prosiyuvanni Zlovzhivannya vinikaye koli cyu gipotezu vislovlyuyut yak fakt bez podalshogo pidtverdzhennya Vi ne mozhete zakonno pereviriti gipotezu na tih samih danih na yakih vpershe visunuli cyu gipotezu Zasib zrozumilij Koli u vas ye gipoteza rozrobit doslidzhennya dlya konkretnogo poshuku efektu yakij na vashu dumku ye Yaksho rezultat cogo testu ye statistichno znachushim u vas nareshti ye realni dokazi Manipulyuvannya danimi Cya praktika neoficijno nazvana pidrobkoyu danih vklyuchaye vibirkove zvituvannya div takozh uperedzhenist publikaciyi i navit prosto stvorennya nepravdivih danih Prikladiv vibirkovogo zvituvannya chimalo Najprostishi ta najposhirenishi prikladi vklyuchayut vibir grupi rezultativ yaki vidpovidayut shablonu uzgodzhenomu z perevazhnoyu gipotezoyu ignoruyuchi pri comu inshi rezultati abo progoni danih yaki superechat gipotezi Vcheni yak pravilo sumnivayutsya v dostovirnosti rezultativ doslidzhennya yaki ne mozhut buti vidtvoreni inshimi doslidnikami Odnak deyaki vcheni vidmovlyayutsya publikuvati svoyi dani ta metodi Manipulyuvannya danimi ye serjoznoyu problemoyu rozglyadom u najchesnishomu statistichnomu analizi Vikidi vidsutni dani ta vidhilennya vid normi mozhut negativno vplinuti na dostovirnist statistichnogo analizu Docilno vivchiti dani ta usunuti realni problemi pered pochatkom analizu Na bud yakij tochkovij diagrami budut deyaki tochki bilsh mensh vidokremleni vid osnovnoyi chastini hmari ci tochki slid vidhilyati lishe z prichini Inshi pomilki en tehnichna pomilka pov yazana z dispersijnim analizom Skladnist prihovuye toj fakt sho statistichnij analiz namagayetsya provesti na odnij vibirci N 1 Dlya cogo virodzhenogo vipadku dispersiya ne mozhe buti obchislena podil na nul N 1 zavzhdi dast doslidniku najvishu statistichnu korelyaciyu mizh uperedzhennyam namiru ta faktichnimi rezultatami Pomilka gravcya pripuskaye sho podiya dlya yakoyi mozhna vimiryati majbutnyu jmovirnist mala taku samu jmovirnist vidbutisya koli vona vzhe stalasya Takim chinom yaksho htos uzhe kinuv 9 monet i kozhna z nih vijshla orelami lyudi shilni pripuskati sho jmovirnist togo sho desyatij pidkidok takozh bude orelami stanovit 1023 do 1 proti sho bulo do togo yak bulo pidkinuto pershu monetu hocha naspravdi jmovirnist desyatoyi golovi stanovit 50 pripuskayuchi sho moneta neuperedzhena Pomilka prokurora pripuskaye sho jmovirnist togo sho ochevidno zlochinna podiya ye vipadkovoyu dorivnyuye jmovirnosti togo sho pidozryuvanij nevinnij Yaskravim prikladom u Velikobritaniyi ye nezakonne zasudzhennya en za vbivstvo dvoh yiyi siniv yaki yak vidayetsya pomerli vid sindromu raptovoyi dityachoyi smerti SRDS U svoyih ekspertnih svidchennyah nini diskreditovanij profesor ser en stverdzhuvav sho cherez ridkist SRDS jmovirnist togo sho Klark bude nevinnim stanovit 1 do 73 miljoniv Piznishe Korolivske statistichne tovaristvo postavilo ce pid sumniv yaksho pripustiti sho cifra Medouz bula tochnoyu potribno zvazhiti vsi mozhlivi poyasnennya odne proti odnogo shob zrobiti visnovok sho najimovirnishe sprichinilo nezrozumilu smert dvoh ditej Nayavni dani svidchat pro te sho shansi budut na korist podvijnogo SRDS porivnyano z podvijnim vbivstvom u dev yat raziv Cifra 1 na 73 miljoni takozh vvodila v omanu oskilki yiyi bulo otrimano shlyahom viznachennya jmovirnosti smerti ditini vid SRDS iz zamozhnoyi sim yi yaka ne palit i zvedennya yiyi do kvadrata ce pomilkovo rozglyadaye kozhnu smert yak statistichno nezalezhnu pripuskayuchi sho faktor ne isnuye yak ot genetika sho pidvishit imovirnist smerti dvoh brativ i sester vid SRDS Ce takozh priklad ekologichnoyi pomilki oskilki pripuskayetsya sho jmovirnist SRDS u rodini Klarka bula takoyu zh yak serednya dlya vsih zamozhnih simej yaki ne palili socialnij klas ce duzhe skladne j bagatogranne ponyattya sho vklyuchaye bagato inshih zminnih takih yak osvita vid roboti ta bagato inshogo Pripushennya sho okrema osoba matime ti sami yakosti sho j reshta danoyi grupi ne vrahovuye vpliv inshih zminnih yaki u svoyu chergu mozhut vvesti v omanu Zasudzhennya Salli Klark zreshtoyu bulo skasovano a Medouz bulo vilucheno z medichnogo reyestru en Imovirnosti bazuyutsya na prostih modelyah yaki ignoruyut realni yaksho viddaleni mozhlivosti Gravci v poker ne vvazhayut sho oponent mozhe vzyati pistolet a ne kartu Strahuvalniki i uryadi pripuskayut sho strahoviki zalishatsya platospromozhnimi ale bachat AIG i en Inshi vidi zlovzhivannya Inshi zlovzhivannya vklyuchayut porivnyannya yabluk i apelsiniv vikoristannya nepravilnogo serednogo regresiyu do serednogo znachennya ta frazu parasolku smittya na vhodi smittya na vihodi Deyaki statistichni dani prosto ne mayut vidnoshennya do problemi Kvartet Anskomba ce vigadanij nabir danih yakij demonstruye nedoliki prostoyi opisovoyi statistiki ta cinnist pobudovi danih pered chiselnim analizom Div takozhObman Ekologichna pomilka en Metanauka en Omanliva grafika Post hoc analiz Paradoks Simpsona en PrimitkiZnoski Some data on accuracy of polls is available Regarding one important poll by the U S government Relatively speaking both en and non sampling bias error are tiny The difference between the votes predicted by one private poll and the actually tally for American presidential elections is available for comparison at Election Year Presidential Preferences Gallup Poll Accuracy Record 1936 2012 The predictions were typically calculated on the basis of less than 5000 opinions by likely voters Dzherela Spirer Spirer ta Jaffe 1998 s 1 Gardenier John Resnik David 2002 The misuse of statistics concepts tools and a research agenda Accountability in Research Policies and Quality Assurance 9 2 65 74 doi 10 1080 08989620212968 PMID 12625352 Fischer David 1979 Historians fallacies toward a logic of historical thought New York Harper amp Row s 337 338 ISBN 978 0060904982 Strasak Alexander M Qamruz Zaman Karl P Pfeiffer Georg Gobel Hanno Ulmer 2007 Statistical errors in the medical research a review of common pitfalls Swiss Medical Weekly 137 3 4 44 49 doi 10 4414 smw 2007 11587 PMID 17299669 In this article anything less than the best statistical practice is equated to the potential misuse of statistics In a few pages 47 potential statistical errors are discussed errors in study design data analysis documentation presentation and interpretation S tatisticians should be involved early in study design as mistakes at this point can have major repercussions negatively affecting all subsequent stages of medical research Indrayan Abhaya 2007 Statistical fallacies in orthopedic research Indian Journal of Orthopaedics 41 1 37 46 doi 10 4103 0019 5413 30524 PMC 2981893 PMID 21124681 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite journal title Shablon Cite journal cite journal a Obslugovuvannya CS1 Storinki iz nepoznachenim DOI z bezkoshtovnim dostupom posilannya Contains a rich list of medical misuses of statistics of all types Spirer Spirer ta Jaffe 1998 chapters 7 amp 8 Spirer Spirer ta Jaffe 1998 chapter 3 Spirer Spirer ta Jaffe 1998 chapter 4 Adler Robert John Ewing Peter Taylor 2009 Citation statistics Statistical Science 24 1 1 14 doi 10 1214 09 STS285 Spirer Spirer ta Jaffe 1998 chapter title Spirer Spirer ta Jaffe 1998 chapter 5 Weatherburn Don November 2011 PDF Crime and Justice Bulletin Contemporary Issues in Crime and Justice NSW Bureau of Crime Statistics and Research 153 ISBN 9781921824357 ISSN 1030 1046 arhiv originalu PDF za 21 chervnya 2014 This Australian report on crime statistics provides numerous examples of interpreting and misinterpreting the data The increase in media access to information about crime has not been matched by an increase in the quality of media reporting on crime The misuse of crime statistics by the media has impeded rational debate about law and order Among the alleged media abuses selective use of data selective reporting of facts misleading commentary misrepresentation of facts and misleading headlines Police and politicians also abused the statistics Krugman Paul 1994 Peddling prosperity economic sense and nonsense in the age of diminished expectations New York W W Norton s 111 ISBN 0 393 03602 2 Spirer Spirer ta Jaffe 1998 Kahneman 2013 s 102 Moore ta Notz 2006 s 59 Moore ta Notz 2006 s 97 Moore ta McCabe 2003 s 252 254 Moore ta Notz 2006 s 53 Sample surveys in the real world Freedman Pisani ta Purves 1998 chapter 22 Measuring Employment and Unemployment p 405 Freedman Pisani ta Purves 1998 s 389 390 Farley John W 2003 red Power Lines and Cancer Nothing to Fear Quackwatch Vince Gaia 3 chervnya 2005 New Scientist Arhiv originalu za 16 serpnya 2014 Cites Draper G 2005 Childhood cancer in relation to distance from high voltage power lines in England and Wales a case control study BMJ 330 7503 1290 doi 10 1136 bmj 330 7503 1290 PMC 558197 PMID 15933351 Moore ta McCabe 2003 s 463 Rozeboom William W 1960 The fallacy of the null hypothesis significance test Psychological Bulletin 57 5 416 428 doi 10 1037 h0042040 PMID 13744252 Moore ta McCabe 2003 s 466 Neylon C 2009 Research Information Europa Science 41 22 23 ISSN 1744 8026 Arhiv originalu za 3 grudnya 2013 Freedman Pisani ta Purves 1998 Seife Charles 2011 Proofiness how you re being fooled by the numbers New York Penguin s 203 205 and Appendix C ISBN 9780143120070 Discusses the notorious British case Royal Statistical Society 23 October 2001 PDF Arhiv originalu PDF za 24 serpnya 2011 28 0 KB Hill R 2004 Multiple sudden infant deaths coincidence or beyond coincidence Paediatric and Perinatal Epidemiology 18 5 320 6 doi 10 1111 j 1365 3016 2004 00560 x PMID 15367318 Beyond reasonable doubt Plus Maths angl Procitovano 1 kvitnya 2022 Watkins Stephen J 1 sichnya 2000 Conviction by mathematical error Doctors and lawyers should get probability theory right BMJ angl 320 7226 2 3 doi 10 1136 bmj 320 7226 2 ISSN 0959 8138 PMC 1117305 PMID 10617504 Dyer Clare 21 lipnya 2005 Professor Roy Meadow struck off BMJ angl 331 7510 177 doi 10 1136 bmj 331 7510 177 ISSN 0959 8138 PMC 1179752 PMID 16037430 Huff 1954 chapter 2 Kahneman 2013 chapter 17 Hooke 1983 50 Campbell 1974 chapter 3 Meaningless statistics Podalshe chitannyaCampbell Stephen 1974 Flaws and fallacies in statistical thinking Prentice Hall ISBN 0 486 43598 9 Christensen R Reichert T 1976 Unit Measure Violations in Pattern Recognition Ambiguity and Irrelevancy Pattern Recognition 8 4 239 245 Bibcode 1976PatRe 8 239C doi 10 1016 0031 3203 76 90044 3 Ercan I Yazici B Yang Y Ozkaya G Cangur S Ediz B Kan I 2007 PDF European Journal of General Medicine 4 3 127 133 doi 10 29333 ejgm 82507 Arhiv originalu PDF za 13 listopada 2014 Ercan I Yazici B Ocakoglu G Sigirli D Kan I 2007 PDF InterStat Arhiv originalu PDF za 28 serpnya 2013 Freedman David Pisani Robert Purves Roger 1998 Statistics vid 3rd W W Norton ISBN 978 0 393 97083 8 Hooke Robert 1983 How to tell the liars from the statisticians New York M Dekker ISBN 0 8247 1817 8 Huff Darrell 1954 How to Lie with Statistics W W Norton amp Company LCCN 53013322 OL 6138576M Kahneman Daniel 2013 Thinking fast and slow New York Farrar Straus and Giroux ISBN 9780374533557 Moore David McCabe George P 2003 Introduction to the practice of statistics vid 4th New York W H Freeman and Co ISBN 0716796570 Moore David Notz William I 2006 Statistics concepts and controversies vid 6th New York W H Freeman ISBN 9780716786368 Spirer Herbert Spirer Louise Jaffe A J 1998 Misused statistics vid revised and expanded 2nd New York M Dekker ISBN 978 0824702113 The book is based on several hundred examples of misuse Oldberg T and R Christensen 1995 Erratic Measure in NDE for the Energy Industry 1995 The American Society of Mechanical Engineers ISBN 0 7918 1298 7 pages 1 6 Republished on the Web by ndt net Oldberg T 2005 An Ethical Problem in the Statistics of Defect Detection Test Reliability Speech to the Golden Gate Chapter of the American Society for Nondestructive Testing Published on the Web by ndt net Stone M 2009 Failing to Figure Whitehall s Costly Neglect of Statistical Reasoning Civitas London ISBN 1 906837 07 4 Galbraith J Stone M 2011 The abuse of regression in the National Health Service allocation formulae Response to the Department of Health s 2007 resource allocation research paper 174 3 517 528 doi 10 1111 j 1467 985X 2010 00700 x