Визначення розмірів вибірки — це процес вибору числа спостережень або повторюваностей з метою включення його у статистичну вибірку. Розмір вибірки є важливою характеристикою будь-якого емпіричного дослідження, мета якого полягає в тому, щоб зробити логічний висновок щодо популяції виходячи з результатів вибірки. На практиці розмір вибірки, що використовується у дослідженні, визначається на основі витрат на збір даних та необхідності мати достатню статистичну потужність. У складних дослідженнях може бути кілька різних розмірів вибірки, що використовуються у дослідженні: наприклад, у стратифікованому опитуванні були б різні розміри вибірки для кожного шару. При проведенні перепису дані збираються по всьому населенню, отже, розмір вибірки дорівнює розміру населення. В експериментальному проекті, де дослідження може бути розділене на різні експериментальні групи, для кожної окремої групи може існувати свій розмір вибірки.
Розміри вибірки можна обрати декількома різними способами:
- Досвід — наприклад, включати легко доступні або зручні у збиранні елементи. Добір вибірок невеликого розміру, хоча іноді це необхідно, може призвести до широких довірчих інтервалів або ризиків помилитися у перевірці статистичних гіпотез.
- Використовувати цільову дисперсію для оцінки, яка походить із отриманої зрештою вибірки.
- Використовувати ціль для потужності статистичного дослідження, яка повинна застосовуватися після того, як вибірка зібрана.
- Використовувати рівень достовірності, що визначає, наскільки точний результат вийде з більш низькими шансами похибки.
Введення
Великі розміри вибірки, як правило, призводять до збільшення точності при оцінці невідомих параметрів. Наприклад, якби ми хотіли з'ясувати частку деяких видів риб, які інфіковані патогенним мікроорганізмом, ми, як правило, мали б більш точну оцінку цієї частки, якщо б підібрали і дослідили 200, а не 100 риб. Кілька фундаментальних фактів математичної статистики можуть описати це явище, в тому числі закон великих чисел і центральної граничної теореми.
У деяких ситуаціях, підвищення точності для великих розмірів вибірки мінімальне або навіть не існує. Це може бути результатом наявності систематичних помилок або сильної залежності від даних, або якщо дані слідують розподілу з повільно спадаючим «хвостом».
Розміри вибірки оцінюються на підставі якості одержуваних оцінок. Наприклад, якщо частка в даний час оцінюється, людина, можливо, забажає, аби 95 % довірчий інтервал (довірчий інтервал для довірчої ймовірності 0,95) був менше, ніж 0,06 одиниць в ширину. Як альтернатива, розмір вибірки може бути визначений на основі потужності критерію для перевірки гіпотези. Наприклад, якщо ми порівняємо підтримку певного політичного кандидата серед жінок з підтримкою цього ж кандидата серед чоловіків, ми, можливо, хотіли б мати 80 % потужності, аби виявити в рівнях підтримки різницю у 0,04 одиниць.
Оцінка
Досить простою ситуацією є оцінка частки. Наприклад, ми хочемо оцінити частку жителів у громаді, яким хоча б 65 років.
Формула оцінки частки: , де X являє собою число «позитивних» спостережень (тобто, кількість людей із n вибраних людей, яким хоча б 65 років). Коли спостереження незалежні, то ця формула має (масштабний) біноміальний розподіл (і є також вибірковим середнім даних із розподілу Бернуллі). Максимальне відхилення цього розподілу становить 0,25/n, яке виникає, коли істинний параметр p = 0,5. На практиці, коли p невідоме, максимальне відхилення часто використовується для оцінки розміру вибірки.
При досить великому n розподіл буде дуже близьким за значенням до нормального розподілу. Використовуючи це наближення, можна показати, що близько 95 % ймовірностей цього розподілу лежить в межах 2-х стандартних відхилень від середнього значення. Використовуючи метод Wald для біноміального розподілу, інтервал виду:
формуватиме 95 % довірчий інтервал для істинної частки. Якщо цей інтервал повинен бути не більше, ніж W одиниці в ширину, рівняння:
може бути вирішене при n, що дає n = 4/W2 = 1/B2 , де B — похибка межі оцінки, тобто оцінка зазвичай дається в межах ± B. Таким чином, при B = 10 % вимагається n = 100, при B = 5 % потрібно n = 400, при B = 3 % вимога наближається до n= 1000, в той час як при B = 1 % потрібен розмір вибірки у n = 10000. Ці цифри часто цитуються у випусках новин щодо опитувань громадської думки та інших вибіркових вимірах.
Засоби
Частка є окремим питанням середнього значення. При оцінці середньої чисельності населення з використанням незалежного і однаково розподіленого (НОР) розміру n, де кожне значення даних має дисперсію σ2, стандартна похибка середнього значення вибірки є:
Цей вираз кількісно описує, що оцінка стає точнішою пропорційно з тим, як збільшується розмір вибірки. Використовуючи центральну граничну теорему, щоб виправдати приблизне вибіркове середнє з нормальним розподілом дає приблизний 95 % довірчий інтервал виду:
Якщо ми хочемо мати довірчий інтервал, який W одиниць в ширину, ми вирішимо
для n, яке видає розмір вибірки n = 16σ2/W2.
Наприклад, якщо ми зацікавлені в оцінці кількості, за якою препарат знижує кров'яний тиск суб'єкта з довірчим інтервалом у шість одиниць шириною, і ми знаємо, що стандартне відхилення артеріального тиску в населення становить 15, то шуканий розмір вибірки є 100.
Необхідні розміри вибірки для перевірки гіпотез
Загальною проблемою, що стоїть перед статистиками, є обчислювання розміру вибірки, необхідної для отримання певної потужності у випробуванні, враховуючи задану похибку першого роду α. Отже, це можна оцінити за допомогою заздалегідь визначених таблиць для певних значень за рівнянням ресурсу Міда або, в більш загальному плані, за допомогою кумулятивної функції розподілу:
Таблиці
0.2 | 0.5 | 0.8 | |
---|---|---|---|
0.25 | 84 | 14 | 6 |
0.50 | 193 | 32 | 13 |
0.60 | 246 | 40 | 16 |
0.70 | 310 | 50 | 20 |
0.80 | 393 | 64 | 26 |
0.90 | 526 | 85 | 34 |
0.95 | 651 | 105 | 42 |
0.99 | 920 | 148 | 58 |
Таблиця показана праворуч може бути використана у двовибіркових критеріях Ст'юдента для оцінки розмірів вибірки з експериментальної групи і контрольної групи, які мають однаковий розмір, тобто, загальне число особин у випробуванні вдвічі більше, числа даних, і бажаний рівень значущості дорівнює 0,05. Параметри, що використовуються, є:
- Потрібна статистична потужність випробування показана в колонці зліва.
- d Коена (= розмір ефекту), що є очікуваною різницею між середніми значеннями цільових значень між експериментальною групою та контрольною групою, розділена на очікуване стандартне відхилення.
Рівняння ресурсу Міда
Рівняння ресурсу Міда часто використовується для оцінки розмірів вибірки з лабораторних тварин, а також у багатьох інших лабораторних експериментах. Результат може бути не настільки точним, як при використанні інших методів в оцінці розміру вибірки, але він дає підказку, який розмір вибірки є доречним, якщо такі параметри як очікувані стандартні відхилення або очікувані відмінності в значеннях між групами є невідомими або їх дуже важко оцінити.
Всі параметри у рівнянні є, фактично, ступенями свободи числа їх понять, і, отже, від їх числа віднімається 1 перед введенням у рівняння.
Рівняння має вигляд:
де:
- N — загальне число осіб або підрозділів в дослідженні (мінус 1)
- B — компонент блокування, відображає вплив на навколишнє середовище, дозволений при проектуванні (мінус 1)
- T — компонент експерименту, що відповідає числу експериментальних груп (в тому числі контрольна група), які використовуються, або кількості питань, що задаються (мінус 1)
- E — ступінь свободи компонента похибки, і повинен бути приблизно між 10 і 20.
Наприклад, якщо дослідження з використанням лабораторних тварин планується з чотирма експериментальними групами (T = 3), з вісьмома тваринами на групу, тобто 32 тварин (N = 31), без будь-якої подальшої стратифікації (B = 0), то E буде дорівнювати 28, що є більше за відсічення 20, що вказує, що розмір вибірки може бути занадто великим, і шість тварин на кожну групу може бути достатньо та більш доречно.
Інтегральна функція розподілу
Нехай Xi, i = 1, 2, …, n незалежні спостереження взяті з нормального розподілу з невідомим середнім μ і відомою дисперсією σ2. Розглянемо дві гіпотези, нульову гіпотезу:
й альтернативну гіпотезу:
для деякої «найменшої значущої різниці» μ* >0. Це найменше значення, яким мі цікавимось при спостереженні різниці. Тепер, якщо ми хочемо (1) відхилити H0 з ймовірністю принаймні 1-β , коли Ha істинно (тобто потужність 1-р), і (2) відхилити Ha з ймовірністю α, коли Ha вірна, тоді нам необхідно наступне: Якщо zα є верхньою відсотковою точкою α стандартного нормального розподілу, то
і таким чином
- 'Відхилити H0, якщо середнє нашої вибірки () більше, ніж '
це вирішальне правило, яке задовольняє умові (2). (Зверніть увагу, що це односторонній експеримент).
Тепер ми хочемо, щоб це сталося з ймовірністю принаймні 1- β, коли Ha істинно. У цьому випадку, середнє нашої вибірки буде походити з нормального розподілу із середнім значенням μ*.. Тому ми вимагаємо
Завдяки точним маніпуляціям, можна побачити, що станеться, коли
де нормальна інтегральна функція розподілу.
Стратифікований розмір вибірки
З більш складною організацією вибірки, такою як стратифікована (розшарована) вибірка, вибірку часто можна розділити на підвибірки. Як правило, якщо існують такі H підвибірки (від H різних шарів), то кожен з них буде мати розмір вибірки nh, h = 1, 2, …, H. Ці nh повинні відповідати правилу n1 + n2 + … + nH = n (тобто, загальний розмір вибірки визначається сумою розмірів підвибірок). Вибір цих nh оптимально може бути зробленим різними шляхами, використовуючи (наприклад) оптимальний розподіл Неймана.
Є багато причин використовувати стратифіковану вибірку: щоб зменшити дисперсії вибіркових оцінок, щоб використовувати частково невипадкові методи, або для вивчення шарів окремо. Частково невипадковий метод мав би бути корисним для вибірки осіб, яких легко дістати, але, якщо ні, то краще використовувати гніздову вибірку, щоб заощадити на витратах на поїздки.
Загалом, для H шарів, зваженим вибірковим середнім є
з
Вагові функції, , часто, але не завжди, відображають пропорції елементів населення в шарах, і . Для фіксованого розміру вибірки, тобто, size, that is ,
який може бути виконаний, якщо частота дискретизації в межах кожного шару проводиться пропорційно стандартному відхиленню в кожному шарі : , де і є константами, як .
«Оптимальний розподіл» досягається, коли частоти дискретизації в межах шарів виробляються прямо пропорційно стандартним відхиленням в межах шарів і обернено пропорційно квадратному кореню з вартості вибірки для кожного елемента в межах шарів, :
де це константа, як , або в більш загальному плані, коли
Якісне дослідження
Визначення розмірів вибірки в якісних дослідженнях використовує інший підхід. Як правило, це суб'єктивне судження, взяте як діагностичні засоби. Один з підходів полягає у подальшому включенні в себе додаткових учасників або матеріалів доки не досягнуто насичення. Кількість, необхідна для досягнення насичення, була досліджена емпірично.
Існує мала кількість надійних вказівок по оцінці розмірів вибірки перед початком дослідження з цілою низкою наведених пропозицій. Метод близький до розрахунку кількісної потужності на основі негативного біноміального розподілу був запропонований для тематичного аналізу.
Див. також
- Приклад інженерної поверхневої реакції при покроковій регресії
- h Коена
Примітки
- Isogenic.info > Resource equation [ 23 вересня 2016 у Wayback Machine.] by Michael FW Festing. Updated Sept. 2006
- Kish (1965), p.78.
- Kish (1965), p.81.
- Kish (1965), p.93.
- Kish (1965), p.94.
Посилання
- Bartlett, J. E., II; Kotrlik, J. W.; Higgins, C. (2001). (PDF). Information Technology, Learning, and Performance Journal. 19 (1): 43—50. Архів оригіналу (PDF) за 6 березня 2009. Процитовано 30 листопада 2016.
- (1965). Survey Sampling. Wiley. ISBN .
- Smith, Scott (8 квітня 2013). . Qualtrics. Архів оригіналу за 18 листопада 2016. Процитовано 15 листопада 2016.
Література
- NIST: Selecting Sample Sizes [ 30 листопада 2016 у Wayback Machine.]
- ASTM E122-07: Standard Practice for Calculating Sample Size to Estimate, With Specified Precision, the Average for a Characteristic of a Lot or Process
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Viznachennya rozmiriv vibirki ce proces viboru chisla sposterezhen abo povtoryuvanostej z metoyu vklyuchennya jogo u statistichnu vibirku Rozmir vibirki ye vazhlivoyu harakteristikoyu bud yakogo empirichnogo doslidzhennya meta yakogo polyagaye v tomu shob zrobiti logichnij visnovok shodo populyaciyi vihodyachi z rezultativ vibirki Na praktici rozmir vibirki sho vikoristovuyetsya u doslidzhenni viznachayetsya na osnovi vitrat na zbir danih ta neobhidnosti mati dostatnyu statistichnu potuzhnist U skladnih doslidzhennyah mozhe buti kilka riznih rozmiriv vibirki sho vikoristovuyutsya u doslidzhenni napriklad u stratifikovanomu opituvanni buli b rizni rozmiri vibirki dlya kozhnogo sharu Pri provedenni perepisu dani zbirayutsya po vsomu naselennyu otzhe rozmir vibirki dorivnyuye rozmiru naselennya V eksperimentalnomu proekti de doslidzhennya mozhe buti rozdilene na rizni eksperimentalni grupi dlya kozhnoyi okremoyi grupi mozhe isnuvati svij rozmir vibirki Rozmiri vibirki mozhna obrati dekilkoma riznimi sposobami Dosvid napriklad vklyuchati legko dostupni abo zruchni u zbiranni elementi Dobir vibirok nevelikogo rozmiru hocha inodi ce neobhidno mozhe prizvesti do shirokih dovirchih intervaliv abo rizikiv pomilitisya u perevirci statistichnih gipotez Vikoristovuvati cilovu dispersiyu dlya ocinki yaka pohodit iz otrimanoyi zreshtoyu vibirki Vikoristovuvati cil dlya potuzhnosti statistichnogo doslidzhennya yaka povinna zastosovuvatisya pislya togo yak vibirka zibrana Vikoristovuvati riven dostovirnosti sho viznachaye naskilki tochnij rezultat vijde z bilsh nizkimi shansami pohibki VvedennyaVeliki rozmiri vibirki yak pravilo prizvodyat do zbilshennya tochnosti pri ocinci nevidomih parametriv Napriklad yakbi mi hotili z yasuvati chastku deyakih vidiv rib yaki infikovani patogennim mikroorganizmom mi yak pravilo mali b bilsh tochnu ocinku ciyeyi chastki yaksho b pidibrali i doslidili 200 a ne 100 rib Kilka fundamentalnih faktiv matematichnoyi statistiki mozhut opisati ce yavishe v tomu chisli zakon velikih chisel i centralnoyi granichnoyi teoremi U deyakih situaciyah pidvishennya tochnosti dlya velikih rozmiriv vibirki minimalne abo navit ne isnuye Ce mozhe buti rezultatom nayavnosti sistematichnih pomilok abo silnoyi zalezhnosti vid danih abo yaksho dani sliduyut rozpodilu z povilno spadayuchim hvostom Rozmiri vibirki ocinyuyutsya na pidstavi yakosti oderzhuvanih ocinok Napriklad yaksho chastka v danij chas ocinyuyetsya lyudina mozhlivo zabazhaye abi 95 dovirchij interval dovirchij interval dlya dovirchoyi jmovirnosti 0 95 buv menshe nizh 0 06 odinic v shirinu Yak alternativa rozmir vibirki mozhe buti viznachenij na osnovi potuzhnosti kriteriyu dlya perevirki gipotezi Napriklad yaksho mi porivnyayemo pidtrimku pevnogo politichnogo kandidata sered zhinok z pidtrimkoyu cogo zh kandidata sered cholovikiv mi mozhlivo hotili b mati 80 potuzhnosti abi viyaviti v rivnyah pidtrimki riznicyu u 0 04 odinic OcinkaDosit prostoyu situaciyeyu ye ocinka chastki Napriklad mi hochemo ociniti chastku zhiteliv u gromadi yakim hocha b 65 rokiv Formula ocinki chastki p X n displaystyle hat p X n de X yavlyaye soboyu chislo pozitivnih sposterezhen tobto kilkist lyudej iz n vibranih lyudej yakim hocha b 65 rokiv Koli sposterezhennya nezalezhni to cya formula maye masshtabnij binomialnij rozpodil i ye takozh vibirkovim serednim danih iz rozpodilu Bernulli Maksimalne vidhilennya cogo rozpodilu stanovit 0 25 n yake vinikaye koli istinnij parametr p 0 5 Na praktici koli p nevidome maksimalne vidhilennya chasto vikoristovuyetsya dlya ocinki rozmiru vibirki Pri dosit velikomu n rozpodil p displaystyle hat p bude duzhe blizkim za znachennyam do normalnogo rozpodilu Vikoristovuyuchi ce nablizhennya mozhna pokazati sho blizko 95 jmovirnostej cogo rozpodilu lezhit v mezhah 2 h standartnih vidhilen vid serednogo znachennya Vikoristovuyuchi metod Wald dlya binomialnogo rozpodilu interval vidu p 20 25 n p 20 25 n displaystyle hat p 2 sqrt 0 25 n hat p 2 sqrt 0 25 n formuvatime 95 dovirchij interval dlya istinnoyi chastki Yaksho cej interval povinen buti ne bilshe nizh W odinici v shirinu rivnyannya 40 25 n W displaystyle 4 sqrt 0 25 n W mozhe buti virishene pri n sho daye n 4 W2 1 B2 de B pohibka mezhi ocinki tobto ocinka zazvichaj dayetsya v mezhah B Takim chinom pri B 10 vimagayetsya n 100 pri B 5 potribno n 400 pri B 3 vimoga nablizhayetsya do n 1000 v toj chas yak pri B 1 potriben rozmir vibirki u n 10000 Ci cifri chasto cituyutsya u vipuskah novin shodo opituvan gromadskoyi dumki ta inshih vibirkovih vimirah Zasobi Chastka ye okremim pitannyam serednogo znachennya Pri ocinci serednoyi chiselnosti naselennya z vikoristannyam nezalezhnogo i odnakovo rozpodilenogo NOR rozmiru n de kozhne znachennya danih maye dispersiyu s2 standartna pohibka serednogo znachennya vibirki ye s n displaystyle sigma sqrt n dd Cej viraz kilkisno opisuye sho ocinka staye tochnishoyu proporcijno z tim yak zbilshuyetsya rozmir vibirki Vikoristovuyuchi centralnu granichnu teoremu shob vipravdati priblizne vibirkove serednye z normalnim rozpodilom daye pribliznij 95 dovirchij interval vidu x 2s n x 2s n displaystyle bar x 2 sigma sqrt n bar x 2 sigma sqrt n Yaksho mi hochemo mati dovirchij interval yakij W odinic v shirinu mi virishimo 4s n W displaystyle 4 sigma sqrt n W dlya n yake vidaye rozmir vibirki n 16s2 W2 Napriklad yaksho mi zacikavleni v ocinci kilkosti za yakoyu preparat znizhuye krov yanij tisk sub yekta z dovirchim intervalom u shist odinic shirinoyu i mi znayemo sho standartne vidhilennya arterialnogo tisku v naselennya stanovit 15 to shukanij rozmir vibirki ye 100 Neobhidni rozmiri vibirki dlya perevirki gipotezZagalnoyu problemoyu sho stoyit pered statistikami ye obchislyuvannya rozmiru vibirki neobhidnoyi dlya otrimannya pevnoyi potuzhnosti u viprobuvanni vrahovuyuchi zadanu pohibku pershogo rodu a Otzhe ce mozhna ociniti za dopomogoyu zazdalegid viznachenih tablic dlya pevnih znachen za rivnyannyam resursu Mida abo v bilsh zagalnomu plani za dopomogoyu kumulyativnoyi funkciyi rozpodilu Tablici 0 2 0 5 0 80 25 84 14 60 50 193 32 130 60 246 40 160 70 310 50 200 80 393 64 260 90 526 85 340 95 651 105 420 99 920 148 58 Tablicya pokazana pravoruch mozhe buti vikoristana u dvovibirkovih kriteriyah St yudenta dlya ocinki rozmiriv vibirki z eksperimentalnoyi grupi i kontrolnoyi grupi yaki mayut odnakovij rozmir tobto zagalne chislo osobin u viprobuvanni vdvichi bilshe chisla danih i bazhanij riven znachushosti dorivnyuye 0 05 Parametri sho vikoristovuyutsya ye Potribna statistichna potuzhnist viprobuvannya pokazana v kolonci zliva d Koena rozmir efektu sho ye ochikuvanoyu rizniceyu mizh serednimi znachennyami cilovih znachen mizh eksperimentalnoyu grupoyu ta kontrolnoyu grupoyu rozdilena na ochikuvane standartne vidhilennya Rivnyannya resursu Mida Rivnyannya resursu Mida chasto vikoristovuyetsya dlya ocinki rozmiriv vibirki z laboratornih tvarin a takozh u bagatoh inshih laboratornih eksperimentah Rezultat mozhe buti ne nastilki tochnim yak pri vikoristanni inshih metodiv v ocinci rozmiru vibirki ale vin daye pidkazku yakij rozmir vibirki ye dorechnim yaksho taki parametri yak ochikuvani standartni vidhilennya abo ochikuvani vidminnosti v znachennyah mizh grupami ye nevidomimi abo yih duzhe vazhko ociniti Vsi parametri u rivnyanni ye faktichno stupenyami svobodi chisla yih ponyat i otzhe vid yih chisla vidnimayetsya 1 pered vvedennyam u rivnyannya Rivnyannya maye viglyad E N B T displaystyle E N B T de N zagalne chislo osib abo pidrozdiliv v doslidzhenni minus 1 B komponent blokuvannya vidobrazhaye vpliv na navkolishnye seredovishe dozvolenij pri proektuvanni minus 1 T komponent eksperimentu sho vidpovidaye chislu eksperimentalnih grup v tomu chisli kontrolna grupa yaki vikoristovuyutsya abo kilkosti pitan sho zadayutsya minus 1 E stupin svobodi komponenta pohibki i povinen buti priblizno mizh 10 i 20 Napriklad yaksho doslidzhennya z vikoristannyam laboratornih tvarin planuyetsya z chotirma eksperimentalnimi grupami T 3 z vismoma tvarinami na grupu tobto 32 tvarin N 31 bez bud yakoyi podalshoyi stratifikaciyi B 0 to E bude dorivnyuvati 28 sho ye bilshe za vidsichennya 20 sho vkazuye sho rozmir vibirki mozhe buti zanadto velikim i shist tvarin na kozhnu grupu mozhe buti dostatno ta bilsh dorechno Integralna funkciya rozpodilu Nehaj Xi i 1 2 n nezalezhni sposterezhennya vzyati z normalnogo rozpodilu z nevidomim serednim m i vidomoyu dispersiyeyu s2 Rozglyanemo dvi gipotezi nulovu gipotezu H0 m 0 displaystyle H 0 mu 0 j alternativnu gipotezu Ha m m displaystyle H a mu mu dlya deyakoyi najmenshoyi znachushoyi riznici m gt 0 Ce najmenshe znachennya yakim mi cikavimos pri sposterezhenni riznici Teper yaksho mi hochemo 1 vidhiliti H0 z jmovirnistyu prinajmni 1 b koli Ha istinno tobto potuzhnist 1 r i 2 vidhiliti Ha z jmovirnistyu a koli Ha virna todi nam neobhidno nastupne Yaksho za ye verhnoyu vidsotkovoyu tochkoyu a standartnogo normalnogo rozpodilu to Pr x gt zas n H0 true a displaystyle Pr bar x gt z alpha sigma sqrt n H 0 text true alpha i takim chinom Vidhiliti H0 yaksho serednye nashoyi vibirki x displaystyle bar x bilshe nizh zas n displaystyle z alpha sigma sqrt n ce virishalne pravilo yake zadovolnyaye umovi 2 Zvernit uvagu sho ce odnostoronnij eksperiment Teper mi hochemo shob ce stalosya z jmovirnistyu prinajmni 1 b koli Ha istinno U comu vipadku serednye nashoyi vibirki bude pohoditi z normalnogo rozpodilu iz serednim znachennyam m Tomu mi vimagayemo Pr x gt zas n Ha true 1 b displaystyle Pr bar x gt z alpha sigma sqrt n H a text true geq 1 beta Zavdyaki tochnim manipulyaciyam mozhna pobachiti sho stanetsya koli n za F 1 1 b m s 2 displaystyle n geq left frac z alpha Phi 1 1 beta mu sigma right 2 de F displaystyle Phi normalna integralna funkciya rozpodilu Stratifikovanij rozmir vibirkiZ bilsh skladnoyu organizaciyeyu vibirki takoyu yak stratifikovana rozsharovana vibirka vibirku chasto mozhna rozdiliti na pidvibirki Yak pravilo yaksho isnuyut taki H pidvibirki vid H riznih shariv to kozhen z nih bude mati rozmir vibirki nh h 1 2 H Ci nh povinni vidpovidati pravilu n1 n2 nH n tobto zagalnij rozmir vibirki viznachayetsya sumoyu rozmiriv pidvibirok Vibir cih nh optimalno mozhe buti zroblenim riznimi shlyahami vikoristovuyuchi napriklad optimalnij rozpodil Nejmana Ye bagato prichin vikoristovuvati stratifikovanu vibirku shob zmenshiti dispersiyi vibirkovih ocinok shob vikoristovuvati chastkovo nevipadkovi metodi abo dlya vivchennya shariv okremo Chastkovo nevipadkovij metod mav bi buti korisnim dlya vibirki osib yakih legko distati ale yaksho ni to krashe vikoristovuvati gnizdovu vibirku shob zaoshaditi na vitratah na poyizdki Zagalom dlya H shariv zvazhenim vibirkovim serednim ye x w h 1HWhx h displaystyle bar x w sum h 1 H W h bar x h z Var x w h 1HWh2Var x h displaystyle operatorname Var bar x w sum h 1 H W h 2 operatorname Var bar x h Vagovi funkciyi Wh displaystyle W h chasto ale ne zavzhdi vidobrazhayut proporciyi elementiv naselennya v sharah i Wh Nh N displaystyle W h N h N Dlya fiksovanogo rozmiru vibirki tobto size that is N Nh displaystyle N sum N h Var x w h 1HWh2Varh 1nh 1Nh displaystyle operatorname Var bar x w sum h 1 H W h 2 Var h left frac 1 n h frac 1 N h right yakij mozhe buti vikonanij yaksho chastota diskretizaciyi v mezhah kozhnogo sharu provoditsya proporcijno standartnomu vidhilennyu v kozhnomu shari nh Nh kSh displaystyle n h N h kS h de Sh Varh displaystyle S h sqrt Var h i k displaystyle k ye konstantami yak nh n displaystyle sum n h n Optimalnij rozpodil dosyagayetsya koli chastoti diskretizaciyi v mezhah shariv viroblyayutsya pryamo proporcijno standartnim vidhilennyam v mezhah shariv i oberneno proporcijno kvadratnomu korenyu z vartosti vibirki dlya kozhnogo elementa v mezhah shariv Ch displaystyle C h nhNh KShCh displaystyle frac n h N h frac KS h sqrt C h de K displaystyle K ce konstanta yak nh n displaystyle sum n h n abo v bilsh zagalnomu plani koli nh K WhShCh displaystyle n h frac K W h S h sqrt C h Yakisne doslidzhennyaViznachennya rozmiriv vibirki v yakisnih doslidzhennyah vikoristovuye inshij pidhid Yak pravilo ce sub yektivne sudzhennya vzyate yak diagnostichni zasobi Odin z pidhodiv polyagaye u podalshomu vklyuchenni v sebe dodatkovih uchasnikiv abo materialiv doki ne dosyagnuto nasichennya Kilkist neobhidna dlya dosyagnennya nasichennya bula doslidzhena empirichno Isnuye mala kilkist nadijnih vkazivok po ocinci rozmiriv vibirki pered pochatkom doslidzhennya z ciloyu nizkoyu navedenih propozicij Metod blizkij do rozrahunku kilkisnoyi potuzhnosti na osnovi negativnogo binomialnogo rozpodilu buv zaproponovanij dlya tematichnogo analizu Div takozhPriklad inzhenernoyi poverhnevoyi reakciyi pri pokrokovij regresiyi h KoenaPrimitkiIsogenic info gt Resource equation 23 veresnya 2016 u Wayback Machine by Michael FW Festing Updated Sept 2006 Kish 1965 p 78 Kish 1965 p 81 Kish 1965 p 93 Kish 1965 p 94 PosilannyaBartlett J E II Kotrlik J W Higgins C 2001 PDF Information Technology Learning and Performance Journal 19 1 43 50 Arhiv originalu PDF za 6 bereznya 2009 Procitovano 30 listopada 2016 1965 Survey Sampling Wiley ISBN 0 471 48900 X Smith Scott 8 kvitnya 2013 Qualtrics Arhiv originalu za 18 listopada 2016 Procitovano 15 listopada 2016 LiteraturaNIST Selecting Sample Sizes 30 listopada 2016 u Wayback Machine ASTM E122 07 Standard Practice for Calculating Sample Size to Estimate With Specified Precision the Average for a Characteristic of a Lot or Process