В математичній статистиці, забезпеченні якості, методології опитування відбір вибірки (або вибирання, англ. sampling) — це вибирання підмножини (статистичної вибірки) об'єктів із генеральної сукупності з метою оцінювання характеристик генеральної сукупності в цілому. Двома головними перевагами відбирання є те, що, порівняно з обмірюванням всієї генеральної сукупності, витрати на вибірці є нижчими, і збирання даних є швидшим.
Кожне спостереження є вимірюванням однієї або декількох властивостей (таких як вага, положення, колір) об'єктів спостереження, які розрізняють як незалежні об'єкти або особи. У [en], щоби підлаштуватися до дизайну вибирання, зокрема, стратифікованого вибирання, до даних можуть застосовуватися ваги. Для ведення цієї діяльності застосовуються результати з теорії ймовірностей та теорії статистики. Відбирання широко застосовують для збирання інформації про населення в бізнесових та медичних дослідженнях. Для визначення того, чи виробнича партія матеріалу відповідає нормативним вимогам, застосовують [en].
Опис
Метод відбору вибірки також є ефективним для пов'язання статистичних властивостей вибірки з цілями моделювання, число яких може бути досить великим.
Н. Н. Чубуков наводить наступний приклад. Нехай випадковий процес представлений вибіркою об'єму Необхідно вирішити три завдання:
- Виконати умовно довгостроковий прогноз для
- Виконати умовно короткостроковий прогноз для
- Визначити функцію для відновлення значення в будь-якій точці всередині вибірки
Якщо взяти для моделювання традиційний підхід, орієнтований на єдиність опису статистичних властивостей процесу, то результатом будуть три абсолютно однакові функції. Справа в тому, що правилом розрахунку критерію якості моделі не враховувалися суттєві деталі: глибина прогнозу, характер статистичних трендів випадкового процесу, представленого вибірковими даними, і зовсім ігнорується цільова специфіка завдань.
Принцип різноманітності
Виходом з даного ускладнення може стати використання системного принципу різноманітності. Цей принцип в останні три десятиліття все більш активно впроваджується в інженерні додатки математичної статистики завдяки розробці таких методів перехресних валідації даних, як бутстреп-аналіз, метод групового обліку аргументів та ін. Прояв принципу різноманітності в рішеннях статистичних задач полягає в тому, що на незнання імовірнісних властивостей вихідних даних алгоритм відповідає різноманітністю моделей, які генеруються, кожна з яких підлягає крос-перевірці за певною єдиною для всіх моделей схемою.
Завдання
Таким чином, відбір вибірки є сучасним методом, який може виявитися ефективним для ряду інженерних додатків математичної статистики, особливо, пов'язаних з розв'язанням обернених задач. Відбір вибірки реалізує принцип різноманітності і може узагальнювати весь спектр засобів статистичного аналізу, заснований на управлінні вихідними даними. Під відбором вибірки розуміється набір прийомів для розділення початкової вибірки на робочі та контрольні ділянки за певними правилами. На робочих ділянках виконується розрахунок параметрів «конкуруючих» моделей, на контрольних оцінюється їх здатність відновлювати значення, які не використовувалися для розрахунку параметрів. Відбір вибірки усуває основну перешкоду, яка об'єктивно присутня в обернених задачах. ЇЇ причина криється у неможливості встановлення строгого математичного зв'язку між варіюючим параметром і величиною критерію. При цьому відбір вибірки автоматично переводить алгоритм структурно-параметричної ідентифікації моделі в розряд евристичних.
Стосовно вищенаведеного прикладу, першому випадку — «довгої» екстраполяції за межі вибірки, відповідає варіант відбору вибірки з виключенням з розрахунків параметрів моделі десяти останніх вибіркових значень поспіль. Контрольним буде десятий відлік. Робоча підвибірка складе всі значення, за винятком цієї десятки. Потім альтернативним перебором визначається найкраща модель, яка точніше інших спрогнозувала контрольну точку. Зміною положення виключених відліків, без порушення їх числа і нерозривності, формується статистика нев'язок, застосовна для розрахунку критерію. Алгоритм як би «екзаменує» моделі екстраполяції на задану глибину, і вибирає з них ту, яка найбільш точно вловлює тренди, які містять інформацію про значення на лагу довжиною в десять відліків.
Другому завданню буде відповідати відбір вибірки з виключенням із розрахунків по одній контрольній точці, з комбінуванням кількості та порядку попередніх значень, які враховуються для прогнозу.
У третьому завданні буде виправдано дроблення вибірки на взаємопроникні блоки, коли контрольні значення «вкраплені» між робітниками. Довжина таких блоків і глибина їх взаємопроникнення повинна враховувати інтервали між сусідніми точками діапазону, необхідні стійкість і точність оцінок. Так, третій задачі може відповідати виключення із розрахунків кожного третього відліку вибірки та застосування виключених даних для контролю з циклічним перепризначенням контрольних і робочих підвибірок.
Переваги
Вибір варіантів вибірки неоднозначний і визначається на основі досвіду і знань оператора про властивості вихідних даних, мети розв'язуваної задачі, а також може підбиратися або уточнюватися експериментально. Кількість прийнятних способів розбиття діапазону на порядки перевершує обсяг вибірки, і дає достатню різноманітність засобів для вираження корисності моделей. Відбір вибірки може виявитися ефективним у вирішенні зворотних задач, оскільки він є:
- альтернативою морально застарілого параметричного способу перевірки гіпотез про належність даних теоретичного розподілу;
- евристичним і відкритим по відношенню до оператора, вибирає із заданого набору варіант вибору вибірки, відповідний специфіці завдання;
- середовищем формування нормованих критеріальних функцій, зручних для моделювання мети, статистичної коригування мети, і кількісно відбиває близькість до неї;
- засобом побудови емпіричних розподілів, що дозволяє накопичувати статистику, визначати або уточнювати варіант вибірки та оцінювати достовірність результатів;
- економічно перспективним, здатним виділяти найменший достатній для конкретної розв'язуваної задачі набір вибіркових даних з діапазону, що є цікавим з точки зору зниження витрат;
- підвищує інтелектуальність систем управління за рахунок надання їм системних властивостей доцільності, цілісності, раціональності, ієрархічності, самоорганізації і достатньої різноманітності.
Види вибірки
- Вибірка за значимістю
- Вибірка з відхиленням
- Районована вибірка
- Алгоритм Метрополіса — Гастінгса
Примітки
- Lance, P. & Hattori, A. (2016). . Web: MEASURE Evaluation. с. 6—8, 62—64. Архів оригіналу за 26 листопада 2020. Процитовано 17 липня 2018.
- Salant, Priscilla, I. Dillman, and A. Don. How to conduct your own survey. No. 300.723 S3. 1994.
- Чубуков Н. Н. Алгоритмизация калибровок мехатронных систем с использованием семплинга // Мехатроника, автоматизация, управление. 2013. № 7.
- .
Література
- (рос.)Чубуков Н. Н. Алгоритмизация калибровок мехатронных систем с использованием сэмплинга. Мехатроника, автоматизация, управление. 2013 г., № 7.
- (рос.)Эфрон Б. Нетрадиционные методы многомерного статистического анализа: Сб. статей: Пер. с англ./ Предисловие Ю. П. Адлера, Ю. А. Кошевника. — М.: Финансы и статистика, 1988.- 263 с. ил.
- (рос.)Ивахненко А. Г. Системы эвристической самоорганизации в технической кибернетике. — Киев: Техника, 1971. — 327 с.
Частина інформації в цій статті застаріла. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
V matematichnij statistici zabezpechenni yakosti metodologiyi opituvannya vidbir vibirki abo vibirannya angl sampling ce vibirannya pidmnozhini statistichnoyi vibirki ob yektiv iz generalnoyi sukupnosti z metoyu ocinyuvannya harakteristik generalnoyi sukupnosti v cilomu Dvoma golovnimi perevagami vidbirannya ye te sho porivnyano z obmiryuvannyam vsiyeyi generalnoyi sukupnosti vitrati na vibirci ye nizhchimi i zbirannya danih ye shvidshim Vizualne predstavlennya vidboru vibirki Kozhne sposterezhennya ye vimiryuvannyam odniyeyi abo dekilkoh vlastivostej takih yak vaga polozhennya kolir ob yektiv sposterezhennya yaki rozriznyayut yak nezalezhni ob yekti abo osobi U en shobi pidlashtuvatisya do dizajnu vibirannya zokrema stratifikovanogo vibirannya do danih mozhut zastosovuvatisya vagi Dlya vedennya ciyeyi diyalnosti zastosovuyutsya rezultati z teoriyi jmovirnostej ta teoriyi statistiki Vidbirannya shiroko zastosovuyut dlya zbirannya informaciyi pro naselennya v biznesovih ta medichnih doslidzhennyah Dlya viznachennya togo chi virobnicha partiya materialu vidpovidaye normativnim vimogam zastosovuyut en OpisMetod vidboru vibirki takozh ye efektivnim dlya pov yazannya statistichnih vlastivostej vibirki z cilyami modelyuvannya chislo yakih mozhe buti dosit velikim N N Chubukov navodit nastupnij priklad Nehaj vipadkovij proces predstavlenij vibirkoyu ob yemu N X t1 X t2 X tN displaystyle N X t 1 X t 2 X t N Neobhidno virishiti tri zavdannya Vikonati umovno dovgostrokovij prognoz dlya X tN 10 displaystyle X t N 10 Vikonati umovno korotkostrokovij prognoz dlya X tN 1 displaystyle X t N 1 Viznachiti funkciyu X X t displaystyle X X t dlya vidnovlennya znachennya X displaystyle X v bud yakij tochci vseredini vibirki Yaksho vzyati dlya modelyuvannya tradicijnij pidhid oriyentovanij na yedinist opisu statistichnih vlastivostej procesu to rezultatom budut tri absolyutno odnakovi funkciyi Sprava v tomu sho pravilom rozrahunku kriteriyu yakosti modeli ne vrahovuvalisya suttyevi detali glibina prognozu harakter statistichnih trendiv vipadkovogo procesu predstavlenogo vibirkovimi danimi i zovsim ignoruyetsya cilova specifika zavdan Princip riznomanitnostiVihodom z danogo uskladnennya mozhe stati vikoristannya sistemnogo principu riznomanitnosti Cej princip v ostanni tri desyatilittya vse bilsh aktivno vprovadzhuyetsya v inzhenerni dodatki matematichnoyi statistiki zavdyaki rozrobci takih metodiv perehresnih validaciyi danih yak butstrep analiz metod grupovogo obliku argumentiv ta in Proyav principu riznomanitnosti v rishennyah statistichnih zadach polyagaye v tomu sho na neznannya imovirnisnih vlastivostej vihidnih danih algoritm vidpovidaye riznomanitnistyu modelej yaki generuyutsya kozhna z yakih pidlyagaye kros perevirci za pevnoyu yedinoyu dlya vsih modelej shemoyu ZavdannyaTakim chinom vidbir vibirki ye suchasnim metodom yakij mozhe viyavitisya efektivnim dlya ryadu inzhenernih dodatkiv matematichnoyi statistiki osoblivo pov yazanih z rozv yazannyam obernenih zadach Vidbir vibirki realizuye princip riznomanitnosti i mozhe uzagalnyuvati ves spektr zasobiv statistichnogo analizu zasnovanij na upravlinni vihidnimi danimi Pid vidborom vibirki rozumiyetsya nabir prijomiv dlya rozdilennya pochatkovoyi vibirki na robochi ta kontrolni dilyanki za pevnimi pravilami Na robochih dilyankah vikonuyetsya rozrahunok parametriv konkuruyuchih modelej na kontrolnih ocinyuyetsya yih zdatnist vidnovlyuvati znachennya yaki ne vikoristovuvalisya dlya rozrahunku parametriv Vidbir vibirki usuvaye osnovnu pereshkodu yaka ob yektivno prisutnya v obernenih zadachah YiYi prichina kriyetsya u nemozhlivosti vstanovlennya strogogo matematichnogo zv yazku mizh variyuyuchim parametrom i velichinoyu kriteriyu Pri comu vidbir vibirki avtomatichno perevodit algoritm strukturno parametrichnoyi identifikaciyi modeli v rozryad evristichnih Stosovno vishenavedenogo prikladu pershomu vipadku dovgoyi ekstrapolyaciyi za mezhi vibirki vidpovidaye variant vidboru vibirki z viklyuchennyam z rozrahunkiv parametriv modeli desyati ostannih vibirkovih znachen pospil Kontrolnim bude desyatij vidlik Robocha pidvibirka sklade vsi znachennya za vinyatkom ciyeyi desyatki Potim alternativnim pereborom viznachayetsya najkrasha model yaka tochnishe inshih sprognozuvala kontrolnu tochku Zminoyu polozhennya viklyuchenih vidlikiv bez porushennya yih chisla i nerozrivnosti formuyetsya statistika nev yazok zastosovna dlya rozrahunku kriteriyu Algoritm yak bi ekzamenuye modeli ekstrapolyaciyi na zadanu glibinu i vibiraye z nih tu yaka najbilsh tochno vlovlyuye trendi yaki mistyat informaciyu pro znachennya na lagu dovzhinoyu v desyat vidlikiv Drugomu zavdannyu bude vidpovidati vidbir vibirki z viklyuchennyam iz rozrahunkiv po odnij kontrolnij tochci z kombinuvannyam kilkosti ta poryadku poperednih znachen yaki vrahovuyutsya dlya prognozu U tretomu zavdanni bude vipravdano droblennya vibirki na vzayemopronikni bloki koli kontrolni znachennya vkrapleni mizh robitnikami Dovzhina takih blokiv i glibina yih vzayemoproniknennya povinna vrahovuvati intervali mizh susidnimi tochkami diapazonu neobhidni stijkist i tochnist ocinok Tak tretij zadachi mozhe vidpovidati viklyuchennya iz rozrahunkiv kozhnogo tretogo vidliku vibirki ta zastosuvannya viklyuchenih danih dlya kontrolyu z ciklichnim perepriznachennyam kontrolnih i robochih pidvibirok PerevagiVibir variantiv vibirki neodnoznachnij i viznachayetsya na osnovi dosvidu i znan operatora pro vlastivosti vihidnih danih meti rozv yazuvanoyi zadachi a takozh mozhe pidbiratisya abo utochnyuvatisya eksperimentalno Kilkist prijnyatnih sposobiv rozbittya diapazonu na poryadki perevershuye obsyag vibirki i daye dostatnyu riznomanitnist zasobiv dlya virazhennya korisnosti modelej Vidbir vibirki mozhe viyavitisya efektivnim u virishenni zvorotnih zadach oskilki vin ye alternativoyu moralno zastarilogo parametrichnogo sposobu perevirki gipotez pro nalezhnist danih teoretichnogo rozpodilu evristichnim i vidkritim po vidnoshennyu do operatora vibiraye iz zadanogo naboru variant viboru vibirki vidpovidnij specifici zavdannya seredovishem formuvannya normovanih kriterialnih funkcij zruchnih dlya modelyuvannya meti statistichnoyi koriguvannya meti i kilkisno vidbivaye blizkist do neyi zasobom pobudovi empirichnih rozpodiliv sho dozvolyaye nakopichuvati statistiku viznachati abo utochnyuvati variant vibirki ta ocinyuvati dostovirnist rezultativ ekonomichno perspektivnim zdatnim vidilyati najmenshij dostatnij dlya konkretnoyi rozv yazuvanoyi zadachi nabir vibirkovih danih z diapazonu sho ye cikavim z tochki zoru znizhennya vitrat pidvishuye intelektualnist sistem upravlinnya za rahunok nadannya yim sistemnih vlastivostej docilnosti cilisnosti racionalnosti iyerarhichnosti samoorganizaciyi i dostatnoyi riznomanitnosti Vidi vibirkiVibirka za znachimistyu Vibirka z vidhilennyam Rajonovana vibirka Algoritm Metropolisa GastingsaPrimitkiLance P amp Hattori A 2016 Web MEASURE Evaluation s 6 8 62 64 Arhiv originalu za 26 listopada 2020 Procitovano 17 lipnya 2018 Salant Priscilla I Dillman and A Don How to conduct your own survey No 300 723 S3 1994 Chubukov N N Algoritmizaciya kalibrovok mehatronnyh sistem s ispolzovaniem semplinga Mehatronika avtomatizaciya upravlenie 2013 7 Literatura ros Chubukov N N Algoritmizaciya kalibrovok mehatronnyh sistem s ispolzovaniem semplinga Mehatronika avtomatizaciya upravlenie 2013 g 7 ros Efron B Netradicionnye metody mnogomernogo statisticheskogo analiza Sb statej Per s angl Predislovie Yu P Adlera Yu A Koshevnika M Finansy i statistika 1988 263 s il ros Ivahnenko A G Sistemy evristicheskoj samoorganizacii v tehnicheskoj kibernetike Kiev Tehnika 1971 327 s Chastina informaciyi v cij statti zastarila Vi mozhete dopomogti onovivshi yiyi Mozhlivo storinka obgovorennya mistit zauvazhennya shodo potribnih zmin