Згруповані дані — це дані, що формуються шляхом агрегування окремих [en] змінної в групи, так що частотний розподіл цих груп служить зручним засобом для узагальнення або аналізу даних. Існує два основних типи групування: [en] одновимірної змінної, коли замість окремих значень використовуються підрахунки у кошиках (групах); та групування багатовимірних змінних за деякими вимірами (головним чином за незалежними змінними), отримання розподілу вимірів, по яким не відбувається групування (надто за залежними змінними).
Групування даних має на меті їх стиснення без суттєвої втрати вибіркою інформативності, та полегшення подальшої роботи з даними.
Приклад
Ідею згрупованих даних можна проілюструвати, розглянувши такий необроблений набір даних:
20 | 25 | 24 | 33 | 13 | 26 | 8 | 19 | 31 | 11 | 16 | 21 | 17 | 11 | 34 | 14 | 15 | 21 | 18 | 17 |
Наведені вище дані можна згрупувати для побудови розподілу частоти будь-яким із кількох способів. Один із методів — використовувати інтервали як основу.
Найменше значення у наведених даних — 8, а найбільше — 34. Інтервал від 8 до 34 розбивається на менші підінтервали (які називаються інтервалами класів). Для кожного інтервалу класу підраховується кількість елементів даних, що потрапляють у цей інтервал. Це число називається частотою інтервалу цього класу. Результати представлені у вигляді таблиці частот:
Час (у секундах) | Частота |
---|---|
5 ≤ t <10 | 1 |
10 ≤ t <15 | 4 |
15 ≤ t <20 | 6 |
20 ≤ t <25 | 4 |
25 ≤ t <30 | 2 |
30 ≤ t <35 | 3 |
Ще один спосіб групування даних — це використання деяких якісних характеристик замість числових інтервалів. Наприклад, припустимо, що в наведеному вище прикладі, є три типи учнів: 1) нижче норми, якщо час реакції складає від 5 до 14 секунд, 2) нормальна, це між 15 і 24 сек, і 3) вище норми, якщо час становить 25 секунд або більше, потім згруповані дані мають такий вигляд:
Частота | |
---|---|
Нижче норми | 5 |
Звичайний | 10 |
Вище норми | 5 |
Ще одним прикладом групування даних є використання деяких часто використовуваних числових значень, які насправді є «іменами», які ми присвоюємо категоріям. Наприклад, давайте розглянемо віковий розподіл учнів у класі. Учням може бути 10 років, 11 років або 12 років. Це вікові групи 10, 11 та 12 років. Зверніть увагу, що школярі у віковій групі 10 мають вік від 10 років та 0 днів до 10 років та 364 днів, отже, їх середній вік становить 10,5 років, якщо дивитись на вік по неперервній шкалі. Згруповані дані виглядають так:
Вік | Частота |
---|---|
10 | 10 |
11 | 20 |
12 | 10 |
Середнє значення згрупованих даних
Оцінка середнього значення сукупності, , з якої дані можуть бути обчислені з згрупованих даних, як:
У цій формулі х відноситься до середньої точки інтервалів класу, і f є частотою класу. Слід зазначити, що результат цього буде відрізнятися від [en]. Середнє значення для згрупованих даних у наведеному вище прикладі, можна розрахувати таким чином:
Клас інтервалів | Частота (f) | Середнє значення (x) | f x |
---|---|---|---|
5 та вище, але нижче 10 | 1 | 7.5 | 7.5 |
10 ≤ t < 15 | 4 | 12.5 | 50 |
15 ≤ t < 20 | 6 | 17.5 | 105 |
20 ≤ t < 25 | 4 | 22.5 | 90 |
25 ≤ t < 30 | 2 | 27.5 | 55 |
30 ≤ t < 35 | 3 | 32.5 | 97.5 |
Разом | 20 | 405 |
Таким чином, середнє значення згрупованих даних є:
Середнє значення згрупованих даних у наведеному вище прикладі 4 може бути обчислено так:
Вікова група | Частота ( f ) | Середнє значення (x) | f x |
---|---|---|---|
10 | 10 | 10.5 | 105 |
11 | 20 | 11.5 | 230 |
12 | 10 | 12.5 | 125 |
Разом | 40 | 460 |
Таким чином, середнє значення згрупованих даних становить
Див. також
Посилання
- Newbold, P.; Carlson, W.; Thorne, B. (2009). Statistics for Business and Economics (вид. Seventh). Pearson Education. ISBN .
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Zgrupovani dani ce dani sho formuyutsya shlyahom agreguvannya okremih en zminnoyi v grupi tak sho chastotnij rozpodil cih grup sluzhit zruchnim zasobom dlya uzagalnennya abo analizu danih Isnuye dva osnovnih tipi grupuvannya en odnovimirnoyi zminnoyi koli zamist okremih znachen vikoristovuyutsya pidrahunki u koshikah grupah ta grupuvannya bagatovimirnih zminnih za deyakimi vimirami golovnim chinom za nezalezhnimi zminnimi otrimannya rozpodilu vimiriv po yakim ne vidbuvayetsya grupuvannya nadto za zalezhnimi zminnimi Grupuvannya danih maye na meti yih stisnennya bez suttyevoyi vtrati vibirkoyu informativnosti ta polegshennya podalshoyi roboti z danimi PrikladIdeyu zgrupovanih danih mozhna proilyustruvati rozglyanuvshi takij neobroblenij nabir danih Tablicya 1 Chas zatrachenij grupoyu uchniv u sekundah na vidpovid na proste matematichne zapitannya 20 25 24 33 13 26 8 19 31 11 16 21 17 11 34 14 15 21 18 17 Navedeni vishe dani mozhna zgrupuvati dlya pobudovi rozpodilu chastoti bud yakim iz kilkoh sposobiv Odin iz metodiv vikoristovuvati intervali yak osnovu Najmenshe znachennya u navedenih danih 8 a najbilshe 34 Interval vid 8 do 34 rozbivayetsya na menshi pidintervali yaki nazivayutsya intervalami klasiv Dlya kozhnogo intervalu klasu pidrahovuyetsya kilkist elementiv danih sho potraplyayut u cej interval Ce chislo nazivayetsya chastotoyu intervalu cogo klasu Rezultati predstavleni u viglyadi tablici chastot Tablicya 2 Rozpodil chastoti chasu zatrachenogo grupoyu uchniv u sekundah na vidpovid na proste matematichne zapitannya Chas u sekundah Chastota 5 t lt 10 1 10 t lt 15 4 15 t lt 20 6 20 t lt 25 4 25 t lt 30 2 30 t lt 35 3 She odin sposib grupuvannya danih ce vikoristannya deyakih yakisnih harakteristik zamist chislovih intervaliv Napriklad pripustimo sho v navedenomu vishe prikladi ye tri tipi uchniv 1 nizhche normi yaksho chas reakciyi skladaye vid 5 do 14 sekund 2 normalna ce mizh 15 i 24 sek i 3 vishe normi yaksho chas stanovit 25 sekund abo bilshe potim zgrupovani dani mayut takij viglyad Tablicya 3 Chastotnij rozpodil troh tipiv uchniv Chastota Nizhche normi 5 Zvichajnij 10 Vishe normi 5 She odnim prikladom grupuvannya danih ye vikoristannya deyakih chasto vikoristovuvanih chislovih znachen yaki naspravdi ye imenami yaki mi prisvoyuyemo kategoriyam Napriklad davajte rozglyanemo vikovij rozpodil uchniv u klasi Uchnyam mozhe buti 10 rokiv 11 rokiv abo 12 rokiv Ce vikovi grupi 10 11 ta 12 rokiv Zvernit uvagu sho shkolyari u vikovij grupi 10 mayut vik vid 10 rokiv ta 0 dniv do 10 rokiv ta 364 dniv otzhe yih serednij vik stanovit 10 5 rokiv yaksho divitis na vik po neperervnij shkali Zgrupovani dani viglyadayut tak Tablicya 4 Rozpodil za vikom klasu uchniv Vik Chastota 10 10 11 20 12 10Serednye znachennya zgrupovanih danihOcinka serednogo znachennya sukupnosti x displaystyle bar x z yakoyi dani mozhut buti obchisleni z zgrupovanih danih yak x f x f displaystyle bar x frac sum f x sum f U cij formuli h vidnositsya do serednoyi tochki intervaliv klasu i f ye chastotoyu klasu Slid zaznachiti sho rezultat cogo bude vidriznyatisya vid en Serednye znachennya dlya zgrupovanih danih u navedenomu vishe prikladi mozhna rozrahuvati takim chinom Klas intervaliv Chastota f Serednye znachennya x f x 5 ta vishe ale nizhche 10 1 7 5 7 5 10 t lt 15 4 12 5 50 15 t lt 20 6 17 5 105 20 t lt 25 4 22 5 90 25 t lt 30 2 27 5 55 30 t lt 35 3 32 5 97 5 Razom 20 405 Takim chinom serednye znachennya zgrupovanih danih ye x f x f 405 20 20 25 displaystyle bar x frac sum f x sum f frac 405 20 20 25 Serednye znachennya zgrupovanih danih u navedenomu vishe prikladi 4 mozhe buti obchisleno tak Vikova grupa Chastota f Serednye znachennya x f x 10 10 10 5 105 11 20 11 5 230 12 10 12 5 125 Razom 40 460 Takim chinom serednye znachennya zgrupovanih danih stanovit x f x f 460 40 11 5 displaystyle bar x frac sum f x sum f frac 460 40 11 5 Div takozh en en Rozbittya mnozhini Shkala Chastotnij rozpodil Zvedena tablicyaPosilannyaNewbold P Carlson W Thorne B 2009 Statistics for Business and Economics vid Seventh Pearson Education ISBN 978 0 13 507248 6