Таблиця фактів використовується у сховищі даних та складається з вимірювань, показників або фактів бізнес-процесу. Вона розташована у центрі схеми зірки або схеми сніжинки в оточенні таблиць розмірностей. Там, де використовуються декілька таблиць фактів, вона організована як [en]. Таблиця фактів зазвичай складається з двох типів стовпців: ті, що містять факти та ті, що є зовнішнім ключем до таблиць розмірностей. Первинний ключ таблиці фактів зазвичай є складеним ключем, який поєднує в собі усі зовнішні ключі. Таблиці фактів містять зміст сховища даних та зберігають різні типи вимірювань, такі як адитивні, неаддитивні та півадитивні метрики.
Таблиці фактів надають (зазвичай) адитивні значення, які діють як незалежні змінні, за допомогою яких аналізуються атрибути розмірності. Таблиці фактів часто визначаються за ступенем деталізації або гранулярністю. Ступень деталізації таблиці фактів є найбільшим атомарним рівнем, за яким ці фактори можуть бути визначені. Наприклад, гранулярність таблиці фактів «продаж» може бути зазначено як «Обсяг продажів відповідно до дня, товару, магазину». Тому кожен запис цієї таблиці фактів є унікальним для дня, товару та магазину. Інші параметри можуть бути частиною цієї таблиці фактів (наприклад, місце розташування або регіон), але вони нічого не додають до унікальності фактичних записів. Ці «партнерські параметри» дозволяють отримувати додаткові фрагменти незалежних фактів, але, як правило, забезпечують розуміння на більш високому рівні агрегації (регіон містить багато магазинів).
Приклад
Якщо бізнес-процес — це продажі, то відповідна таблиця фактів буде, як правило, містити стовпчики, що представляють як , так і [en] у рядках. Наприклад:
- $12,000, складають «продажі Нью-Йорксього магазину за 15 січня 2005 року».
- $34,000, складають «продажі магазину у Лос-Анджелесі за 15 січня 2005 року».
- $22,000, складають «продажі Нью-Йорксього магазину за 16 січня 2005 року».
- $21,000, складають «середньодобові продажі магазину у Лос-Анджелесі за січень 2005 року».
- $65,000, складають «середньодобові продажі магазину у Лос-Анджелесі за лютий 2005 року».
- $33,000, складають «середньодобові продажі магазину у Лос-Анджелесі за 2005 рік загалом».
«Середньодобові продажі» — це вимірювання, яке зберігається у таблиці фактів. Таблиця фактів також містить зовнішній ключ із таблицями розмірностей, де зберігаються часовий ряд (наприклад, дата) та розмірності іншого параметру (наприклад, місце розташування магазину, продавець, товар).
Усі зовнішні ключі між таблицею фактів та таблицею розмірностей повинні бути сурогатними ключами, а не похідними від операційних даних.
Типи вимірювань
- Аддитивні — вимірювання, які можуть бути додані для будь-якої розмірності.
- Неаддитивні — вимірювання, які не можуть бути додані для жодної розмірності.
- Напіваддитивні — вимірювання, які можуть бути додані для певних розмірностей.
Таблиця фактів може містити у собі або деталі на рівні фактів, або факти, які були об'єднані (таблиці фактів, що містять сукупні факти, часто називаються підсумковими таблицями).
Особливу увагу слід приділяти при обробці пропорцій та відсотків. Одне добре правило при розробці полягає в тому, щоб ніколи не зберігати відсотки або пропорції у таблицях фактів, а лише обчислювати їх у інструменті доступу до даних. Таким чином, у таблицях фактів зберігається лише чисельник і знаменник, які потім можуть бути агрегованими, а збережені агреговані значення можуть потім використовуватися для обчислення пропорцій або відсотків вже в інструменті доступу до даних.
У реальному світі можна мати таблицю фактів, яка не містить жодних розмірностей чи фактів. Ці таблиці називаються «таблицями фактів без фактів» або [en]».
«Таблиці фактів без фактів» можуть, наприклад, використовуватися для моделювання відносин «багато-до-багатьох» або створення відміток часу подій.
Типи таблиць фактів
Існує чотири основних типів вимірювальних подій, які описують всі таблиці фактів.
- Транзакційний
- Таблиця транзакцій є основним та фундаментальним типом. Ступінь деталізації таблиці фактів транзакцій, як правило, визначається як «один рядок на транзакцію», наприклад, це може бути кожен рядок у чеку. Як правило, таблиця фактів транзакції містить дані найбільш деталізованого рівня, що спричиняє велику кількість розмірностей пов'язаних з ними.
- Періодичні знімки
- Періодичний знімок, як зрозуміло з назви, забезпечує знімок часу, де це може бути проміжок часу, наприклад, підсумок роботи продавця за попередній місяць. Періодичний знімок таблиці залежить від таблиці транзакцій, оскільки для його створення необхідна детальна інформація, яка зберігається у таблиці фактів, і дозволяє отримати потрібний результат.
- Накопичення знімків
- Цей тип таблиці фактів використовується для зображення перебігу процесу, який має чітко визначений початок і кінець, наприклад, обробку замовлення. Обробка замовлення складається з певних кроків. Як тільки ці кроки виконання замовлення будуть завершені, відповідний рядок в таблиці фактів оновиться. Накопичувальний знімок таблиці часто містить кілька стовпців з даними, кожен з яких є етапом виконання процесу. Тому важливо мати запис у відповідному параметрі даних, що містить невідому інформацію, оскільки багато ключових даних етапу невідомо на момент створення рядка.
- Хронологічні знімки
- Застосування теорії хронологічних баз даних та методів моделювання таблиць фактів хронологічних знімків дозволяє мати еквівалент повсякденних знімків уникаючи створення реальних щоденних знімків. Такий підхід запроваджує концепцію інтервалів часу в таблиці фактів, що дозволяє заощадити багато місця, оптимізувати швидкодію та дозволяє кінцевому користувачу мати логічний еквівалент «знімку часу», який його цікавить.
Кроки розробки таблиці фактів
- Визначити бізнес-процес, який аналізується (наприклад, продажі).
- Визначити вимірювання фактів (продажі у доларах), ставлячи питання типу «Яка кількість X важлива для бізнес-процесу?», замінивши X на різні варіанти, що мають сенс у контексті бізнесу.
- Визначити міри фактів (міра товару, просторова розмірність, часовий вимір, організаційна розмірність), за допомогою питань, які мають сенс у контексті бізнесу, наприклад, «Аналізуємо по X», де X замінюється в залежності від предмета, який необхідно перевірити.
- Перерахувати стовпці, що описують кожен параметр (назва регіону, назва філії, назва бізнес-підрозділу).
- Визначити найнижчий ступінь деталізації (гранулярність) звіту в таблиці фактів (наприклад, продажів у доларах).
Альтернативний підхід до розробки, описаний Кімбаллом: 1) Вибрати бізнес-процес; 2) Визначити ступінь деталізації; 3) Визначити розмірності; 4) Визначити факти.
Примітки
- Kimball & Ross — The Data Warehouse Toolkit, 2nd Ed [Wiley 2002]
- Kimball, Ralph (2008). The Data Warehouse Lifecycle Toolkit, 2. edition. Wiley. ISBN .
- Davide, Mauri. Temporal Snapshot Fact Table.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Tablicya faktiv vikoristovuyetsya u shovishi danih ta skladayetsya z vimiryuvan pokaznikiv abo faktiv biznes procesu Vona roztashovana u centri shemi zirki abo shemi snizhinki v otochenni tablic rozmirnostej Tam de vikoristovuyutsya dekilka tablic faktiv vona organizovana yak en Tablicya faktiv zazvichaj skladayetsya z dvoh tipiv stovpciv ti sho mistyat fakti ta ti sho ye zovnishnim klyuchem do tablic rozmirnostej Pervinnij klyuch tablici faktiv zazvichaj ye skladenim klyuchem yakij poyednuye v sobi usi zovnishni klyuchi Tablici faktiv mistyat zmist shovisha danih ta zberigayut rizni tipi vimiryuvan taki yak aditivni neadditivni ta pivaditivni metriki Tablici faktiv nadayut zazvichaj aditivni znachennya yaki diyut yak nezalezhni zminni za dopomogoyu yakih analizuyutsya atributi rozmirnosti Tablici faktiv chasto viznachayutsya za stupenem detalizaciyi abo granulyarnistyu Stupen detalizaciyi tablici faktiv ye najbilshim atomarnim rivnem za yakim ci faktori mozhut buti viznacheni Napriklad granulyarnist tablici faktiv prodazh mozhe buti zaznacheno yak Obsyag prodazhiv vidpovidno do dnya tovaru magazinu Tomu kozhen zapis ciyeyi tablici faktiv ye unikalnim dlya dnya tovaru ta magazinu Inshi parametri mozhut buti chastinoyu ciyeyi tablici faktiv napriklad misce roztashuvannya abo region ale voni nichogo ne dodayut do unikalnosti faktichnih zapisiv Ci partnerski parametri dozvolyayut otrimuvati dodatkovi fragmenti nezalezhnih faktiv ale yak pravilo zabezpechuyut rozuminnya na bilsh visokomu rivni agregaciyi region mistit bagato magaziniv PrikladYaksho biznes proces ce prodazhi to vidpovidna tablicya faktiv bude yak pravilo mistiti stovpchiki sho predstavlyayut yak tak i en u ryadkah Napriklad 12 000 skladayut prodazhi Nyu Jorksogo magazinu za 15 sichnya 2005 roku 34 000 skladayut prodazhi magazinu u Los Andzhelesi za 15 sichnya 2005 roku 22 000 skladayut prodazhi Nyu Jorksogo magazinu za 16 sichnya 2005 roku 21 000 skladayut serednodobovi prodazhi magazinu u Los Andzhelesi za sichen 2005 roku 65 000 skladayut serednodobovi prodazhi magazinu u Los Andzhelesi za lyutij 2005 roku 33 000 skladayut serednodobovi prodazhi magazinu u Los Andzhelesi za 2005 rik zagalom Serednodobovi prodazhi ce vimiryuvannya yake zberigayetsya u tablici faktiv Tablicya faktiv takozh mistit zovnishnij klyuch iz tablicyami rozmirnostej de zberigayutsya chasovij ryad napriklad data ta rozmirnosti inshogo parametru napriklad misce roztashuvannya magazinu prodavec tovar Usi zovnishni klyuchi mizh tabliceyu faktiv ta tabliceyu rozmirnostej povinni buti surogatnimi klyuchami a ne pohidnimi vid operacijnih danih Tipi vimiryuvanAdditivni vimiryuvannya yaki mozhut buti dodani dlya bud yakoyi rozmirnosti Neadditivni vimiryuvannya yaki ne mozhut buti dodani dlya zhodnoyi rozmirnosti Napivadditivni vimiryuvannya yaki mozhut buti dodani dlya pevnih rozmirnostej Tablicya faktiv mozhe mistiti u sobi abo detali na rivni faktiv abo fakti yaki buli ob yednani tablici faktiv sho mistyat sukupni fakti chasto nazivayutsya pidsumkovimi tablicyami Osoblivu uvagu slid pridilyati pri obrobci proporcij ta vidsotkiv Odne dobre pravilo pri rozrobci polyagaye v tomu shob nikoli ne zberigati vidsotki abo proporciyi u tablicyah faktiv a lishe obchislyuvati yih u instrumenti dostupu do danih Takim chinom u tablicyah faktiv zberigayetsya lishe chiselnik i znamennik yaki potim mozhut buti agregovanimi a zberezheni agregovani znachennya mozhut potim vikoristovuvatisya dlya obchislennya proporcij abo vidsotkiv vzhe v instrumenti dostupu do danih U realnomu sviti mozhna mati tablicyu faktiv yaka ne mistit zhodnih rozmirnostej chi faktiv Ci tablici nazivayutsya tablicyami faktiv bez faktiv abo en Tablici faktiv bez faktiv mozhut napriklad vikoristovuvatisya dlya modelyuvannya vidnosin bagato do bagatoh abo stvorennya vidmitok chasu podij Tipi tablic faktivIsnuye chotiri osnovnih tipiv vimiryuvalnih podij yaki opisuyut vsi tablici faktiv Tranzakcijnij Tablicya tranzakcij ye osnovnim ta fundamentalnim tipom Stupin detalizaciyi tablici faktiv tranzakcij yak pravilo viznachayetsya yak odin ryadok na tranzakciyu napriklad ce mozhe buti kozhen ryadok u cheku Yak pravilo tablicya faktiv tranzakciyi mistit dani najbilsh detalizovanogo rivnya sho sprichinyaye veliku kilkist rozmirnostej pov yazanih z nimi Periodichni znimki Periodichnij znimok yak zrozumilo z nazvi zabezpechuye znimok chasu de ce mozhe buti promizhok chasu napriklad pidsumok roboti prodavcya za poperednij misyac Periodichnij znimok tablici zalezhit vid tablici tranzakcij oskilki dlya jogo stvorennya neobhidna detalna informaciya yaka zberigayetsya u tablici faktiv i dozvolyaye otrimati potribnij rezultat Nakopichennya znimkiv Cej tip tablici faktiv vikoristovuyetsya dlya zobrazhennya perebigu procesu yakij maye chitko viznachenij pochatok i kinec napriklad obrobku zamovlennya Obrobka zamovlennya skladayetsya z pevnih krokiv Yak tilki ci kroki vikonannya zamovlennya budut zaversheni vidpovidnij ryadok v tablici faktiv onovitsya Nakopichuvalnij znimok tablici chasto mistit kilka stovpciv z danimi kozhen z yakih ye etapom vikonannya procesu Tomu vazhlivo mati zapis u vidpovidnomu parametri danih sho mistit nevidomu informaciyu oskilki bagato klyuchovih danih etapu nevidomo na moment stvorennya ryadka Hronologichni znimki Zastosuvannya teoriyi hronologichnih baz danih ta metodiv modelyuvannya tablic faktiv hronologichnih znimkiv dozvolyaye mati ekvivalent povsyakdennih znimkiv unikayuchi stvorennya realnih shodennih znimkiv Takij pidhid zaprovadzhuye koncepciyu intervaliv chasu v tablici faktiv sho dozvolyaye zaoshaditi bagato miscya optimizuvati shvidkodiyu ta dozvolyaye kincevomu koristuvachu mati logichnij ekvivalent znimku chasu yakij jogo cikavit Kroki rozrobki tablici faktivViznachiti biznes proces yakij analizuyetsya napriklad prodazhi Viznachiti vimiryuvannya faktiv prodazhi u dolarah stavlyachi pitannya tipu Yaka kilkist X vazhliva dlya biznes procesu zaminivshi X na rizni varianti sho mayut sens u konteksti biznesu Viznachiti miri faktiv mira tovaru prostorova rozmirnist chasovij vimir organizacijna rozmirnist za dopomogoyu pitan yaki mayut sens u konteksti biznesu napriklad Analizuyemo po X de X zaminyuyetsya v zalezhnosti vid predmeta yakij neobhidno pereviriti Pererahuvati stovpci sho opisuyut kozhen parametr nazva regionu nazva filiyi nazva biznes pidrozdilu Viznachiti najnizhchij stupin detalizaciyi granulyarnist zvitu v tablici faktiv napriklad prodazhiv u dolarah Alternativnij pidhid do rozrobki opisanij Kimballom 1 Vibrati biznes proces 2 Viznachiti stupin detalizaciyi 3 Viznachiti rozmirnosti 4 Viznachiti fakti PrimitkiKimball amp Ross The Data Warehouse Toolkit 2nd Ed Wiley 2002 Kimball Ralph 2008 The Data Warehouse Lifecycle Toolkit 2 edition Wiley ISBN 978 0 470 14977 5 Davide Mauri Temporal Snapshot Fact Table