Розмірність (англ. dimension table) — це структура сховища даних з класифікацією (фактів) та [en], яка дозволяє користувачам виконувати бізнес-завдання. Часто використовуються такі розмірності як люди, вироби, місце та час.
У сховищі даних розмірність надає структуровану інформацію маркування на противагу невпорядкованим числовим вимірюванням. Розмірність є набором даних, який складається з окремих [en], які не перекриваються. Є три основні функції розмірності: забезпечення фільтрації, групування та маркування.
Ці функції часто описуються як «подрібнюй та перемішуй» (англ. slice and dice). Зазвичай сховища даних включають продаж як міру, а клієнт та виріб використовуються у якості розмірностей. Кожен продаж — це коли клієнт купує виріб. Дані можуть бути отримані тільки для піддослідної групи, а потім розподілені групуванням по виробах.
[en] розмірності схожий на категорійну змінну в статистиці.
Зазвичай розмірність в сховищах даних організовані всередині однієї або декількох ієрархічних структур. Наприклад, «календарна дата» — загальна розмірність, що складається з дня, місяця та року, може мати декілька можливих ієрархій:
- «Дні (згруповані в) місяці (які згруповані в) роки»,
- «Дні (згруповані в) тижні (які згруповані в) роки»
- «Дні (згруповані в) місяці (які згруповані в) квартали (які згруповані в) роки»
- та численні комбінації.
Підсумовуючи, можна сказати, що атрибути подій з таблиці фактів сховища даних являють собою текстові або інші описи, логічно об'єднанні в єдине ціле. Наприклад, ім'я покупця може бути атрибутом в таблиці розмірностей покупців, а ім'я товару — в таблиці розмірностей товарів. В той час як сума транзакції є величиною адитивною і її значення повинно зберігатися в таблиці фактів.
Таблиця фактів пов'язана зі структурами (або таблицями) розмірностей за допомогою зовнішнього ключа.
Типи
Узгоджена розмірність
Узгодженою розмірністю є набір атрибутів даних, на які є фізичні посилання з декількох таблиць баз даних, що використовують одне і те ж значення ключа, для того, щоб посилатися на спільну структуру, атрибути, значення домену, визначення та поняття. Узгоджена розмірність перекриває багато фактів.
Розмірності узгоджуються, коли вони є абсолютно однаковими (включаючи ключі), або один є в точності підмножиною іншого. Найбільш важливим є те, що заголовки рядків, створені у двох різних наборах відповідей з однієї й тієї ж узгодженої розмірності (або розмірностей), повинні точно відповідати одне одному.
Узгоджені розмірності є або ідентичними, або точними математичними підмножинами найбільш гранульованої, детальної розмірності. Таблиці розмірностей не узгоджуються, якщо атрибути позначені по-різному або містять різні значення. Відповідні розмірності складаються з декількох різних особливостей. На найостаннішому рівні відповідні розмірності означають точно те ж саме з усіма можливими таблицями фактів, з якими вони поєднані. Таблиця розмірностей календарної дати, пов'язана з фактами продажів, ідентична розмірності дати, яка пов'язаному з фактами інвентаризації.
Небажана розмірність
Небажана розмірність слугує для зручного групування прапорців (англ. flags) і індикаторів що, як правило рідко використовуються. Створюючи абстрактну розмірність, ці прапорці та індикатори видаляються з таблиці фактів, розміщуючи їх у зручній таблиці розмірностей. Небажана розмірність — це таблиця така розмірності, що складається з атрибутів, які не належать до таблиці фактів або до будь-якої з існуючих таблиць розмірностей. Характер цих атрибутів зазвичай є текстовими або іншими прапорами, наприклад коментарі, які не є загальними, або просто звичайні так/ні (англ. yes / no) чи правда/брехня (англ. true / false) індикатори. Ці типи атрибутів, як правило, залишаються, коли всі очевидні розмірності в бізнес-процесі були ідентифіковані, і тому проектувальник зіштовхується з проблемою того, де розмістити ці атрибути, які не належать до інших розмірностей.
Одним з рішень є створення нової розмірності для кожного з інших атрибутів, але через їхню природу, можливо, буде необхідно створити величезну кількість нових розмірностей, що призведе до того, що таблиця фактів буде мати дуже велику кількість зовнішніх ключів. Проектувальник також може вирішити залишити дані атрибути в таблиці фактів, але це може зробити довжину рядка таблиці надмірно великою, якщо, наприклад, атрибути є довгими текстовими рядками.
Рішення цього завдання полягає в тому, щоб ідентифікувати всі атрибути, а потім помістити їх в один або кілька небажаних розмірностей. Одна небажана розмірність може містити декілька індикаторів так/ні (англ. yes / no) чи правда/брехня (англ. true / false), які не мають кореляції одне з одним, тому було б зручно конвертувати індикатори в більш описовий атрибут. Прикладом може бути індикатор того, чи прийшов пакет: замість того, щоб вказувати це як «так» або «ні», він буде перетворений у «надійшовший» або «в очікувані» у небажаній розмірності. Проектувальник може вирішити побудувати таблицю розмірностей, що буде містити всі індикатори, що відбуваються з будь-яким іншим індикатором, щоб покрити всі комбінації. Це встановлює фіксований розмір для самої таблиці, яка буде містити 2х рядків, де x — кількість індикаторів. Це рішення є прийнятним у ситуаціях, коли проектувальник очікує отримати багато різних комбінацій і де можливо, обмежити комбінації до прийнятного рівня. У ситуації, коли кількість індикаторів є великою, створюючи, таким чином, дуже велику таблицю або де проектувальник очікує отримати тільки кілька можливих комбінацій, більш доцільно будувати кожен рядок у розмірності небажаних об'єктів, оскільки можливо зустрінуться й нові комбінації. Щоб обмежити розмір таблиць, декілька небажаних розмірностей можуть бути придатними в інших ситуаціях залежно від співвідношення різних показників.
Небажані розмірності також підходять для розміщення атрибутів, подібних до не-загальних коментарів, з таблиці фактів. Такі атрибути можуть складатися з даних, які містять необов'язкові поля, наприклад, при оформленні клієнтом замовлення, і в результаті, ймовірно, такі поля будуть порожніми у більшості випадків. Таким чином, розмірність небажаного вмісту повинен містити один рядок, який представляє пробіли як сурогатний ключ, який буде використовуватися у таблиці фактів для кожного рядка, що повертається з порожнім полем коментаря.
Вироджена розмірність
Вироджена розмірність — це ключ, такий як, наприклад, номер транзакції, номер рахунку-фактури, номер квитка або номер векселя, який не має атрибутів і, отже, не приєднується до фактичної таблиці розмірностей. Вироджені розмірності дуже поширені, коли занадто великій таблиці фактів представляють єдиний елемент транзакції або позицію рядка, оскільки вироджена розмірність являє собою унікальний ідентифікатор батьківського. Вироджені розмірності часто грають невіддільну роль у первинному ключі таблиці фактів.
Розмірність рольових ігор
Розмірності часто переробляються для декількох додатків в межах однієї бази даних. Наприклад, розмірність «Дата» може бути використаний для «Дата продажу», а також «Дата доставлення» або «Дата прокату». Це часто називають «рольовою розмірністю».
Використання термінів подання ISO
При посиланні на дані з реєстру метаданих, таких як [en], [en], такі як «Індикатор» (булеве значення правда/брехня (англ. true / false)), «Код» (набір перерахованих значень, що не перетинаються) зазвичай використовуються як розмірності. Наприклад, використовуючи [en], ім'я елемента даних буде «Person Gender Code», а перераховані значення можуть бути «чоловік», «жінка» і «невідомо».
Таблиця розмірностей
У сховищах даних таблиця розмірностей є однією з набору таблиць-супутників для таблиці фактів.
Таблиця фактів містить ділові факти (або [en]), і зовнішні ключі, які посилаються на потенційні ключі (зазвичай первинні ключі) в таблицях розмірностей.
На відміну від таблиць фактів, таблиці розмірностей містять описові атрибути (або поля), які зазвичай є текстовими полями (або дискретними числами, які поводяться як текст). Ці атрибути призначені для виконання двох важливих цілей: обмеження запитів і / або фільтрації, а також маркування набору результатів запиту.
Атрибути розмірності мають бути:
- Мовними (етикетки, що складаються з повних слів)
- Описовими
- Закінченими (без відсутніх значень)
- Дискретно оцінюваними (має лише одне значення таблиці в рядку розмірностей)
- Забезпечені якістю (без правопису або неможливих значень)
Рядки таблиці розмірності однозначно ідентифікуються одним ключовим полем. Рекомендується, щоб поле ключа було простим цілим числом, оскільки значення ключа не має сенсу, крім використання для об'єднання полів між таблицями фактів та розмірностей. Таблиці розмірностей часто використовують первинні ключі, які також є сурогатними ключами. Сурогатні ключі як правило генеруються автоматично (наприклад, стовпець ідентифікаторів Sybase або SQL Server, PostgreSQL або Informix serial, послідовність в Oracle або стовпець, визначений за допомогою AUTO_INCREMENT в MySQL).
Використання ключів сурогатних розмірностей має ряд переваг, включаючи:
- Продуктивність. Виконання приєднання набагато ефективніша за допомогою одного поля (сурогатного ключа)
- Буферизація з використанням оперативних методів управління. Це запобігає ситуаціям, коли видалені рядки даних можуть з'явитися знову, коли їхні природні ключі повторно використовуються або перепризначені після тривалого періоду коли вони не були використані
- Картування для інтеграції різнорідних джерел
- Обробка невідомих або непридатних з'єднань
- Відстеження змін у значеннях атрибутів розмірностей
Хоча використання сурогатного ключа покладається на систему ETL, можна покращити обробку комунікаційної лінії, а інструменти ETL мають вбудовану обробку сурогатних ключів.
Мета таблиці розмірності полягає в створенні стандартизованих, відповідних розмірностей, які можна спільно використовувати в середовищі сховища даних підприємства, і дозволяє приєднатися до декількох таблиць фактів, що представляють різні бізнес-процеси.
Відповідні розмірності дуже важливі для корпоративного характеру систем DW / BI, оскільки вони сприяють:
- Послідовності. Кожна таблиця фактів фільтрується послідовно, так що відповіді на запит позначаються послідовно.
- Інтеграції. Запити можуть обробляти різні таблиці факторів процесу окремо для кожної окремої таблиці фактів, а потім приєднувати результати до атрибутів загальної розмірності.
- Зменшення часу розробки магазину. Загальні розмірності доступні без їх відтворення.
З часом атрибути заданого рядка в таблиці розмірностей можуть змінюватися. Наприклад, адреса доставлення для компанії може змінюватися. [en] посилається на це явище як на [en]. Стратегії вирішення такого роду змін поділяються на три категорії:
- Перший тип. Просто перезапишіть старі значення.
- Другий тип. Додайте новий рядок, що містить нове значення, і розрізняйте рядки за допомогою методів [en].
- Третій тип. Додайте новий атрибут до наявного рядка.
Загальні моделі
- Дата і час
Оскільки багато таблиць фактів у сховищі даних є часовими рядами спостережень, часто потрібні один або більше розмірностей дати. Однією з причин для того, щоб мати розмірність дати є розміщення знань календаря в сховищі даних замість жорсткого кодування в додатку. Попри те, що проста дата або дата-час SQL є корисною для надання точної інформації про час запису факту, вона не може надати інформацію про свята, фіскальні періоди, тощо. Мітку дати / часу SQL все ще може бути корисно зберігати у таблиці фактів, оскільки це дозволяє проводити точні розрахунки.
Наявність як дати, так і часу дня в одній і тій же розмірності, може призвести до величезного об'єму з мільйонами рядків. Якщо потрібна велика кількість деталей, то варто розбити дату і час на дві або більше окремих розмірностей. Розмірність часу з кількома секундами у день буде мати лише 86400 рядків. Степінь деталізації для розмірностей дати / часу можна вибрати в залежності від потреб. Наприклад, розмірності дати можуть мати точність до року, кварталу, місяця або дня, а розмірності часу можуть мати точність до годин, хвилин або секунд.
Як правило, розмірність часу має бути створена тільки тоді, коли потрібні ієрархічні угруповання або, якщо існують змістовні текстові описи для періодів часу протягом дня (наприклад, «вечірня затримка» або «перша зміна»).
Якщо рядки в таблиці фактів надходять з декількох різних часових поясів, може бути корисно зберігати дату і час як за місцевим часом, так і за стандартним часом (наприклад, Гринвіч). Це можна зробити, маючи дві розмірності для кожного необхідного вимірювання дати / часу — один для місцевого часу, а один для стандартного часу. Збереження дати / часу як у місцевому, так і в стандартному часі дозволить проаналізувати, коли факти створюються в локальній ситуації і в глобальній ситуації. Вибраний стандартний час може бути загальним стандартним часом (наприклад, UTC), це може бути місцевий час штаб-квартири підприємства або будь-який інший часовий пояс, який доречно було б використовувати в певній ситуації.
Див. також
Література
- Барсегян А., Технологии анализа данных: Data Mining, Text Mining, Visual Mining, OLAP. 2 изд.
- Душан Петкович, «Microsoft SQL Server 2012. Руководство для начинающих», с. 597
Посилання
- «Oracle Data Warehousing Guide [ 15 жовтня 2018 у Wayback Machine.]», Oracle Corporation, retrieved 9 June 2014
- Definition: Dimension [ 15 жовтня 2018 у Wayback Machine.]" Search Data Management, TechTarget, retrieved 9 June 2014
- . www.urbandictionary.com. Архів оригіналу за 29 вересня 2020.
- Ralph Kimball, Margy Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Second Edition, Wiley Computer Publishing, 2002. , Pages 82-87, 394
- Ralph Kimball, Margy Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Second Edition, Wiley Computer Publishing, 2002. , Pages 202, 405
- Kimball, Ralph, et al. (2008): The Data Warehouse Lifecycle Toolkit, Second Edition, Wiley Publishing Inc., Indianapolis, IN. Pages 263—265
- Ralph Kimball, Margy Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Second Edition, Wiley Computer Publishing, 2002. , Pages 50, 398
- Ralph Kimball, The Data Warehouse Toolkit, Second Edition, Wiley Publishing, Inc., 2008. , Pages 253—256
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Rozmirnist angl dimension table ce struktura shovisha danih z klasifikaciyeyu faktiv ta en yaka dozvolyaye koristuvacham vikonuvati biznes zavdannya Chasto vikoristovuyutsya taki rozmirnosti yak lyudi virobi misce ta chas U shovishi danih rozmirnist nadaye strukturovanu informaciyu markuvannya na protivagu nevporyadkovanim chislovim vimiryuvannyam Rozmirnist ye naborom danih yakij skladayetsya z okremih en yaki ne perekrivayutsya Ye tri osnovni funkciyi rozmirnosti zabezpechennya filtraciyi grupuvannya ta markuvannya Ci funkciyi chasto opisuyutsya yak podribnyuj ta peremishuj angl slice and dice Zazvichaj shovisha danih vklyuchayut prodazh yak miru a kliyent ta virib vikoristovuyutsya u yakosti rozmirnostej Kozhen prodazh ce koli kliyent kupuye virib Dani mozhut buti otrimani tilki dlya piddoslidnoyi grupi a potim rozpodileni grupuvannyam po virobah en rozmirnosti shozhij na kategorijnu zminnu v statistici Zazvichaj rozmirnist v shovishah danih organizovani vseredini odniyeyi abo dekilkoh iyerarhichnih struktur Napriklad kalendarna data zagalna rozmirnist sho skladayetsya z dnya misyacya ta roku mozhe mati dekilka mozhlivih iyerarhij Dni zgrupovani v misyaci yaki zgrupovani v roki Dni zgrupovani v tizhni yaki zgrupovani v roki Dni zgrupovani v misyaci yaki zgrupovani v kvartali yaki zgrupovani v roki ta chislenni kombinaciyi Pidsumovuyuchi mozhna skazati sho atributi podij z tablici faktiv shovisha danih yavlyayut soboyu tekstovi abo inshi opisi logichno ob yednanni v yedine cile Napriklad im ya pokupcya mozhe buti atributom v tablici rozmirnostej pokupciv a im ya tovaru v tablici rozmirnostej tovariv V toj chas yak suma tranzakciyi ye velichinoyu aditivnoyu i yiyi znachennya povinno zberigatisya v tablici faktiv Tablicya faktiv pov yazana zi strukturami abo tablicyami rozmirnostej za dopomogoyu zovnishnogo klyucha TipiUzgodzhena rozmirnist Uzgodzhenoyu rozmirnistyu ye nabir atributiv danih na yaki ye fizichni posilannya z dekilkoh tablic baz danih sho vikoristovuyut odne i te zh znachennya klyucha dlya togo shob posilatisya na spilnu strukturu atributi znachennya domenu viznachennya ta ponyattya Uzgodzhena rozmirnist perekrivaye bagato faktiv Rozmirnosti uzgodzhuyutsya koli voni ye absolyutno odnakovimi vklyuchayuchi klyuchi abo odin ye v tochnosti pidmnozhinoyu inshogo Najbilsh vazhlivim ye te sho zagolovki ryadkiv stvoreni u dvoh riznih naborah vidpovidej z odniyeyi j tiyeyi zh uzgodzhenoyi rozmirnosti abo rozmirnostej povinni tochno vidpovidati odne odnomu Uzgodzheni rozmirnosti ye abo identichnimi abo tochnimi matematichnimi pidmnozhinami najbilsh granulovanoyi detalnoyi rozmirnosti Tablici rozmirnostej ne uzgodzhuyutsya yaksho atributi poznacheni po riznomu abo mistyat rizni znachennya Vidpovidni rozmirnosti skladayutsya z dekilkoh riznih osoblivostej Na najostannishomu rivni vidpovidni rozmirnosti oznachayut tochno te zh same z usima mozhlivimi tablicyami faktiv z yakimi voni poyednani Tablicya rozmirnostej kalendarnoyi dati pov yazana z faktami prodazhiv identichna rozmirnosti dati yaka pov yazanomu z faktami inventarizaciyi Nebazhana rozmirnist Nebazhana rozmirnist sluguye dlya zruchnogo grupuvannya praporciv angl flags i indikatoriv sho yak pravilo ridko vikoristovuyutsya Stvoryuyuchi abstraktnu rozmirnist ci praporci ta indikatori vidalyayutsya z tablici faktiv rozmishuyuchi yih u zruchnij tablici rozmirnostej Nebazhana rozmirnist ce tablicya taka rozmirnosti sho skladayetsya z atributiv yaki ne nalezhat do tablici faktiv abo do bud yakoyi z isnuyuchih tablic rozmirnostej Harakter cih atributiv zazvichaj ye tekstovimi abo inshimi praporami napriklad komentari yaki ne ye zagalnimi abo prosto zvichajni tak ni angl yes no chi pravda brehnya angl true false indikatori Ci tipi atributiv yak pravilo zalishayutsya koli vsi ochevidni rozmirnosti v biznes procesi buli identifikovani i tomu proektuvalnik zishtovhuyetsya z problemoyu togo de rozmistiti ci atributi yaki ne nalezhat do inshih rozmirnostej Odnim z rishen ye stvorennya novoyi rozmirnosti dlya kozhnogo z inshih atributiv ale cherez yihnyu prirodu mozhlivo bude neobhidno stvoriti velicheznu kilkist novih rozmirnostej sho prizvede do togo sho tablicya faktiv bude mati duzhe veliku kilkist zovnishnih klyuchiv Proektuvalnik takozh mozhe virishiti zalishiti dani atributi v tablici faktiv ale ce mozhe zrobiti dovzhinu ryadka tablici nadmirno velikoyu yaksho napriklad atributi ye dovgimi tekstovimi ryadkami Rishennya cogo zavdannya polyagaye v tomu shob identifikuvati vsi atributi a potim pomistiti yih v odin abo kilka nebazhanih rozmirnostej Odna nebazhana rozmirnist mozhe mistiti dekilka indikatoriv tak ni angl yes no chi pravda brehnya angl true false yaki ne mayut korelyaciyi odne z odnim tomu bulo b zruchno konvertuvati indikatori v bilsh opisovij atribut Prikladom mozhe buti indikator togo chi prijshov paket zamist togo shob vkazuvati ce yak tak abo ni vin bude peretvorenij u nadijshovshij abo v ochikuvani u nebazhanij rozmirnosti Proektuvalnik mozhe virishiti pobuduvati tablicyu rozmirnostej sho bude mistiti vsi indikatori sho vidbuvayutsya z bud yakim inshim indikatorom shob pokriti vsi kombinaciyi Ce vstanovlyuye fiksovanij rozmir dlya samoyi tablici yaka bude mistiti 2h ryadkiv de x kilkist indikatoriv Ce rishennya ye prijnyatnim u situaciyah koli proektuvalnik ochikuye otrimati bagato riznih kombinacij i de mozhlivo obmezhiti kombinaciyi do prijnyatnogo rivnya U situaciyi koli kilkist indikatoriv ye velikoyu stvoryuyuchi takim chinom duzhe veliku tablicyu abo de proektuvalnik ochikuye otrimati tilki kilka mozhlivih kombinacij bilsh docilno buduvati kozhen ryadok u rozmirnosti nebazhanih ob yektiv oskilki mozhlivo zustrinutsya j novi kombinaciyi Shob obmezhiti rozmir tablic dekilka nebazhanih rozmirnostej mozhut buti pridatnimi v inshih situaciyah zalezhno vid spivvidnoshennya riznih pokaznikiv Nebazhani rozmirnosti takozh pidhodyat dlya rozmishennya atributiv podibnih do ne zagalnih komentariv z tablici faktiv Taki atributi mozhut skladatisya z danih yaki mistyat neobov yazkovi polya napriklad pri oformlenni kliyentom zamovlennya i v rezultati jmovirno taki polya budut porozhnimi u bilshosti vipadkiv Takim chinom rozmirnist nebazhanogo vmistu povinen mistiti odin ryadok yakij predstavlyaye probili yak surogatnij klyuch yakij bude vikoristovuvatisya u tablici faktiv dlya kozhnogo ryadka sho povertayetsya z porozhnim polem komentarya Virodzhena rozmirnist Virodzhena rozmirnist ce klyuch takij yak napriklad nomer tranzakciyi nomer rahunku fakturi nomer kvitka abo nomer vekselya yakij ne maye atributiv i otzhe ne priyednuyetsya do faktichnoyi tablici rozmirnostej Virodzheni rozmirnosti duzhe poshireni koli zanadto velikij tablici faktiv predstavlyayut yedinij element tranzakciyi abo poziciyu ryadka oskilki virodzhena rozmirnist yavlyaye soboyu unikalnij identifikator batkivskogo Virodzheni rozmirnosti chasto grayut neviddilnu rol u pervinnomu klyuchi tablici faktiv Rozmirnist rolovih igor Rozmirnosti chasto pereroblyayutsya dlya dekilkoh dodatkiv v mezhah odniyeyi bazi danih Napriklad rozmirnist Data mozhe buti vikoristanij dlya Data prodazhu a takozh Data dostavlennya abo Data prokatu Ce chasto nazivayut rolovoyu rozmirnistyu Vikoristannya terminiv podannya ISOPri posilanni na dani z reyestru metadanih takih yak en en taki yak Indikator buleve znachennya pravda brehnya angl true false Kod nabir pererahovanih znachen sho ne peretinayutsya zazvichaj vikoristovuyutsya yak rozmirnosti Napriklad vikoristovuyuchi en im ya elementa danih bude Person Gender Code a pererahovani znachennya mozhut buti cholovik zhinka i nevidomo Tablicya rozmirnostejU shovishah danih tablicya rozmirnostej ye odniyeyu z naboru tablic suputnikiv dlya tablici faktiv Tablicya faktiv mistit dilovi fakti abo en i zovnishni klyuchi yaki posilayutsya na potencijni klyuchi zazvichaj pervinni klyuchi v tablicyah rozmirnostej Na vidminu vid tablic faktiv tablici rozmirnostej mistyat opisovi atributi abo polya yaki zazvichaj ye tekstovimi polyami abo diskretnimi chislami yaki povodyatsya yak tekst Ci atributi priznacheni dlya vikonannya dvoh vazhlivih cilej obmezhennya zapitiv i abo filtraciyi a takozh markuvannya naboru rezultativ zapitu Atributi rozmirnosti mayut buti Movnimi etiketki sho skladayutsya z povnih sliv Opisovimi Zakinchenimi bez vidsutnih znachen Diskretno ocinyuvanimi maye lishe odne znachennya tablici v ryadku rozmirnostej Zabezpecheni yakistyu bez pravopisu abo nemozhlivih znachen Ryadki tablici rozmirnosti odnoznachno identifikuyutsya odnim klyuchovim polem Rekomenduyetsya shob pole klyucha bulo prostim cilim chislom oskilki znachennya klyucha ne maye sensu krim vikoristannya dlya ob yednannya poliv mizh tablicyami faktiv ta rozmirnostej Tablici rozmirnostej chasto vikoristovuyut pervinni klyuchi yaki takozh ye surogatnimi klyuchami Surogatni klyuchi yak pravilo generuyutsya avtomatichno napriklad stovpec identifikatoriv Sybase abo SQL Server PostgreSQL abo Informix serial poslidovnist v Oracle abo stovpec viznachenij za dopomogoyu AUTO INCREMENT v MySQL Vikoristannya klyuchiv surogatnih rozmirnostej maye ryad perevag vklyuchayuchi Produktivnist Vikonannya priyednannya nabagato efektivnisha za dopomogoyu odnogo polya surogatnogo klyucha Buferizaciya z vikoristannyam operativnih metodiv upravlinnya Ce zapobigaye situaciyam koli vidaleni ryadki danih mozhut z yavitisya znovu koli yihni prirodni klyuchi povtorno vikoristovuyutsya abo perepriznacheni pislya trivalogo periodu koli voni ne buli vikoristani Kartuvannya dlya integraciyi riznoridnih dzherel Obrobka nevidomih abo nepridatnih z yednan Vidstezhennya zmin u znachennyah atributiv rozmirnostej Hocha vikoristannya surogatnogo klyucha pokladayetsya na sistemu ETL mozhna pokrashiti obrobku komunikacijnoyi liniyi a instrumenti ETL mayut vbudovanu obrobku surogatnih klyuchiv Meta tablici rozmirnosti polyagaye v stvorenni standartizovanih vidpovidnih rozmirnostej yaki mozhna spilno vikoristovuvati v seredovishi shovisha danih pidpriyemstva i dozvolyaye priyednatisya do dekilkoh tablic faktiv sho predstavlyayut rizni biznes procesi Vidpovidni rozmirnosti duzhe vazhlivi dlya korporativnogo harakteru sistem DW BI oskilki voni spriyayut Poslidovnosti Kozhna tablicya faktiv filtruyetsya poslidovno tak sho vidpovidi na zapit poznachayutsya poslidovno Integraciyi Zapiti mozhut obroblyati rizni tablici faktoriv procesu okremo dlya kozhnoyi okremoyi tablici faktiv a potim priyednuvati rezultati do atributiv zagalnoyi rozmirnosti Zmenshennya chasu rozrobki magazinu Zagalni rozmirnosti dostupni bez yih vidtvorennya Z chasom atributi zadanogo ryadka v tablici rozmirnostej mozhut zminyuvatisya Napriklad adresa dostavlennya dlya kompaniyi mozhe zminyuvatisya en posilayetsya na ce yavishe yak na en Strategiyi virishennya takogo rodu zmin podilyayutsya na tri kategoriyi Pershij tip Prosto perezapishit stari znachennya Drugij tip Dodajte novij ryadok sho mistit nove znachennya i rozriznyajte ryadki za dopomogoyu metodiv en Tretij tip Dodajte novij atribut do nayavnogo ryadka Zagalni modeliData i chas Oskilki bagato tablic faktiv u shovishi danih ye chasovimi ryadami sposterezhen chasto potribni odin abo bilshe rozmirnostej dati Odniyeyu z prichin dlya togo shob mati rozmirnist dati ye rozmishennya znan kalendarya v shovishi danih zamist zhorstkogo koduvannya v dodatku Popri te sho prosta data abo data chas SQL ye korisnoyu dlya nadannya tochnoyi informaciyi pro chas zapisu faktu vona ne mozhe nadati informaciyu pro svyata fiskalni periodi tosho Mitku dati chasu SQL vse she mozhe buti korisno zberigati u tablici faktiv oskilki ce dozvolyaye provoditi tochni rozrahunki Nayavnist yak dati tak i chasu dnya v odnij i tij zhe rozmirnosti mozhe prizvesti do velicheznogo ob yemu z miljonami ryadkiv Yaksho potribna velika kilkist detalej to varto rozbiti datu i chas na dvi abo bilshe okremih rozmirnostej Rozmirnist chasu z kilkoma sekundami u den bude mati lishe 86400 ryadkiv Stepin detalizaciyi dlya rozmirnostej dati chasu mozhna vibrati v zalezhnosti vid potreb Napriklad rozmirnosti dati mozhut mati tochnist do roku kvartalu misyacya abo dnya a rozmirnosti chasu mozhut mati tochnist do godin hvilin abo sekund Yak pravilo rozmirnist chasu maye buti stvorena tilki todi koli potribni iyerarhichni ugrupovannya abo yaksho isnuyut zmistovni tekstovi opisi dlya periodiv chasu protyagom dnya napriklad vechirnya zatrimka abo persha zmina Yaksho ryadki v tablici faktiv nadhodyat z dekilkoh riznih chasovih poyasiv mozhe buti korisno zberigati datu i chas yak za miscevim chasom tak i za standartnim chasom napriklad Grinvich Ce mozhna zrobiti mayuchi dvi rozmirnosti dlya kozhnogo neobhidnogo vimiryuvannya dati chasu odin dlya miscevogo chasu a odin dlya standartnogo chasu Zberezhennya dati chasu yak u miscevomu tak i v standartnomu chasi dozvolit proanalizuvati koli fakti stvoryuyutsya v lokalnij situaciyi i v globalnij situaciyi Vibranij standartnij chas mozhe buti zagalnim standartnim chasom napriklad UTC ce mozhe buti miscevij chas shtab kvartiri pidpriyemstva abo bud yakij inshij chasovij poyas yakij dorechno bulo b vikoristovuvati v pevnij situaciyi Div takozhKategorijna zminna Shovishe danih Tablicya faktiv en Metadani OLAP Shema snizhinkiLiteraturaBarsegyan A Tehnologii analiza dannyh Data Mining Text Mining Visual Mining OLAP 2 izd Dushan Petkovich Microsoft SQL Server 2012 Rukovodstvo dlya nachinayushih s 597Posilannya Oracle Data Warehousing Guide 15 zhovtnya 2018 u Wayback Machine Oracle Corporation retrieved 9 June 2014 Definition Dimension 15 zhovtnya 2018 u Wayback Machine Search Data Management TechTarget retrieved 9 June 2014 www urbandictionary com Arhiv originalu za 29 veresnya 2020 Ralph Kimball Margy Ross The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling Second Edition Wiley Computer Publishing 2002 ISBN 0471 20024 7 Pages 82 87 394 Ralph Kimball Margy Ross The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling Second Edition Wiley Computer Publishing 2002 ISBN 0471 20024 7 Pages 202 405 Kimball Ralph et al 2008 The Data Warehouse Lifecycle Toolkit Second Edition Wiley Publishing Inc Indianapolis IN Pages 263 265 Ralph Kimball Margy Ross The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling Second Edition Wiley Computer Publishing 2002 ISBN 0471 20024 7 Pages 50 398 Ralph Kimball The Data Warehouse Toolkit Second Edition Wiley Publishing Inc 2008 ISBN 978 0 470 14977 5 Pages 253 256