Сховище даних (англ. data warehouse) — предметно орієнтований, інтегрований, незмінний набір даних, що підтримує хронологію і здатний бути комплексним джерелом достовірної інформації для оперативного аналізу та прийняття рішень. В основі концепції сховища даних (СД) лежить розподіл інформації, що використовують в системах оперативної обробки даних (OLTP) і в системах підтримки прийняття рішень (СППР). Такий розподіл дозволяє оптимізувати як структури даних оперативного зберігання для виконання операцій введення, модифікації, знищення та пошуку, так і структури даних, що використовуються для аналізу. В СППР ці два типи даних називаються відповідно оперативними джерелами даних (ОДД) та сховищем даних.
Перші статті, присвячені сховищам даних з'явилися в 1988 році, їх авторами були Девлін та Мерфі. В 1992 році Уільман Г. Інмон детально описав дану концепцію в своїй монографії «Побудова сховищ даних».
Історія
Спроби створення систем прийняття рішень, які б безпосередньо зверталися до баз даних систем оперативної обробки трансакцій OLTP, виявляються в більшості випадків неефективними . Тому для забезпечення можливості аналізу накопичених даних організації почали створювати сховища даних, що являють собою інтегровані колекції даних, зібрані з різних систем оперативного доступу до даних.
Концепція Data Warehouse була запропонована в 1992 р. Білом Інмоном в його книзі «Building the Data Warehouse» та стала однією з домінуючих в розробці інформаційних технологій обробки даних 90-х років. Англомовний термін Data Warehouse означає створення, підтримку, управління та використання сховища даних, що говорить про те, що мова йде про процес. Мета цього процесу — неперервне надання необхідної інформації потрібним співробітникам організації. Цей процес передбачає постійний розвиток, удосконалення, розв'язання все нових задач. Процес ніколи не закінчується, тому його не можна вмістити в більш-менш чіткі часові рамки так, як це можна зробити для традиційних систем оперативного доступу до даних.
Основні характеристики
Сховища даних — основа для побудови систем підтримки прийняття рішень. Основна мета створення сховища в тому, щоб зробити усі значимі для управління бізнесом дані доступними в стандартизованій формі, придатними для аналізу та отримання необхідних звітів. Для досягнення цього потрібно отримати дані із існуючих внутрішніх та зовнішніх, доступних для комп'ютера, джерел. Незважаючи на відмінності в підходах та реалізаціях, усім сховищам даних властиві такі спільні риси: предметна орієнтованість, інтегрованість, прив'язка до часу, незмінність.
Предметна орієнтованість
Інформація в сховищі даних організована відповідно до основних аспектів діяльності підприємства (замовники, продажі, склад тощо). Це відрізняє сховище даних від оперативної БД, де дані організовано відповідно до процесів (виписка рахунків, відвантаження товару тощо). Предметна організація даних в сховищі сприяє як значному спрощенню аналізу, так і підвищенню швидкості виконання аналітичних запитів. Вона виражається, зокрема, в використанні інших, порівняно з оперативними системами, систем організації даних. У випадку зберігання даних в реляційній СУБД використовується схема «зірки» (англ. star schema) чи «сніжинки» (англ. snowflake schema). Крім цього, дані можуть зберігатися в спеціальній багатовимірній СУБД в n-вимірних кубах.
Інтегрованість
Перш ніж потрапити до сховища даних оперативні дані перевіряють, очищують та певним чином агрегують. Вихідні дані отримуються із оперативних БД, перевіряються, очищуються, приводяться до єдиного виду, в потрібній мірі агрегуються (вираховуються сумарні та інші статистичні показники) і завантажуються в сховище. Такі інтегровані дані набагато простіше аналізувати.
Підтримка хронології
Дані в сховищі завжди напряму зв'язані з певним періодом часу. Дані, отримані із оперативних БД, накопичуються в сховищі у виді «історичних шарів», кожен з яких стосується конкретного періоду часу. Це дозволяє аналізувати тенденції в розвитку бізнесу.
Незмінність
Потрапивши в певний «історичний шар» сховища, дані уже ніколи не мінятимуться. Це також відрізняє сховище від оперативної БД, в якій дані постійно змінюються, у зв'язку з чим один і той же запит, виконаний в різні моменти часу, може дати різні результати. Стабільність даних також полегшує їх аналіз.
Мінімальна надлишковість
Не зважаючи на те, що інформація до сховища даних потрапляє від багатьох OLTP-систем, надлишковість інформації в сховищі даних зведена до мінімуму.
Вимоги
- Адекватність відображення логіки предметного середовища у відповідній моделі даних.
- Оптимальна надмірність даних. БД повинна являти собою єдину сукупність інтегрованих даних.
- Наявність ефективних засобів ведення баз даних (засоби створення, накопичення, модифікації, видалення та пошуку даних).
- Цілісність даних та їх узгодженість при виконанні користувачами операцій над ними.
- Безпека даних — захист від несанкціонованого доступу до даних та від руйнування БД.
- Можливість реструктуризації БД — наявність засобів змінювання структури даних при змінюванні запитів до БД.
- Наявність повних, зручних та простих у вивченні мовних засобів визначення та маніпулювання даними.
- Наявність документації.
- Простота вивчення.
- Взаємна незалежність програм та даних.
Види сховищ даних
При використанні СППР можуть застосовуватись 2 види сховищ даних:
Фізичне СД
При реалізації моделі СППР з фізичним СД дані з різних ОДД копіюються в єдине сховище. Зібрані дані приводяться до єдиного формату, узгоджуються та узагальнюються. Аналітичні запити адресуються до сховища даних.
Така модель безсумнівно приводить до дублювання інформації в ОДД та в СД. Проте така надлишковість не перевищує 1%. Це пояснюється такими причинами:
- при завантаженні інформації із ОДД в СД дані фільтруються. багато з них не потрапляють в СД, оскільки не мають змісту з точки зору використання в процедурах аналізу;
- інформація в ОДД носить, як правило, оперативний характер, і дані, втративши актуальність, знищуються. В СД, навпаки, зберігається історична інформація. З цієї точки зору дублювання вмісту СД даними ОДД є дуже незначним;
- в СД зберігається узагальнена інформація, яка в ОДД відсутня;
- під час завантаження в СД дані очищаються (видаляється непотрібна інформація) і приводяться до єдиного формату. Після такої обробки дані займають значно менший обсяг.
Віртуальне СД
Надлишковість інформації можна звести до нуля, використовуючи віртуальне СД. В даному випадку на відміну від фізичного СД дані з ОДД не копіюються в єдине сховище. Вони витягуються, перетворюються та інтегруються безпосередньо при виконанні аналітичних запитів в оперативній пам'яті комп'ютера. Фактично такі запити напряму адресуються до ОДД. Основними перевагами віртуального СД є:
- мінімізація обсягу пам'яті, який займають дані на носії інформації;
- робота з поточними, деталізованими даними.
Однак такий підхід має і багато недоліків. Час обробки запитів до віртуального сховища даних значно перевищує відповідні показники для фізичного сховища. Крім того, структури оперативних баз даних, що розраховані на інтенсивне оновлення даних є сильно нормалізованими. Тоді як для виконання аналітичного запиту вимагається об'єднання великої кількості таблиць, що також приводить до зниження швидкодії. Інтегрований погляд на віртуальне сховище можливий тільки при виконанні умови постійної доступності всіх оперативних джерел даних. Таким чином, тимчасова недоступність хоча б одного з джерел може привести або до невиконання аналітичних запитів, або до невірних результатів. Виконання складних аналітичних запитів над ОДД займає великий обсяг ресурсів комп'ютерів, на яких вони працюють. Це приводить до зниження швидкодії OLTP-систем, що недопустимо, оскільки час виконання операцій в таких системах є дуже критичним параметром.
Головним же недоліком віртуального сховища даних вважається практична неможливість отримання даних за довгий період часу. При відсутності фізичного сховища доступні тільки ті дані, які на момент запиту містяться в ОДД. Основне призначення OLTP-систем — оперативна обробка поточних даних, тому вони не орієнтовані на зберігання даних за тривалий період часу. По мірі застарівання дані вивантажуються в архів та видаляються з оперативної БД.
Інша типологія
Корпоративні сховища даних
Корпоративні сховища даних містять інформацію, яка стосується усієї корпорації (всього підприємства), і яка зібрана з великої кількості оперативних джерел для консолідованого аналізу. Зазвичай такі сховища охоплюють цілий ряд аспектів діяльності підприємства і використовуються для прийняття як тактичних, так і стратегічних рішень. Корпоративне сховище містить детальну та узагальнюючу інформацію. Вартість створення та підтримки корпоративних сховищ може бути дуже великою. Частіше всього їх створенням займаються централізовані відділи інформаційних технологій, причому вони створюються методом зверху вниз — спочатку проектується загальна схема, і тільки потім починається заповнення даними. Такий процес може тривати декілька років.
Кіоски даних
Кіоски даних містять підмножину корпоративних даних та створюються для відділів чи підрозділів всередині організації. Кіоски даних часто створюються силами самого відділу та охоплюють конкретний аспект, що цікавить співробітників даного відділу. Кіоск даних може отримувати дані з корпоративного сховища (залежний кіоск) або, що більш розповсюджено, дані можуть отримуватись безпосередньо з оперативних джерел (незалежний кіоск).
Основними постачальниками програмного забезпечення сховищ даних є компанії , Hewlett-Packard, IBM, Informix, Microsoft, Oracle, , , , Sybase та ін. Усі ці фірми мають сторінки в Internet, на яких наводяться детальні відомості про їх продукти та послуги.
Проблеми створення СД
Незважаючи на переваги фізичного СД перед віртуальним, слід визнати, що його реалізація являє собою достатньо трудомісткий процес. Тому при створенні СД виникає ряд проблем:
- Необхідність інтеграції даних із неоднорідних джерел в розподіленому середовищі — СД створюються для інтегрування даних, які можуть надходити з різнорідних ОДД, фізично розміщених на різних комп'ютерах. При створенні СД необхідно вирішувати задачу побудови системи, що узгоджено функціонує з неоднорідними програмними засобами та рішеннями. При виборі засобів реалізації СД доводиться враховувати багато факторів, які включають рівень сумісності різних програмних компонентів, легкість їх засвоєння та використання, ефективність функціонування.
- Потреба в ефективному зберіганні та обробці великих обсягів інформації — Властивість незмінності СД передбачає накопичення в ньому інформації за довгий період часу, що повинно підтримуватися постійним зростанням обсягів дискової пам'яті. Орієнтація на виконання аналітичних запитів та зв'язана з цим денормалізація даних приводять до нелінійного росту обсягів пам'яті, які займає сховище даних при зростанні обсягу даних. Дослідження показують, що для включення до СД набору даних, які займали в оперативній БД 100 Мб, необхідно в 5 разів більше дискового простору.
- Необхідність наявності багаторівневих довідників метаданих — для систем аналізу наявність розвинутих метаданих (даних про дані) і засобів їх представлення кінцевим користувачам є однією з основних умов успішної реалізації СД. Метадані необхідні користувачам СППР для розуміння структури інформації, на основі якої приймається рішення. При створенні СД необхідно вирішувати задачі зберігання та зручного представлення метаданих користувачам.
- Підвищені вимоги до безпеки даних — зібрана разом і узгоджена інформація про історію розвитку корпорації, її успіхи та невдачі, про взаємовідносини з постачальниками та замовниками, про історію та стан ринку дає можливість аналізу минулої та поточної діяльності корпорації та побудови прогнозів для майбутнього. Очевидно, що така інформація є конфіденційною і доступ до неї обмежений в межах самої компанії, не говорячи вже про інші компанії. Для забезпечення безпеки даних потрібно вирішувати питання автентифікації користувачів, захисту даних при їх переміщенні в сховище даних з оперативних баз даних та зовнішніх джерел, захисту даних при їх передаванні по мережі.
Зниження затрат на створення СД можна досягти, створюючи його спрощений варіант — вітрину даних (data mart).
Див. також
Примітки
- Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Методы и модели анализа данных: OLAP и Data Mining. — СПб.: БХВ-Петербург, 2004. — 336 с
- Inmon W.H. Building the Data Warehouse, 4th Edition. — Hoboken, NJ:Wiley, 2005. — 576 p.
Література
- Сховища та простори даних : монографія / Н. Б. Шаховська, В. В. Пасічник ; М-во освіти і науки України, Нац. ун-т «Львів. політехніка». − Л. : Вид-во Нац. ун-ту «Львів. політехніка», 2009. − 240 с. − Бібліогр. : с. 230−240 (207 назв). − .
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Shovishe danih angl data warehouse predmetno oriyentovanij integrovanij nezminnij nabir danih sho pidtrimuye hronologiyu i zdatnij buti kompleksnim dzherelom dostovirnoyi informaciyi dlya operativnogo analizu ta prijnyattya rishen V osnovi koncepciyi shovisha danih SD lezhit rozpodil informaciyi sho vikoristovuyut v sistemah operativnoyi obrobki danih OLTP i v sistemah pidtrimki prijnyattya rishen SPPR Takij rozpodil dozvolyaye optimizuvati yak strukturi danih operativnogo zberigannya dlya vikonannya operacij vvedennya modifikaciyi znishennya ta poshuku tak i strukturi danih sho vikoristovuyutsya dlya analizu V SPPR ci dva tipi danih nazivayutsya vidpovidno operativnimi dzherelami danih ODD ta shovishem danih Zagalna shema shovisha danih Bazova arhitektura shovisha danih Pershi statti prisvyacheni shovisham danih z yavilisya v 1988 roci yih avtorami buli Devlin ta Merfi V 1992 roci Uilman G Inmon detalno opisav danu koncepciyu v svoyij monografiyi Pobudova shovish danih IstoriyaSprobi stvorennya sistem prijnyattya rishen yaki b bezposeredno zvertalisya do baz danih sistem operativnoyi obrobki transakcij OLTP viyavlyayutsya v bilshosti vipadkiv neefektivnimi Tomu dlya zabezpechennya mozhlivosti analizu nakopichenih danih organizaciyi pochali stvoryuvati shovisha danih sho yavlyayut soboyu integrovani kolekciyi danih zibrani z riznih sistem operativnogo dostupu do danih Koncepciya Data Warehouse bula zaproponovana v 1992 r Bilom Inmonom v jogo knizi Building the Data Warehouse ta stala odniyeyu z dominuyuchih v rozrobci informacijnih tehnologij obrobki danih 90 h rokiv Anglomovnij termin Data Warehouse oznachaye stvorennya pidtrimku upravlinnya ta vikoristannya shovisha danih sho govorit pro te sho mova jde pro proces Meta cogo procesu neperervne nadannya neobhidnoyi informaciyi potribnim spivrobitnikam organizaciyi Cej proces peredbachaye postijnij rozvitok udoskonalennya rozv yazannya vse novih zadach Proces nikoli ne zakinchuyetsya tomu jogo ne mozhna vmistiti v bilsh mensh chitki chasovi ramki tak yak ce mozhna zrobiti dlya tradicijnih sistem operativnogo dostupu do danih Osnovni harakteristikiShovisha danih osnova dlya pobudovi sistem pidtrimki prijnyattya rishen Osnovna meta stvorennya shovisha v tomu shob zrobiti usi znachimi dlya upravlinnya biznesom dani dostupnimi v standartizovanij formi pridatnimi dlya analizu ta otrimannya neobhidnih zvitiv Dlya dosyagnennya cogo potribno otrimati dani iz isnuyuchih vnutrishnih ta zovnishnih dostupnih dlya komp yutera dzherel Nezvazhayuchi na vidminnosti v pidhodah ta realizaciyah usim shovisham danih vlastivi taki spilni risi predmetna oriyentovanist integrovanist priv yazka do chasu nezminnist Predmetna oriyentovanist Informaciya v shovishi danih organizovana vidpovidno do osnovnih aspektiv diyalnosti pidpriyemstva zamovniki prodazhi sklad tosho Ce vidriznyaye shovishe danih vid operativnoyi BD de dani organizovano vidpovidno do procesiv vipiska rahunkiv vidvantazhennya tovaru tosho Predmetna organizaciya danih v shovishi spriyaye yak znachnomu sproshennyu analizu tak i pidvishennyu shvidkosti vikonannya analitichnih zapitiv Vona virazhayetsya zokrema v vikoristanni inshih porivnyano z operativnimi sistemami sistem organizaciyi danih U vipadku zberigannya danih v relyacijnij SUBD vikoristovuyetsya shema zirki angl star schema chi snizhinki angl snowflake schema Krim cogo dani mozhut zberigatisya v specialnij bagatovimirnij SUBD v n vimirnih kubah Integrovanist Persh nizh potrapiti do shovisha danih operativni dani pereviryayut ochishuyut ta pevnim chinom agreguyut Vihidni dani otrimuyutsya iz operativnih BD pereviryayutsya ochishuyutsya privodyatsya do yedinogo vidu v potribnij miri agreguyutsya virahovuyutsya sumarni ta inshi statistichni pokazniki i zavantazhuyutsya v shovishe Taki integrovani dani nabagato prostishe analizuvati Pidtrimka hronologiyi Dani v shovishi zavzhdi napryamu zv yazani z pevnim periodom chasu Dani otrimani iz operativnih BD nakopichuyutsya v shovishi u vidi istorichnih shariv kozhen z yakih stosuyetsya konkretnogo periodu chasu Ce dozvolyaye analizuvati tendenciyi v rozvitku biznesu Nezminnist Potrapivshi v pevnij istorichnij shar shovisha dani uzhe nikoli ne minyatimutsya Ce takozh vidriznyaye shovishe vid operativnoyi BD v yakij dani postijno zminyuyutsya u zv yazku z chim odin i toj zhe zapit vikonanij v rizni momenti chasu mozhe dati rizni rezultati Stabilnist danih takozh polegshuye yih analiz Minimalna nadlishkovist Ne zvazhayuchi na te sho informaciya do shovisha danih potraplyaye vid bagatoh OLTP sistem nadlishkovist informaciyi v shovishi danih zvedena do minimumu VimogiAdekvatnist vidobrazhennya logiki predmetnogo seredovisha u vidpovidnij modeli danih Optimalna nadmirnist danih BD povinna yavlyati soboyu yedinu sukupnist integrovanih danih Nayavnist efektivnih zasobiv vedennya baz danih zasobi stvorennya nakopichennya modifikaciyi vidalennya ta poshuku danih Cilisnist danih ta yih uzgodzhenist pri vikonanni koristuvachami operacij nad nimi Bezpeka danih zahist vid nesankcionovanogo dostupu do danih ta vid rujnuvannya BD Mozhlivist restrukturizaciyi BD nayavnist zasobiv zminyuvannya strukturi danih pri zminyuvanni zapitiv do BD Nayavnist povnih zruchnih ta prostih u vivchenni movnih zasobiv viznachennya ta manipulyuvannya danimi Nayavnist dokumentaciyi Prostota vivchennya Vzayemna nezalezhnist program ta danih Vidi shovish danihPri vikoristanni SPPR mozhut zastosovuvatis 2 vidi shovish danih Fizichne SD Pri realizaciyi modeli SPPR z fizichnim SD dani z riznih ODD kopiyuyutsya v yedine shovishe Zibrani dani privodyatsya do yedinogo formatu uzgodzhuyutsya ta uzagalnyuyutsya Analitichni zapiti adresuyutsya do shovisha danih Taka model bezsumnivno privodit do dublyuvannya informaciyi v ODD ta v SD Prote taka nadlishkovist ne perevishuye 1 Ce poyasnyuyetsya takimi prichinami pri zavantazhenni informaciyi iz ODD v SD dani filtruyutsya bagato z nih ne potraplyayut v SD oskilki ne mayut zmistu z tochki zoru vikoristannya v procedurah analizu informaciya v ODD nosit yak pravilo operativnij harakter i dani vtrativshi aktualnist znishuyutsya V SD navpaki zberigayetsya istorichna informaciya Z ciyeyi tochki zoru dublyuvannya vmistu SD danimi ODD ye duzhe neznachnim v SD zberigayetsya uzagalnena informaciya yaka v ODD vidsutnya pid chas zavantazhennya v SD dani ochishayutsya vidalyayetsya nepotribna informaciya i privodyatsya do yedinogo formatu Pislya takoyi obrobki dani zajmayut znachno menshij obsyag Virtualne SD Nadlishkovist informaciyi mozhna zvesti do nulya vikoristovuyuchi virtualne SD V danomu vipadku na vidminu vid fizichnogo SD dani z ODD ne kopiyuyutsya v yedine shovishe Voni vityaguyutsya peretvoryuyutsya ta integruyutsya bezposeredno pri vikonanni analitichnih zapitiv v operativnij pam yati komp yutera Faktichno taki zapiti napryamu adresuyutsya do ODD Osnovnimi perevagami virtualnogo SD ye minimizaciya obsyagu pam yati yakij zajmayut dani na nosiyi informaciyi robota z potochnimi detalizovanimi danimi Odnak takij pidhid maye i bagato nedolikiv Chas obrobki zapitiv do virtualnogo shovisha danih znachno perevishuye vidpovidni pokazniki dlya fizichnogo shovisha Krim togo strukturi operativnih baz danih sho rozrahovani na intensivne onovlennya danih ye silno normalizovanimi Todi yak dlya vikonannya analitichnogo zapitu vimagayetsya ob yednannya velikoyi kilkosti tablic sho takozh privodit do znizhennya shvidkodiyi Integrovanij poglyad na virtualne shovishe mozhlivij tilki pri vikonanni umovi postijnoyi dostupnosti vsih operativnih dzherel danih Takim chinom timchasova nedostupnist hocha b odnogo z dzherel mozhe privesti abo do nevikonannya analitichnih zapitiv abo do nevirnih rezultativ Vikonannya skladnih analitichnih zapitiv nad ODD zajmaye velikij obsyag resursiv komp yuteriv na yakih voni pracyuyut Ce privodit do znizhennya shvidkodiyi OLTP sistem sho nedopustimo oskilki chas vikonannya operacij v takih sistemah ye duzhe kritichnim parametrom Golovnim zhe nedolikom virtualnogo shovisha danih vvazhayetsya praktichna nemozhlivist otrimannya danih za dovgij period chasu Pri vidsutnosti fizichnogo shovisha dostupni tilki ti dani yaki na moment zapitu mistyatsya v ODD Osnovne priznachennya OLTP sistem operativna obrobka potochnih danih tomu voni ne oriyentovani na zberigannya danih za trivalij period chasu Po miri zastarivannya dani vivantazhuyutsya v arhiv ta vidalyayutsya z operativnoyi BD Insha tipologiya Korporativni shovisha danih Korporativni shovisha danih mistyat informaciyu yaka stosuyetsya usiyeyi korporaciyi vsogo pidpriyemstva i yaka zibrana z velikoyi kilkosti operativnih dzherel dlya konsolidovanogo analizu Zazvichaj taki shovisha ohoplyuyut cilij ryad aspektiv diyalnosti pidpriyemstva i vikoristovuyutsya dlya prijnyattya yak taktichnih tak i strategichnih rishen Korporativne shovishe mistit detalnu ta uzagalnyuyuchu informaciyu Vartist stvorennya ta pidtrimki korporativnih shovish mozhe buti duzhe velikoyu Chastishe vsogo yih stvorennyam zajmayutsya centralizovani viddili informacijnih tehnologij prichomu voni stvoryuyutsya metodom zverhu vniz spochatku proektuyetsya zagalna shema i tilki potim pochinayetsya zapovnennya danimi Takij proces mozhe trivati dekilka rokiv Kioski danih Dokladnishe Kiosk danih Kioski danih mistyat pidmnozhinu korporativnih danih ta stvoryuyutsya dlya viddiliv chi pidrozdiliv vseredini organizaciyi Kioski danih chasto stvoryuyutsya silami samogo viddilu ta ohoplyuyut konkretnij aspekt sho cikavit spivrobitnikiv danogo viddilu Kiosk danih mozhe otrimuvati dani z korporativnogo shovisha zalezhnij kiosk abo sho bilsh rozpovsyudzheno dani mozhut otrimuvatis bezposeredno z operativnih dzherel nezalezhnij kiosk Osnovnimi postachalnikami programnogo zabezpechennya shovish danih ye kompaniyi Hewlett Packard IBM Informix Microsoft Oracle Sybase ta in Usi ci firmi mayut storinki v Internet na yakih navodyatsya detalni vidomosti pro yih produkti ta poslugi Problemi stvorennya SDNezvazhayuchi na perevagi fizichnogo SD pered virtualnim slid viznati sho jogo realizaciya yavlyaye soboyu dostatno trudomistkij proces Tomu pri stvorenni SD vinikaye ryad problem Neobhidnist integraciyi danih iz neodnoridnih dzherel v rozpodilenomu seredovishi SD stvoryuyutsya dlya integruvannya danih yaki mozhut nadhoditi z riznoridnih ODD fizichno rozmishenih na riznih komp yuterah Pri stvorenni SD neobhidno virishuvati zadachu pobudovi sistemi sho uzgodzheno funkcionuye z neodnoridnimi programnimi zasobami ta rishennyami Pri vibori zasobiv realizaciyi SD dovoditsya vrahovuvati bagato faktoriv yaki vklyuchayut riven sumisnosti riznih programnih komponentiv legkist yih zasvoyennya ta vikoristannya efektivnist funkcionuvannya Potreba v efektivnomu zberiganni ta obrobci velikih obsyagiv informaciyi Vlastivist nezminnosti SD peredbachaye nakopichennya v nomu informaciyi za dovgij period chasu sho povinno pidtrimuvatisya postijnim zrostannyam obsyagiv diskovoyi pam yati Oriyentaciya na vikonannya analitichnih zapitiv ta zv yazana z cim denormalizaciya danih privodyat do nelinijnogo rostu obsyagiv pam yati yaki zajmaye shovishe danih pri zrostanni obsyagu danih Doslidzhennya pokazuyut sho dlya vklyuchennya do SD naboru danih yaki zajmali v operativnij BD 100 Mb neobhidno v 5 raziv bilshe diskovogo prostoru Neobhidnist nayavnosti bagatorivnevih dovidnikiv metadanih dlya sistem analizu nayavnist rozvinutih metadanih danih pro dani i zasobiv yih predstavlennya kincevim koristuvacham ye odniyeyu z osnovnih umov uspishnoyi realizaciyi SD Metadani neobhidni koristuvacham SPPR dlya rozuminnya strukturi informaciyi na osnovi yakoyi prijmayetsya rishennya Pri stvorenni SD neobhidno virishuvati zadachi zberigannya ta zruchnogo predstavlennya metadanih koristuvacham Pidvisheni vimogi do bezpeki danih zibrana razom i uzgodzhena informaciya pro istoriyu rozvitku korporaciyi yiyi uspihi ta nevdachi pro vzayemovidnosini z postachalnikami ta zamovnikami pro istoriyu ta stan rinku daye mozhlivist analizu minuloyi ta potochnoyi diyalnosti korporaciyi ta pobudovi prognoziv dlya majbutnogo Ochevidno sho taka informaciya ye konfidencijnoyu i dostup do neyi obmezhenij v mezhah samoyi kompaniyi ne govoryachi vzhe pro inshi kompaniyi Dlya zabezpechennya bezpeki danih potribno virishuvati pitannya avtentifikaciyi koristuvachiv zahistu danih pri yih peremishenni v shovishe danih z operativnih baz danih ta zovnishnih dzherel zahistu danih pri yih peredavanni po merezhi Znizhennya zatrat na stvorennya SD mozhna dosyagti stvoryuyuchi jogo sproshenij variant vitrinu danih data mart Div takozhOLTP Baza danih Metadani Sistemi pidtrimki rishen Dobuvannya danihPrimitkiBarsegyan A A Kupriyanov M S Stepanenko V V Holod I I Metody i modeli analiza dannyh OLAP i Data Mining SPb BHV Peterburg 2004 336 s Inmon W H Building the Data Warehouse 4th Edition Hoboken NJ Wiley 2005 576 p LiteraturaShovisha ta prostori danih monografiya N B Shahovska V V Pasichnik M vo osviti i nauki Ukrayini Nac un t Lviv politehnika L Vid vo Nac un tu Lviv politehnika 2009 240 s Bibliogr s 230 240 207 nazv ISBN 978 966 553 796 0