Головна Головна -> Реферати українською -> Інформатика, комп'ютери, програмування -> Сховище даних

Сховище даних

Назва:
Сховище даних
Тип:
Реферат
Мова:
Українська
Розмiр:
4,62 KB
Завантажень:
503
Оцінка:
 
поточна оцінка 5.0


Скачати цю роботу безкоштовно
Пролистати роботу: 1  2  3 
Сховище даних
План
1. Організація сховищ даних
2. Багатомірна модель сховища
3. Проектування сховищ даних
Організація сховищ даних
Сховище даних (Data Warehouse, DW) - система, що підтримує несуперечливу інтегровану предметно-орієнтовану сукупність історичних даних організації з метою підтримки
прийняття стратегічних рішень. Сховище даних представляє також різнобічні інструментальні засоби для аналізу даних.
Концепція сховищ даних - це концепція підготовки даних для подальшого аналізу. Інформаційні сховища призначені для систем підтримки прийняття рішень. Сховища даних розробляються з урахуванням специфіки предметної області, а не застосувань, які обробляють дані. Дані у сховищі повинні бути інтегровані, зведені до єдиного синтаксичного і семантичного вигляду, перевірені на цілісність і несуперечливість.
В основі концепції сховищ даних лежить ідея розподілу на дві групи даних, що використовуються: для оперативної обробки (OLTP) і для рішення задач аналізу (OLAP).
OLTP (On-Line Transaction Processing) - системи оперативной обробки транзакцій, які призначені для підтримки поточної діяльності різного роду організацій.
OLAP (On-Line Transaction Processing) - системи оперативної аналітичної обробки, які призначені для підтримки прийняття рішень і орієнтовані головним чином на нерегламентовані запити. Термін OLAP дозволяє описувати технологію обробки даних, в якій застосовується багатомірне представлення агрегованих даних для забезпечення швидкого доступу до даних для поглибленого аналізу.
Порівняльний аналіз OLTP і OLAP систем наведено в табл. 12.1.
Архітектура сучасних сховищ даних базується або на використанні багатомірної моделі БД (Multidimension OLAP, MOLAP), або на реляційній моделі БД (Relational OLAP, ROLAP).
Складність створення сховищ даних викликала необхідність розробки і організації підмножин даних сховища, які називаються кіосками даних.
Кіоск даних (вітрина даних) - спрощений варіант сховища даних, який містить тільки тематично об'єднані дані. Кіоск даних максимально наближений до кінцевого користувача і містить дані орієнтовані на нього.
Одна з найважливіших частин сучасних аналітичних систем - це засоби інтелектуального аналізу даних. Виконання більшості аналітичних запитів користувачів потребує складної статистичної обробки, застосування штучного інтелекту.
Data Mining - дослідження і знаходження комп'ютером (засобами штучного інтелекту) в даних прихованих
закономірностей, які не були раніше відомі, нетривіальні, практично корисні, доступні для інтерпретації людиною.
На рис. 12.1 показана логічна схема аналітичної системи зі сховищем даних.
Багатомірна модель сховища
Багатомірна модель передбачає, що дані зберігаються не у вигляді плоских таблиць, як в реляційній БД, а у вигляді гіперкубів - впорядкованих багатомірних масивів. Багатомірне
представлення даних тут реалізується фізично. Багатомірні СУБД забезпечують більш швидкий у порівнянні з реляційними системами пошук і читання даних. В цьому випадку немає потреби у багаторазовому з'єднанні таблиць. Такий підхід вимагає більше пам'яті для зберігання даних, при його використанні важко модифікувати структуру даних.
У багатомірній моделі розглядаються такі операції маніпулювання даними:
- переріз, який передбачає формування підмножини гіперкуба, в якому значення одного або більшої кількості вимірів є фіксованим;
- обертання, при якому змінюється порядок представлення вимірів;
- згорнення, передбачає заміну одного з вимірів іншим більш високого рівня ієрархії;
- деталізація - це операція зворотна до згорнення і забезпечує перехід від узагальнених даних до деталізованих.
Багатомірна СУБД краще за інші системи виконує складні нерегламентовані запити.
Проектування сховищ даних
При створенні сховища даних однією з основних задач є визначення оптимальної структури зберігання даних з точки зору забезпечення прийнятного часу відповіді на аналітичні запити і потрібного об'єму пам'яті.
Всі дані в сховищі даних поділяються на категорії:
- детальні дані;
- агреговані дані;
- метадані.

Завантажити цю роботу безкоштовно
Пролистати роботу: 1  2  3 



Реферат на тему: Сховище даних

BR.com.ua © 1999-2017 | Реклама на сайті | Умови використання | Зворотній зв'язок