Для поиска темы - пользуйтесь СИСТЕМОЙ ПОИСКА


Стоимость дипломной работы


Home Материалы для работы Вибір структури Сховища Даних

Вибір структури Сховища Даних
загрузка...
Рейтинг пользователей: / 0
ХудшийЛучший 

Вибір структури Сховища Даних


Кілька років тому для Сховищ Даних було запропоновано використовувати схеми даних, що отримали назви "зірка" і "сніжинка". Суть технології проектування цих схем полягає у виділенні із загального об'єму інформації власне аналізованих даних (або фактів) і допоміжних даних (названих вимірюваннями). Необхідно, проте, віддавати собі звіт у тому, що це приводить до дублювання даних в Сховищі, зниження гнучкості структури і збільшення часу завантаження. Все це - платня за ефективний і зручний доступ до даних, необхідний в СППР.
В процесі підготовки того або іншого рішення користувач аналізує зріз фактів поодинці або по декільком вимірюванням. Аналіз інформації, виходячи з понять вимірювань і фактів, іноді називають багатовимірним моделюванням даних (MultiDimensional Modelling, MDM). Таблиці фактів звичайно містять великі об'єми даних, тоді як таблиці вимірювань прагнуть зробити трохи менше. Цього підходу бажано дотримуватися тому, що запит по вибірці з об'єднання таблиць виконується швидше, коли одна велика таблиця об'єднується з декількома малими. При практичній реалізації СД невеликі таблиці вимірювань іноді вдається цілком розмістити в оперативній пам'яті, що різко підвищує ефективність виконання запитів.
Оскільки в Сховищах Даних, разом з детальними, повинні зберігатися і агреговані дані, у разі "сніжинки" або "зірки" з'являються таблиці агрегованих фактів (агрегатів). Подібні звичайним фактам агрегати можуть мати вимірювання. Крім того, вони повинні бути пов'язані з детальними фактами для забезпечення можливої деталізації. На практиці Сховища часто включають декілька таблиць фактів, зв'язаних між собою вимірюваннями, які таким чином розділяються між декількома таблицями фактів. Така схема носить назву "розширена сніжинка", і саме вона, як правило, зустрічається в Сховищах Даних.
Для досягнення щонайвищої продуктивності іноді використовують підхід, при якому кожна "зірка" розташовується в окремій базі даних або на окремому сервері. Хоча такий підхід приводить до збільшення розміру дискового простору за рахунок дублювання розділених вимірювань, він може виявитися вельми корисним при організації Вітрин Даних.
При проектуванні структури сховища часто виникає бажання використовувати якомога більше агрегатів і за рахунок цього підвищити продуктивність системи. Неважко підрахувати, що для моделі "зірка" з 10 вимірюваннями можна побудувати 10!=3.63 мільйона різних агрегованих значень, розміщення яких в пам'яті при встановленні зв'язків з відповідними вимірюваннями приведе до різкого збільшення займаного дискового простору і уповільнення доступу до даних. Інша крайність полягає у використанні дуже малого числа агрегатів, а це може привести до необхідності виконувати агрегацію динамічно, що помітно знижує ефективність запитів. За деякими оцінками, при визначенні оптимальної кількості агрегатів слід дотримуватися принципу 80:20 - 80% прискорення досягається за рахунок використовування 20% кандидатів на агрегати.


 
загрузка...

Добавить комментарий


Защитный код
Обновить