Для поиска темы - пользуйтесь СИСТЕМОЙ ПОИСКА


Стоимость дипломной работы


Home Материалы для работы Сховища даних. Основи OLAP

Сховища даних. Основи OLAP
загрузка...
Рейтинг пользователей: / 0
ХудшийЛучший 

Сховища даних. Основи OLAP


Методи інтелектуального аналізу інформації, Data Mining, часто розглядаються як природний розвиток концепції сховищ даних, тому перед їх викладом необхідно мати уявлення про сховища даних і багатовимірне представлення інформації.
В чому відмінність сховища від бази даних? В першу чергу у тому, що їх створення і експлуатація переслідують різні цілі. База даних грає роль помічника в оперативному управлінні організації. Це щоденні задачі отримання актуальної інформації: бухгалтерської звітності, обліку договорів і т.д. У свою чергу сховище даних консолідує всю необхідну інформацію для здійснення задач стратегічного управління в середньостроковому і довгостроковому періоді. Наприклад, продаж товару і виписування рахунку проводяться з використанням бази даних, а аналіз динаміки продажу за декілька років, що дозволяє спланувати роботу з постачальниками, - за допомогою сховища даних.
Таким чином, сховище даних – це спеціальним чином систематизована інформація з різнорідних джерел (бази даних облікових систем компанії, маркетингові дані, думки клієнтів, дослідження конкурентів і т.п.), необхідна для обробки з метою ухвалення стратегічно важливих рішень в діяльності компанії.
Для того, щоб отримати якісний прогноз, потрібно зібрати максимум інформації про досліджуваний процес, що описує його з різних сторін. Наприклад, для прогнозування об'ємів продажу необхідна наступна інформація:
- історія продажу;
- стан складу на кожний день - якщо спад продажу часто пов'язаний з відсутністю товару на складі, а зовсім не за відсутністю попиту;
- відомості про ціни конкурентів;
- зміни в законодавстві;
- загальний стан ринку;
- курс долару, інфляція;
- відомості про рекламу;
- відомості про відношення до продукції клієнтів;
- різного роду специфічна інформація. Наприклад, для продавців морозива - температура, а для аптечних складів - санітарно-епідеміологічний стан, і багато що інше.
Проблема полягає в том, що звичайно в системах оперативного обліку більшої частини цієї інформації просто немає, а та, що є, спотворена і (або) неповна. Кращим варіантом в цьому випадку буде створення сховища даних, куди б з певною заданою періодичністю надходила вся необхідна інформація, заздалегідь систематизована і відфільтрована

Ефективна архітектура сховища даних повинна бути організована так, щоб бути складовою частиною інформаційної системи управління підприємством.
Найбільш поширений випадок, коли сховище організовано по типу «зірка», де в центрі розташовуються факти і агрегатні дані, а «промінням» є вимірювання. Кожна «зірка» описує певну дію, наприклад, продаж товару, відвантаження, надходження грошових коштів та інше .

Звичайно дані копіюються в сховище з оперативних баз даних і інших джерел згідно певному розкладу.
OLAP (On-Line Analytical Processing) є ключовим компонентом організації сховищ даних. Ця технологія заснована на побудові і візуалізації багатовимірних кубів даних з можливістю довільного маніпулювання інформацією, що міститься в кубі. Це дозволяє представити інформацію для аналізу в будь-якому розрізі.
Повернемося наприклад до аналізу продажу. Нехай керівника цікавлять об'єми продажу за деякий період, наприклад, за місяць, що тільки що завершився. Компанія продає не один, а безліч товарів і має велике число клієнтів, «розкиданих» по різних містах країни.
Перші два найпростіші питання, на які нам відразу ж хотілося б мати відповіді, - це об'єми продажу різних товарів по кожному місту за кожний місяць. Очевидно, що «відповідь» на кожне з цих питань буде оформлена у вигляді двовимірної таблиці. В першому випадку рядками і стовпцями цієї таблиці відповідно будуть назви товарів, місяці і суми, а в другому - назви міст і суми. Проте аналізувати інформацію у такому вигляді незручно. Виникає потреба «з'єднати» дані декількох таблиць. У результаті в такому звіті буде фігурувати три рівноправних аналітичних вимірювання (місто, товар і місяць), і замість двовимірних таблиць з'являється тривимірна модель представлення даних, так званий куб.


 
загрузка...

Добавить комментарий


Защитный код
Обновить