Для поиска темы - пользуйтесь СИСТЕМОЙ ПОИСКА


Стоимость дипломной работы


Home Материалы для работы Інтелектуальний аналіз даних

Інтелектуальний аналіз даних
загрузка...
Рейтинг пользователей: / 0
ХудшийЛучший 

Інтелектуальний аналіз даних


Інтелектуальний аналіз даних (ІАД) звичайно визначають як метод підтримки прийняття рішень, заснований на аналізі залежностей між даними. В рамках такого загального формулювання звичайний аналіз звітів, побудованих по базі даних, також може розглядатися як різновид ІАД. Щоб перейти до розгляду більш розвинутих технологій ІАД, подивимося, як можна автоматизувати пошук залежності між даними.
Існує два підходи. В першому випадку користувач сам висуває гіпотези щодо залежності між даними. Фактично традиційні технології аналізу розвивали саме цей підхід. Дійсно, гіпотеза приводила до побудови звіту, аналіз звіту - до висунення нової гіпотези і т.д. Це справедливо і у тому випадку, коли користувач застосовує такі розвинуті засоби, як OLAP, оскільки процес пошуку як і раніше повністю контролюється людиною. В багато яких системах ІАД це автоматизована перевірка достовірності гіпотез, що дозволяє оцінити вірогідність тієї або іншої залежності в базі даних. Типовим прикладом може служити, такий висновок: вірогідність того, що зростання продажу продукту А обумовлений зростанням продажу продукту В, складає 0,75.
Другий підхід ґрунтується на тому, що залежність між даними відшукується автоматично. Кількість програмних продуктів, що виконують автоматизований пошук залежності, свідчить про інтерес виробників і споживачів до систем саме такого типу. Існують приклади про різке зростання прибутків клієнтів за рахунок вірно знайденої, наперед невідомої залежності.
Процеси ІАД підрозділяються на три великі групи: пошук залежності (discovery), прогнозування (predictive modelling) і аналіз аномалій (forensic analysis). Пошук залежності полягає в прогляданні бази даних з метою автоматичного виявлення залежності. Проблема тут полягає у відборі дійсно важливої залежності з величезного числа існуючих в БД. Прогнозування припускає, що користувач може дати системі запис з незаповненими полями і запитати бракуючі значення. Система сама аналізує вміст бази і робить правдоподібний прогноз щодо цих значень. Аналіз аномалій - це процес пошуку підозрілих даних, що сильно відхиляються від стійкої залежності. В системах ІАД застосовується надзвичайно широкий спектр математичних, логічних і статистичних методів: від аналізу дерев рішень (Business Objects) до нейроних мереж (NeoVista). Поки важко говорити про перспективність або перевагу тих або інших методів. Технологія ІАД зараз знаходиться на початку масованого використання і природно, що практичного матеріалу для обґрунтованих рекомендацій або узагальнень явно недостатньо.
Необхідно також згадати про інтеграцію ІАД в інформаційні системи. Багато які методи ІАД виникли із задач експертного аналізу, тому вхідними даними для них традиційно служать "плоскі" файли даних. При використовуванні ІАД в СППР часто доводиться спочатку витягувати дані зі Сховища, перетворювати їх у файли потрібних форматів і тільки потім переходити власне до інтелектуального аналізу. Потім результати аналізу вимагається сформулювати в термінах бізнес-понять. Важливий крок в цьому напрямку зробила компанія Information Discovery, що розробила системи OLAP Discovery System і OLAP Affinity System, призначені спеціально для інтелектуального аналізу багатовимірних агрегованих даних.
Створення СППР на основі сховищ даних - складний, але осяжний процес, що вимагає знання бізнесу, програмно-технічного інструментарію і досвіду виконання глобальних проектів. Разом з тим упровадження подібних систем може дати переваги в бізнесі, які будуть тим значніше, чим раніше організація почне створення СППР. За прогнозами консалтингової фірми Gartner Group, до 2010 року приблизно 90-95% компаній будуть використовувати сховища даних.
Значущість інформаційних систем подібного рівня признається і представниками більшості українських компаній. Проте через низку обставин, ініціативні або замовлені роботи ведуться часто достатньо безсистемно, в основному в двох напрямах:
- закупівля і тестування різноманітних продуктів, вживаних при створенні СППР і СД (на жаль, більшість з них погано сполучаються один з одним, через що створюється помилкове враження "непід'ємності" проблеми);
- рішення питання про підвищення продуктивності звітних систем шляхом перепроектування структури зберігання або переходу на більш сучасні і складні програмні засоби.


 
загрузка...

Добавить комментарий


Защитный код
Обновить