Для поиска темы - пользуйтесь СИСТЕМОЙ ПОИСКА


Стоимость дипломной работы


Home Материалы для работы Етапи створення і зниження ризиків проектів Data Mining

Етапи створення і зниження ризиків проектів Data Mining
загрузка...
Рейтинг пользователей: / 0
ХудшийЛучший 

Етапи створення і зниження ризиків проектів Data Mining

Упровадження будь-якої нової інформаційної технології завжди супроводиться ризиками. Це справедливо і до проектів на основі технологій Data Mining. Більш того, відносно висока вартість програмних продуктів для створення аналітичних рішень з використанням Data Mining (порівняно з вартістю інформаційних системам для обліку і автоматизації діяльності компанії) дозволяє говорити про велику важливість зниження ризиків.
Для зниження ризиків впровадження аналітичної системи доцільно почати з пробного, або пілотного проекту. Реалізація пілотного проекту дозволить з'ясувати, чи достатньо того об'єму і якості даних, які є в наявності, оцінити продуктивність, кваліфікацію персоналу і інші чинники.
Результати проектів Data Mining великою мірою залежать від рівня підготовки даних, а не від можливостей того або іншого алгоритму пошуку закономірностей. За оцінками експертів, близько 75% роботи над проектами Data Mining полягає в зборі даних, який виконується ще до того, як запускаються самі інструменти. Будь-який проект починається із створення сховища даних, що включає наступні кроки.
1. Розробка структури сховища даних – вибір вимірювань і фактів в розрізі необхідних для багатовимірної Olap-звітності бізнес-процесів (продажу, надходження, оплата і т.п.).
2. Настройка механізмів взаємодії і сполучення сховища даних із зовнішніми джерелами імпорту. Це включає такі процеси, як узгодження форматів обміну даними, питання попередньої обробки і очищення даних, планування розкладу завантаження даних у сховище (як правило, завантаження виконується вночі). Доцільно провести тестове наповнення сховища даними за невеликий період (місяць, квартал). Це дозволить локалізувати можливі помилки і недоробки в структурі сховища.
3. Первинне наповнення сховища даних. Даний процес може зайняти значну кількість часу, від декількох годин до декількох днів. З цієї причини для створення аналітичної системи украй бажано мати окремий високопродуктивний сервер.
Варто відзначити, що сховище даних може згодом перебудовуватися, оскільки на початковому етапі неможливо до кінця зрозуміти необхідну структуру. Трудомісткість операції перезавантаження сховища даних залежить від гнучкості архітектури конкретних програмних продуктів.
Сховище даних повинне створюватися під конкретні задачі. Наприклад, задача створення консолідованої Olap-звітності, прогнозування об'ємів і сум майбутніх продажів. Тоді в сховищі повинна міститися інформація, необхідна і достатня для вирішення даної задачі. З цим зв'язана найбільш поширена помилка при створенні сховища даних – спроба перенесення в нього всієї інформації, що міститься в обліковій системі. В результаті сховище «роздувається» до величезних розмірів і перетворюється на «звалище» інформації. Для того щоб уникнути такої помилки, слід дотримуватися двох головних принципів:
1. Сховище даних направлено на консолідацію інформації для аналізу і прийняття рішень в середньострокових і довгострокових перспективах. Це означає, що в більшості випадків немає значення зберігати дані, наприклад по відвантаженню, за кожний день, а заздалегідь групувати їх по тижнях, по місяцях. Це дозволить скоротити об'єм сховища даних у декілька разів і збільшити швидкість доступу до даних з нього.
2. Аналітична система не замінює, а доповнює існуючі на підприємстві облікові і інші Erp-подібні системи. Тому покладати на аналітичну систему функції оперативного аналізу безглуздо, оскільки в ній відсутні або слабо розвинуті необхідні для цього інструменти.
 Тільки після того, як сховище даних створено і заповнено, побудовані механізми його регулярного поповнення, сформована Olap-звітність, можна приступати до рішення задач прогнозування продажу і управління знаннями.


 
загрузка...

Добавить комментарий


Защитный код
Обновить