Для поиска темы - пользуйтесь СИСТЕМОЙ ПОИСКА


Стоимость дипломной работы


Home Материалы для работы Збір і систематизація даних

Збір і систематизація даних
загрузка...
Рейтинг пользователей: / 0
ХудшийЛучший 

Збір і систематизація даних

Одна з необхідних дій на цьому кроці - завдання способу представлення даних. Як правило, вибирають один з 4-х видів – число, рядок, дата, логічна змінна (да/ні). Визначити спосіб уявлення, тобто формалізувати деякі дані просто – наприклад, об'єм продажу в гривнях, - це певне число. Але досить часто виникають ситуація, коли незрозуміло як представити чинник. Частіше всього такі проблеми виникають з якісними характеристиками. Наприклад, на об'єми продажу впливає якість товару. Якість – це досить складне поняття, але якщо цей показник дійсно важливий, то потрібно придумати спосіб його формалізації. Наприклад, визначати якість по кількості браку на тисячу одиниць продукції, або експертно оцінити, розбивши на декілька категорій - відмінно/добре/задовіль-но/незадовільно.
Далі, необхідно оцінити вартість збору потрібних для аналізу даних. Річ у тому, що деякі дані легко доступні, наприклад, їх можна витягнути з існуючих інформаційних систем. Але є інформація, яку не просто зібрати, наприклад, відомості про конкурентів.
Тому необхідно оцінити, в що обійдеться збір даних. Чим більше буде даних для аналізу, тим краще, відкинути їх можна на наступних етапах   робіт – це легше, ніж зібрати нові відомості.
Проте збір даних не є самоцілю. Якщо інформацію отримати легко, то, природно, слід її зібрати. Якщо дані отримати складно, то необхідно порахувати витрати на її збір і систематизацію з очікуваними результатами.
Є декілька методів збору, необхідних для аналізу даних:
1. Отримання з облікових систем. Звичайно, в облікових системах є різні механізми побудови звітів і експорту даних, тому витягання потрібної інформації, частіше всього, відносно нескладна операція.
2. Отримання відомостей з непрямих даних. Про багато які показники можна судити по непрямих ознаках і цим потрібно скористатися. Наприклад, можна оцінити реальне фінансове положення жителів певного регіону таким чином. В більшості випадків є декілька товарів, призначених для виконання однієї і тієї ж функції, але відмінних за ціною: товари для бідних, середніх і багатих. Якщо отримати звіт про продаж товару в регіон, що цікавить, і проаналізувати пропорції, в яких продаються товари для бідних, середніх і багатих, то можна припустити, що чим більше частка дорогих виробів з однієї товарної групи, тим більш спроможні у середньому жителі даного регіону.
3. Використання відкритих джерел. Велика кількість даних присутня у відкритих джерелах, таких як статистичні збірки, звіти корпорацій, опубліковані результати марке-тингових досліджень і інше.
4. Проведення власних маркетингових досліджень і аналогічних заходів щодо збору даних. Це може бути достатньо дорогим заходом, але, у будь-якому випадку, такий варіант збору даних можливий.
5. Введення даних «вручну», коли дані заносяться по різного роду експертним оцінкам співробітниками організації. Цей найбільш трудомісткий метод.
Вартість збору інформації різними методами істотно відрізняється за ціною і необхідним для цього часом, тому потрібно прорахувати витрати з результатами. Можливо, від збору деяких даних доведеться відмовитися, але чинники, які експерти оцінили як найбільш значні слід зібрати обов'язково, не дивлячись на вартість цих робіт, або взагалі відмовитися від аналізу. Модель, що не враховує значущі чинники, не представляє практичної цінності.
Зібрані дані потрібно перетворити до єдиного формату, наприклад, Excel, текстовий файл з роздільниками, або будь-яка СУБД. Дані обов'язково повинні бути уніфіковані, одна і та ж інформація скрізь повинна описуватися однаково. Звичайно проблеми з уніфікацією виникають при зборі інформації з різнорідних джерел.
Дуже часто в аналітичних додатках направляють зусилля на механізми аналізу даних, не надаючи належної уваги задачам обробки і очищення даних. Хоча саме погана якість початкових даних є однією з найсерйозніших і поширених проблем. Очевидно, що некоректні початкові дані приводять до некоректних висновків. Оскільки у зв'язку з тим, що в більшості випадків джерелом інформації для аналітичних систем є сховище даних, в якому акумулюються відомості з безлічі різнорідних джерел, гострота проблеми істотно зростає.
Для аналізованих процесів різної природи дані повинні бути підготовлені спеціальним чином. Зупинимося докладніше на двох типах даних: впорядкованих і неврегульованих.


 
загрузка...

Добавить комментарий


Защитный код
Обновить