Для поиска темы - пользуйтесь СИСТЕМОЙ ПОИСКА


Стоимость дипломной работы


Home Материалы для работы Основні підходи щодо пошуку кращого рівняння регресії

Основні підходи щодо пошуку кращого рівняння регресії
загрузка...
Рейтинг пользователей: / 0
ХудшийЛучший 

Основні підходи щодо пошуку кращого рівняння регресії

У разі наявності декількох чинників, можна отримано декілька різноманітних рівнянь. Задача дослідника - відшукати краще з цих рівнянь. Процедури пошуку кращої моделі досить різноманітні і пов'язані з великою кількістю розрахунків. У значній мірі складнощі об’єктивні і  залежать від кількості чинників, вплив яких на відгук необхідно дослідити. Будь-який метод пошуку кращої моделі виглядає як комплекс порівнянь з метою вибору корисних чинників. Наведемо декілька способів і алгоритмів вибору якнайкращого рівняння регресії [11]:
1. Метод всіх можливих регресій.
2. Метод вибору «якнайкращої підмножини» предикторів.
3. Метод виключення.
4. Кроковий регресійний метод.
5. Гребенева (рідж) регресія.
6. ПРЕС.
7. Регресія на головних компонентах.
8. Регресія на власних значеннях.
9. Східчастий регресійний метод.
10. Робостна (стійка) регресія
Н. Дрейпер і Г. Сміт підкреслюють: "Нет метода, который был бы всегда лучше всех остальнцх ... Необхрдимо постоянно иметь в виду, что если данные беспорядочны, а не получены с помощью експериментов, котрые специально спланировали, любая модель отражает ограниченгия, которые витікають с структуры данных и практических ограничений задачи" [3, кн. 2].
Звичайно, жоден з методів не може компенсувати здоровий глузд і життєвий досвід людини. Проте, метод виключення і кроковий метод вважаються найбільш ефективними у разі використання ЕОМ .
Метод виключення досліджує не всі, а тільки кращі регресійні рівняння, в чому і полягає його економічність. На першому етапі розраховується рівняння, що включає всі незалежні змінні. Потім, розглядають кореляційну матрицю, знаходять в ній незалежну змінну, що має найслабкіший (по модулю) зв'язок із залежною, (тобто з якнайменшим по модулю значенням коефіцієнта кореляції), і виключають її з рівняння. Знову перераховують рівняння з меншим числом незалежних змінних. Якщо в порівнянні з попереднім розрахунком значущість рівняння в цілому (Fр) і коефіцієнт детермінації (R2) підвищилися, то виключення зроблено вірно. Далі відшукують в кореляційній матриці наступну незалежну змінну з якнайменшим значенням коефіцієнта кореляції і роблять теж саме. Виключення незалежних змінних (по одній) і перерахунки рівнянь продовжують доти доки не знайдуть зниження значущості рівняння і частки поясненої варіації (R2) в порівнянні із останнім попереднім розрахунком. Це свідчить про те, що останнє виключення було недоцільним.
Метод виключення - "цілком задовільна процедура, особливо для статистиків, які бажають спостерігати всі змінні в рівнянні ( щоб "чогось не втратити"). Цей метод значно більш економічний за витратами  машинного часу і праці, ніж метод усіх регресій.  Метод виключення починається з найбільш повного рівняння, що включає всі змінні, і полягає в послідовному зменшенні числа змінних доти, поки не приймається рішення відносно використання рівняння з членами, що залишилися.
Кроковий метод - це спроба прийти до таких же результатів, діючи в протилежному напрямку, починаючи з однофакторної моделі. При цьому, як і в попередньому методі, експерти обов'язково орієнтуються на дані кореляційної матриці. Тобто, при кроковому методі на першому кроці розрахунку в рівняння включають не всі а лише один чинник з найбільшим по модулю значенням коефіцієнта кореляції між незалежною і залежною змінною. На кожному наступному кроці з тих, що залишилися не включеними в рівняння незалежних змінних в попередню модель додають тільки одну незалежну змінну, найбільш пов'язану із залежною, і знову перераховують всі параметри регресії. Після перерахунку порівнюють отримані оцінки нового рівняння з оцінками попереднього кроку. Так продовжують доти доки не отримають якнайкраще рівняння з найбільшими розрахунковими значеннями F і R2.
Кроковий метод є спробою прийти до тих же результатів, діючи у зворотному напрямі, тобто включаючи змінні по черзі в рівняння до тих пір, поки рівняння не стане задовільним. Порядок включення визначається за допомогою приватного коефіцієнта кореляції як заходи важливості змінних, котрі ще не включені в рівняння. Цей метод справедливо вважається одним з кращих серед тих, що обговорювалися вище і може бути рекомендованим для практичного користування. Він найбільш економічний при обробці даних на ЕОМ. Проте, кроковий метод може легко стати тягарем для професійного статистика, що має справу з складними моделями. Застосування цього методу для автоматичного вибору найкращого рівняння за допомогою ЕОМ буде дуже скрутним.
Додавання або виключення чинників поодинці в кожному з наведених методів дозволяють помітити і виділити роль кожного окремого чинника в регресійній моделі. Якщо цей принцип не дотримується, тобто чинники виключаються (при методі виключення) або додаються (при кроковому методі) у кількості двох або більше, то найкращу модель відшукати все ж таки можна, але тоді важко зрозуміти, який же саме чинник найбільш істотно змінює (поліпшує або погіршує) статистичну значущість рівняння. При управлінні агросистемами цього досить, оскільки моделі, що тут застосовуються призначені щоб управляти залежним показником (врожаєм), через вплив найістотнішого або найістотніших чинників, тобто цілеспрямовано, змінюючи значення чинника для отримання бажаного відгуку.
Зауважимо, що в описаних вище правилах виконання регресійних обчислень експерт, щоб успішно діяти, повинен заздалегідь обрати конкретний метод. При цьому, хоча комп'ютерна підтримка обчислень кореляційної матриці, а також параметрів регресійного рівняння значна,  на частку експерта припадає значна частина інтелектуальної праці - він направляє кожний наступний крок розрахунків, прагнучи при цьому знайти якісну модель при якнайменших витратах часу. Знаючи алгоритм, властивий обраному методу, експерт повинен якось (вручну або за допомогою допоміжних електронних таблиць) наочно організувати найважливіші розрахункові дані, необхідні для ухвалення рішення (про включення або виключення чинника). Ця обставина грає важливу роль при порівнянні різних програмних інструментів кореляційно-регресійного аналізу.
При підтримці множинного регресійного аналізу засобами Excel можна відстежувати черговість дослідницьких кроків, якщо записувати для кожного кроку його номер, набір незалежних змінних, вид рівняння, головні дані за якими робиться оцінка: коефіцієнти Фішера (Fр -розрахунковий і Fк -критичний) і коефіцієнт детерміації -R2. Прцедури щодо послідовності кроків, в учбовому процесі зручно використовувати, якщо спиратись на робочі таблиці (табл.1.1). Наведемо одну з можливих форм допоміжної таблиці [11].

                                                                                                       Таблиця 1.1
Фрагмент форми  представлення результатів множинного регресійного аналізу  [11]
Крок Фактори Незалежні змінні
 Вигляд моделі Fp Fk R2 Висновок щодо фактору впливу
1 2 3 4 5 6 7 8

Зауважимо, що для простої регресії, тобто при одній незалежній змінній, така таблиця практично не потрібна. Зону граф 5-7 можна розширити, збільшуючи кількість критеріїв перевірки значущості чинників (наприклад, за рахунок t-крітерія). Якщо загальний F-критерий дає можливість оцінювати значущість рівняння в цілому, то t-критерий (t-статистика) дозволяє оцінити індивідуальний внесок окремого параметра в значущість рівняння.
Стосовно використання t-статистик дамо такі зауваження. Обізнаність з правилами використання  t-статистик можна вважати одним із  не обов’язкових, але потрібних заходів підвищення ефективності пошуку більш коректного рівняння і контролю процесу виключення незалежної змінної з рівняння. В деяких регресійних програмах, що базуються на методі виключення, може використовуватися не t-критерий, а приватний F-критерій. F=t2 , тобто є квадратним коренем з величини приватного F-критерія. Таким чином, вираз t2  надає змогу отримати  приватні значення F для окремих параметрів рівняння і перевірити рішення щодо виключення не корисної змінної.
Процедура використання t-статистики полягає у виборі критичного значення t з таблиці значень Ст’юдента. Критичне значення t вибирається з цієї таблиці і порівнюється з розрахунковим.
Зауважимо, що t-статистика розроблена для малих вибірок, тобто вибірок, що складаються з порівняно невеликої кількості спостережень (10-20 одиниць даних). При цьому розподіл Ст’юдента схожий на нормальний розподіл і відмінність практично непомітна у разі якщо n більша за 30.
Перш ніж перейти до прикладних аспектів використання методу, зробимо підсумовуючі зауваження.
Із значної кількості методів пошуку найкращого рівняння регресії у практичному використання  за допомогою ЕОМ можна виділити за ознакою придатності для учбового процесу лише два: метод виключення і кроковий регресійний метод.
За наявності Excel кожний з цих методів можна застосовувати на свій розсуд. Однак як показує практика краще всього працювати із якимось одним методом і досконало оволодіти його специфічними особливостями [3, кн. 2].
При цьому такий підхід дає можливість зберігати повний контроль за виконанням розрахунків і організовувати їх за власним задумом, ретельно оцінюючи результати за формальними критеріями (як це роблять математики), а також з погляду здорового глузду (як це постійно роблять фахівці в сфері своїх областей знань -  агрономії, економіці і інш.). Такий підхід до застосування складних методів і їх комп'ютерних інструментів відповідає сучасному рівню технологій кінцевого користувача [11,12].
В аграрній сфері досліджень і управління широко застосовуються регресійні моделі як однофакторні, так і багатофакторні.
 Кореляційно-регресійний аналіз вважається одним з головних методів в процедурах прийняття рішень, разом з оптимізаційними розрахунками, а також математичним і графічним моделюванням  тенденцій.


 
загрузка...

Добавить комментарий


Защитный код
Обновить