Предмет:
Тип роботи:
Курс лекцій
К-сть сторінок:
56
Мова:
Українська
style="text-align: justify;"> а) замість самих даних узяти їхні відхилення від середніх;
б) замість абсолютних значень даних взяти відносні значення ;
в) стандартизувати змінні.
5. Використання додаткової первинної інформації. Аналіз і використання первинної додаткової інформації інколи дозволяє зняти проблему мультиколінеарності.
Тема 4. Узагальнений метод найменших квадратів
Узагальнений метод найменших квадратів (УНК) враховує інформацію про неоднаковість дисперсії. Щоб проілюструвати це, розглянемо модель лінійної регресії:
Y=ХA+u. (4.1)
деА – параметри (вектор) економетричної моделі;
Y – залежна змінна;
Х – незалежна змінна;
u – випадковий член.
Задача полягає в знаходженні оцінок елементів вектора A в моделі. Для цього використовується матриця S, за допомогою якої коригується вхідна інформація.
Оскільки S - додатно визначена матриця, то вона може бути зображена як добуток РРТ, де матриця Р є невиродженою, тобто:
S=РРТ, (4.2)
коли
P-1S(P-1)Т=E, (4.3)
((P-1)Т)-1=S-1, (4.4)
Помноживши рівняння (4.1) ліворуч на матрицю Р-1, дістанемо:
P-1Y=P-1 XA+ P-1u. (4.5)
Позначимо У* = P-1У; X*= P-1X, u*= P-1u
Тоді модель матиме вигляд:
Y*=Х*A+u*. (4.6)
Використовуючи модель (4.6), неважко показати, що M(u*u*T)= 2E, тобто модель (4.6) задовольняє умові, коли параметри моделі можна оцінити на основі МНК, яка може бути виражена:
=(X*’X*)-1X*’Y*=(X’S-1X)-1X’S-1Y. (4.7)
Ця оцінка є незміщеною лінійною оцінкою вектора A, який має найменшу дисперсію і матрицю коваріацій:
var ( )=u2(X*ТX*)-1=u2(XТS-1X)-1. (4.8)
Незміщену оцінку для дисперсії 2 можна знайти так:
(Y*-X* )T(Y*-X* )/(n-k-1)=(Y-X )TS-1(Y-X )/(n-k-1)= uTS-1u /(n-k-1). (4.9)
При заданій матриці S оцінку параметрів моделі можна обчислити згідно із моделлю (4.7), а стандартну помилку - згідно з (4.8). Тому можна сконструювати звичайні критерії значущості і довірчі інтервали для параметрів a.
Визначивши залишки u = Y – Х і помноживши ліворуч на матрицю P-1, отримаємо:
P-1Y- P-1X = P-1u; або u *=Y*-X*
Звідси Y* = Х*A + u *.
Тоді Y*TY*=(X* +u*)’(X* +u*).
Оскільки =(X*TX*)-1X*’Y* =(XTS-1X)-1XTS-1Y, то
YTS-1Y= TXTS-1Y+uS-1u. (4.10)
Отже, ми розбили загальну суму квадратів для Y* на суму квадратів регресії і залишкову. Згідно з цими даними дисперсійний аналіз буде виконаний для перетворених вхідних даних. Крім того, коли незалежна змінна Y* виміряна відносно початку відліку, а не у формі відхилення від середньої, то необхідно визначити її середнє значення і скористатись ним для корекції загальної суми квадратів і суми квадратів регресії.
Щоб оцінити параметри моделі, коли дисперсії залишків визначаються М(ии') = 2uS, потрібно визначити матрицю S. Спинимось на визначенні матриці S.
Оскільки явище гетероскедастичності пов'язане лише з тим, що змінюються дисперсії залишків, а коваріація між ними відсутня, то матриця S має бути діагональною, а саме:
Щоб пояснити, чому саме такий вигляд має ця матриця, потрібно визначити: за наявності гетероскедастичності для певних вихідних даних одна (або кілька) пояснювальних змінних можуть різко змінюватись від одного спостереження до іншого, тоді як залежна змінна має такі самі коливання, як і для попередніх спостережень.
Але це означає, що дисперсія залишків, яка змінюватиметься від одного спостереження до іншого (чи для групи спостережень), може бути пропорційною до величини пояснювальної змінної Х (або до її квадрата), яка зумовлює гетероскедастичність, або пропорційною до квадрата залишків.
Звідси в матриці S значення i можна обчислити, користуючись гіпотезами:
1.M(uu’)= 2u xij, тобто дисперсія залишків пропорційна до зміни пояснюючої змінної xij;
2.M(uu’)= 2u x2ij, тобто зміна дисперсії пропорційна до зміни квадрата пояснюючої змінної x2ij;
3.M (uu') = 2u {IuI}2, тобто дисперсія залишків пропорційна до зміни квадрата залишків за модулем.
Для першої гіпотези: i=1/ xij
Для другої гіпотези: i=1/ x2ij
Для третьої гіпотези: i ={IuiI}2, або i = (a0-a1xij)2, або i=(a0-a1xi -1)2
Оскільки матриця S— симетрична і додатно визначена, то при S = Р'Р, матриця Р має вигляд: