Ekonometria |
Opracowania ! Przykład modelu ekonometrycznego |
|
|
|

Przedmiotem Ekonometrii jest statystyczne badanie ilościowych prawidłowości ekonomicznych. Ekonomista chcąc wpływać na kształtowanie się zjawisk gospodarczych, przewidywać je i kontrolować zmuszony jest badać poznawać te zjawiska. W odkrywaniu i formułowaniu ilościowych praw ekonomicznych zasadniczą rolę odgrywa badanie statystycznych prawidłowości w kształtowaniu się procesu gospodarczego. Ekonometria wywodzi się z połączenia trzech podstawowych nauk; matematyki, statystyki i ekonomii. Z połączenia Matematyki i statystyki powstała Statystyka Matematyczna, a z połączenia Statystyki i Ekonomi - Statystyka ekonomiczna. Wspólne zainteresowania Matematyki i Ekonomi utworzyły Ekonomię matematyczną, wspólne zainteresowania zaś Ekonomii, Matematyki i Statystyki są podstawą rozwoju nauki zwanej Ekonometrią.

Prognozowanie ekonometryczne jest funkcją materiału empirycznego i ma charakter ekstrapolacyjny. Zależności przewidywania ekonometrycznego od materiału empirycznego objawia się tym, że podstawą wnioskowania w przyszłość jest obserwacja zmiennych ekonomicznych w przeszłości, Wykryte w trakcie analizy danych statystycznych z przeszłości prawidłowości i powiązania między zmiennymi są z kolei podstawą do zbudowania modelu ekonometrycznego. Niektóre modele ekonometryczne wskazują, w jaki sposób jedne wielkości ekonomiczne zależą od pewnych wielkości i odzwierciedlają powiązania o charakterze przyczynowo - skutkowym między zmiennymi. Jeżeli zjawisko ekonomiczne rozwijało się w przeszłości wskutek pewnego układu zmiennych objaśniających, jak to wskazuje model, to przewidywanie rozwoju tego zjawiska w przyszłości następuje przy założeniu, że zespół wspomnianych czynników nie ulegnie większym zmianom. Przenoszenie w przyszłość przedstawionych modelowo powiązań ilościowych jest możliwe pod warunkiem przyjęcia potwierdzonych przez rzeczywistość założeń co do warunków panujący w okresie prognozowanym. Prognozowanie ekonometryczne jest szczególnym przypadkiem prognozowania w ogóle.
Por.; (schemat) J. Hozer, Zawadzki, Ekonometria stosowana, Politechnika Szczecińska, 1985, także Piszczała J. Matematyka i jej zastosowanie w naukach ekonomicznych, Akademia Eekonomiczna, Poznań 1999, s.100-120.
Zasadniczym narzędziem badawczym Ekonometrii jest model ekonometryczny, który ma stochastyczny charakter, przejawiający występowaniem składnika losowego. Ze względu na to należy wymienić warunki w jakich metody ekonometryczne mogą być stosowane:
Ekonometryczne modele odnoszą się zawsze do konkretnej praktyki gospodarczej, w której zmieniają się warunki działania, zakresy kompetencji, cele działania. Model ekonometryczny stanowi matematyczną formę zapisu zależności między badanymi zjawiskami ekonomicznymi a innymi zjawiskami tak i ekonomicznymi jak i pozaekonomicznymi. Ujmuje on te związki, które są trwałe i istotne. Istotnym problemem przy badaniu prawidłowości w zakresie współzależności zjawisk jest rozstrzygnięcie, jakie własności posiada zbiór zmiennych objaśniających i czy jest to zbiór zmiennych losowych, czy też nielosowych.
Ekonometryczne modele opisowe odpowiednio od rodzaju prawidłowości statystycznych możemy podzielić na trzy grupy:
Modele przyczynowo opisowe to takie, których zmienne endogeniczne odgrywają rolę skutkowa zmienne objaśniające rolę przyczyn, ale de facto nie zawsze nimi są. badając efektywność zasobów porównujemy kształtowanie się poziomu produkcji z zasobami jednak poziom zasobów nie stanowi przyczyny takiego a nie innego kształtowania się produkcji. zasoby te są składnikiem koniecznym, ale nie wystarczającym dla poziomu produkcji. Modele przyczynowo-opisowe dzielą się na modele:
Innym kryterium podziału modeli ekonometrycznych jest kryterium czasu. Ze względu na nie wyróżniamy modele:
Modele ekonometryczne ze względu na postaci związków prezentowanych przez model:
Modele tendencji rozwojowej są to modele budowane dla danych w postaci szeregów czasowych; rocznych, kwartalnych, miesięcznych, dekadowych itp. Modele tendencji rozwojowej możemy podzielić na modele trendu i modele wahań oraz na modele ciągłe i skokowe
Modele struktury są t modele opisujące rozkład badanej cechy.
Etapy procesu ekonometrycznego modelowania
Wyłączając cele dydaktyczne i badania naukowe na rzecz rozwoju metodologii, modele ekonometryczne w zakresie ekonometrii stosowanej możemy budować w celu:
W przypadku jakichkolwiek pytań proszę o kontakt. Jeśli będę znał tylko odpowiedź na pewno natychmiast ją otrzymacie. Natomiast jeśli pytanie miałoby zmusić mnie do pogłębienia wiedzy, na odpowiedź będziecie musieli nieco poczekać, ale takie pytanie bardziej mnie być może ucieszy.
W pracy niniejszej podjęty został problem budowy opisowego modelu ekonometrycznego. Modele ekonometryczne, budowane dla potrzeb gospodarki muszą cechować się dużą dokładnością i poprawnością, aby na ich podstawie dokonywać podstawowych prognoz. Prognoza nie jest zadaniem modelu opisowego, jednakże poprawnie skonstruowany model opisowy ma zawsze pewne własności prognostyczne. Chcąc oszacować relacje pomiędzy różnymi procesami gospodarczymi należy odwołać się do dokładnych danych statystycznych zbieranych przez wojewódzkie urzędy statystyczne. Oszacowany w tej pracy model ekonometryczny poziomu skupowanego żywca rzeźnego w przeliczeniu na mięso (w tys. ton), łącznie z tłuszczami, zostaw dokonany na podstawie danych rocznikowych z lat 1990-1999. Zmiennym-kandydatkami do modelu są:
Doboru zmiennych kandydatek dokonano z założeniem zależności ze zmienną objaśnianą.
Chcąc zbadać zależność np. spożycia mięsa na osobę i ilości skupowanego mięsa można to zrobić prostym modelem regresji liniowej z jedną zmienną i dwoma parametrami (w tym jednym stałym). Natomiast badanie zależności wielorakich jest bardziej skomplikowane i składa się na większą ilość operacji arytmetycznych, aby określić oceny numeryczne parametrów równania 1.0
Zbudowany model określający kształtowanie się badanej zmiennej endogenicznej nie jest
jedynym równaniem, które może zostać skonstruowane. Określa ono bowiem
tylko zależności pomiędzy zmiennymi niezależnymi, a zmienną objaśnianą.
Należy zatem zaznaczyć, że można dokonać konstrukcji kolejnych modeli z
uwzględnieniem innych zmiennych niezależnych, należy pamiętać, aby zmienne
te miały ze sobą udokumentowany wcześniej związek, wiadomy z doświadczenia.
Można także odkryć nowy związek pomiędzy różnymi zmiennymi, ale trzeba
zachować ostrożność w badaniu bowiem teoretycznie jeśli istnieje związek
pomiędzy np. wzrostem bezrobocia, a spadkiem ilości pożarów nie można
twierdzić, że spadek ilości pożarów zawdzięczamy wzrostowi bezrobocia.
Znaczy to tyle, że pierwsza zmienna nie implikuje wartości drugiej zmiennej.
Ogólna postać modelu badającego zależności liniowe dana jest wzorem:
1.0 Y=a1X1+a2X2+a3X3+,...,akXk,
gdzie:
a - parametr przy danej zmiennej,
k - numer parametru przy zmiennej,
n - ilość obserwacji.
Poza tym dobierając zmienne do modelu należy zweryfikować ich poprawność pod względem takich cech, jak: dostatecznie duża zmienność, rodzaj i poziom istniejących związków pomiędzy zmiennymi.
| X1 - | 0,182893 | X5 - | 0,136162 |
| X2 - | 0,044735 | X6 - | 0,452139 |
| X3 - | 0,33899 | X7 - | 0,045641 |
| X4 - | 0,134018 | X8 - | 0,299807 |
Należy
założyć określony poziom krytyczny zmienności dla danej zmiennej, który
powinien być podyktowany także znajomością kształtowania się zmienności
zmiennej we wcześniejszych okresach, lub , jak w tym przypadku w innych państwach.
Jeśli bowiem poziom zmienności nakładów inwestycyjnych w rolnictwie ma
poziom vs=0,06 nie można stwierdzić natychmiast, że ten poziom dyskwalifikuje
zmienną ponieważ obserwowane nakłady na inwestycje w innych krajach na przełomie
wielu lat nigdy nie wykazywały większej zmienności aniżeli vs=0,08. Określenie
prawidłowego poziomu krytycznego vs dla każdej zmiennej (dany wzorem 1.1)
nastręcza zatem wiele trudności.
1.1
vs=Sei/średnia
arytmetyczna zmienneji,
gdzie:
Se -odchylenie standardowe zmiennej z numerem i,
i - numer zmiennej i=1,2,3,...,k.
Dla potrzeb modelu zostanie zbadany poziom zmienności wszystkich zmiennych lecz zmienne nie zostaną zweryfikowane w oparciu o jego poziom. Wszystkie zmienne zostaną zakwalifikowane do dalszego etapu modelowania. Dysponując danymi z tabeli 1.2 określić można na podstawie wzoru 1.1 następujące wartości vs dla wszystkich zmiennych kandydatek
| Średnia | Mediana | Minimum | Maksimum | Rozstęp | Wariancja | Odch.Std | Skośność | Kurtoza | |
| X1 | 4575,60 | 4442,00 | 3556,00 | 6063,00 | 2507,00 | 700313, | 836,847 | 1,010561 | ,18442 |
| X2 | 13,01 | 12,90 | 12,30 | 14,20 | 1,90 | 0,0 | 0,582 | ,929418 | ,46866 |
| X3 | 86,10 | 82,50 | 62,00 | 164,00 | 102,00 | 852,00 | 29,187 | 2,463859 | 6,93501 |
| X4 | 7,79 | 7,45 | 6,60 | 10,00 | 3,40 | 1,00 | 1,044 | 1,264758 | 1,09307 |
| X5 | 82,02 | 80,75 | 65,40 | 100,00 | 34,60 | 125,00 | 11,168 | 0,328777 | -0,85029 |
| X6 | 44,42 | 37,20 | 33,00 | 100,00 | 67,00 | 403,00 | 20,084 | 2,859190 | 8,52658 |
| X7 | 61,59 | 61,55 | 57,40 | 65,90 | 8,50 | 8,00 | 2,811 | 0,009770 | -1,28296 |
| X8 | 20236,85 | 20067,50 | 13186,60 | 28228,90 | 15042,30 | 36810245,00 | 6067,145 | 0,102309 | -2,07332 |
Obniżony poziom zmienności wykazują zmienne X2,X7 przyjmuje się, że ich zmienność w czasie jest na poziomie, który gwarantuje ich poprawność.
Rodzaj i poziom zależności pomiędzy wszystkimi zmiennymi zostanie zmierzony przy pomocy współczynnika korelacji liniowej Pearsona
Wartości r wskazują na silniejszy związek zmiennych niezależnych ze zmienną endogeniczną niż pomiędzy sobą. Jest to jeden z warunków akceptacji zmiennej kandydatki do dalszego etapu modelowania.
Estymacja
parametrów strukturalnych modelu Estymacja parametrów strukturalnych modelu
polega na wyznaczeniu takich ocen numerycznych a1, a2,
a3, ..., ak, parametrów a1, a2, a3, ...,ak, że suma
kwadratów reszt osiąga minimum. Oznacza to, że każda liniowa funkcja o
parametrach innych od oszacowanych dałaby sumę reszt (regresyjnych) większą
od uzyskanej. Warunki wymienione powyżej można zapisać wzorem 1.3.
1.3 Set2=S(Y - Y' ) 2 ťť min ťť 0,
gdzie:
e - odchylenie wartości empirycznych od wartości teoretycznych (reszta),
t - numer okresu.
Przyjmując
za istotny warunek dany wzorem 1.3 oceny numeryczne (wektor a) parametrów równania
wyznaczymy za pomocą następującej zależności:
1.4 [a1,a2,a3 ... ak]=(XX)-1XY,
Kolejno,
więc należy wyznaczyć wszystkie elementy prawej strony równania 1.4.
Wyznaczenie macierzy CROSS (z wyrazem wonym=0).
1.5 =(X'X),
gdzie:
X - macierz obserwacji zmiennych objaśniających.
Wartość
tego równania jest symetryczna macierz iloczynów skalarnych, zwana macierzą CROSS
|
|
|
|
|
|
|
|
Podniesiona do potęgi (-1) macierz CROSS daje macierz odwrotną tej macierzy - 1.7. Obie wartości zostały wyznaczone przy użyciu wyspecjalizowanych programów (MatLabStatistica 5.01) komputerowych, z założeniem wartości wyrazu wolnego = 0.
|
|
|
|
|
|
|
|
Wyznaczenie wektora X'Y;
| X'Y= | =(X'X)-1X'Y= | |
[71232117,84 197963,78 1347370,42 118636,78 1273479,02 694481,52 938676,5 314294767,6] |
a1 a2 a3 a4 a5 a6 a7 a8 |
[-3,0306825 4138,729472 988,545607 -10059,3762 1063,963884 -1555,14564 89,67231758 -3,4243082] |
Wyznaczone
parametry strukturalne modelu pozwalają na zdefiniowanie równania modelu w
sposób następujący:
2.0 Y=-3,03X1+4138,7
X2+988,5X3 -10059,3X4+1063,9X5 -1555,1X6+89,6X7-3,42X8
Szacowanie średnich błędów szacunku polega na wyznaczeniu wartości całkowitej
wariancji resztowej i wyznaczeniu kolejnych pierwiastków kwadratowych z iloczynów
przekątnej macierzy MatrixInverse (1.7) i wartości całkowitej wariancji.
Zapisać to można w postaci wzoru 2.4. Wyznaczenie wartości całkowitej
wariancji składnika losowego polega na wyznaczeniu regresyjnej sumy kwadratów
i podzielenia jej przez różnicę obserwacji i ilości szacowanych parametrów,
co można zapisać wzorem 2.1 lub posługując się bardziej skomplikowaną
notacją macierzową 2.2.
2.1 Se2= S(Y-Y')2 /n-k
2.2 Se2= (Y'Y-Y'X(X'X)-1X'Y) /n-k
| t | Wartości prognozowane Y' |
Wartości empiryczne Y |
Y-Y' | (Y-Y')2 |
|
|
|
|
|
Średnie
błędy szacunku Sak dla wszystkich parametrów w modelu wyznaczamy posługując się wzorem;
2.4 Sa2k=Se2(XX)-1=Sak Wszystkie
wartości średnich błędów szacunku zawarte są w tabeli 1.5.
|
|
Jak widać błędy średnie estymowanych parametrów nie są duże, co jest zadowalającym rezultatem przeprowadzonego modelowania, wnioskować można, że model ma znamiona poprawności.
Weryfikacja modelu ma za zadanie, dzięki dostępnym metodom dać odpowiedź na pytanie czy model jest zbudowany poprawnie. Dokonać można tego sprawdzając istotność statystyczną parametrów modelu oraz stosując miary sprawdzające dopasowanie funkcji do danych empirycznych.
Test t-Studenta Sprawdzając istotność statystyczną (indywidualną) parametrów modelu należy postawić hipotezę zerową, która mówi, że parametr jest statystycznie różny od zera, zatem założyć
jego istotność przeciwko hipotezie alternatywnej, która mówi, że parametr
nie jest istotny statystycznie. Można to zapisać w następujący sposób;
2.7 H0
:ak=0
Wykorzystując statystykę t daną wzorem: 2.8 t= ak/Sak gdzie: k - numer parametru przy zmiennej.
|
|
Dla
n-k=2 stopni swobody przy poziomie p=0,05 (odczytane z tablic rozkładu
t-Studenta ) wartość statystyki t, przy której nie ma podstaw do
odrzucenia hipotezy zerowej to t= 4,303. Analizując wartości t z tabeli 1.6
widać, że dwa parametry nie posiadają indywidualnej istotności statystycznej
lub inaczej mówiąc nie są statystycznie różne od zera. Wynik taki
kwalifikuje model do powtórnego rozpatrzenia.
Test F Snedecora Test F
dany wzorem 3.0 pozwala na weryfikowanie hipotezy dotyczącej wartości
wszystkich składowych wektora a danego wzorami 1.4, 1.9.
3.0 F = M*(k+1)Se2
gdzie:
M dane wzorem;
3.1 M=(a - a0)'X'X(a - a0)
Stawiana jest zatem hipoteza zerowa przeciwko hipotezie alternatywnej dana wzorem 3.2. Wyników testowanie parametrów za pomocą statystyki F nie zostało zamieszczone w powyższszym opracowaniu.
H1 :a0 ą |
|
H1 :a0 ą |
|
Wykorzystując
dostępne miary dopasowania można zbadać, czy dane równanie modelu w sposób
należyty opisuje zmienną objaśnianą. Posługując się wzorem na wskaźnik
zbieżności 2.3 można uzyskać odpowiedź na pytanie w ilu procentach model
nie wyjaśnia kształtowania się danych empirycznych.
3.3 j2=S(Y-Y)2
/S(Y-Y)2
,
gdzie:/
Y -wartości empiryczne skupu żywca rzeźnego w latach 1990-1999,
Y'- wartości szacowane na podstawie modelu,
Y średnia wartość z okresów (wartości empirycznych) t.
Wartość wskaźnika zbieżności dla szacowanego modelu równa
jest:
3.4 j2= 1034187016 = 0,99039 1044222512, - co wskazuje na absolutny brak
dopasowania równania modelu do danych empirycznych. Przy tak wysokim poziomie j2 dalsza weryfikacja modelu nie ma większego znaczenia, gdyż model, który w
ponad 99% nie wyjaśnia zmiennej objaśnianej jest modelem nieprzydatnym.
| "BETA" | Błąd st. "BETA" | "B" | Błąd st. "B" | Poziom "p" | |
|
|
|
|
|
|
Błąd st. BETA-wartość błędu szacunku dla (parametru) współczynnika regresji, gdyby została ona wprowadzona do równania regresji jako zmienna niezależna. B- niestandaryzowany współczynnik regresji, Poziom p- poziom istotności statystycznej dla współczynników regresji. R= 0,99982007-współczynnik korelacji wielorakiej wyjaśnia, w jakim związku pozostaje zmienna objaśniana z pozostałymi zmiennymi (objaśniającymi) w modelu. Poziom współczynnika R wskazuje na to, że kształtowanie się wartości zmiennej objaśnianej podyktowane jest niemalże całkowicie kształtowaniem się wartości zmiennych objaśniających.
R2= ,99948597- współczynniki determinacji, czyli różnica 1-j2 wskazuje na to, że model wyjaśnia kształtowanie się zmiennej objaśnianej w ponad 99%, co jest bardzo zadawalającym wynikiem. Badanie istotności statystycznej parametrów modelu Wynik statystyki F (Snedecora)-patrz strona 13 i 14. df F(3,7)= 164,3882 p<,000001- stopnie swobody i poziom istotności. Parametry modelu są "łącznie" istotne statystycznie przy poziomie istotności p. Wykazują tym samym dużą istotność statystyczną Badanie autokorelacji składnika losowego (reszt) Test Durbina-Watsona służy do testowania hipotezy o występowaniu lub braku autokorelacji składnika losowego, tzn., czy istnieje liniowa zależność pomiędzy odchyleniami losowymi z różnych jednostek czasu. Stawiając hipotezę zerową, mówiącą o niewystępowaniu autokorelacji składnika losowego przeciwko hipotezie alternatywnej, posłużyć się należy statystykami d (3.5)oraz d'(3.6).
3.5 d=S(et-et-1)2/Set2,
3.6 d'=4-d
Wartości d pochodzą z przedziału <0,4>. Dla modelu wartość d=2,816289, co świadczy o występowaniu autokorelacji ujemnej oraz d'=1,19, co potwierdza istnienie autokorelacji składnika losowego, a zarazem, ze względu na wartości graniczne dl=1,48 oraz du=1,96 skłania do odrzucenia hipotezy zerowej mówiącej o braku autokorelacji reszt w modelu. Świadczyć to może, że kolejne wartości zmiennej objaśnianej mogą nie być niezależne od ich wartości je poprzedzających. Dopasowanie rozkładu normalnego do reszt surowych Określenie kształtowania się poziomu reszt jest ważne z powodu tego, że rozkład reszt odbiegający znacznie swym rozkładem od normalnego wskazuje na występowanie wartości ekstremalnych zmiennej objaśnianej, co tłumaczyć można jako zwiększone prawdopodobieństwo występowania wartości nietypowych (losowych ),nieporównywalnie dużych lub małych w stosunku do pozostałych. Większość zjawisk społeczno-gospodarczych ma rozkład normalny, czyli przybiera wartości typowe z określonego przedziału, nie wykraczające poza wartość kilkakrotną odchylenia standardowego, wyznaczonego dla tego zjawiska. Inaczej mówiąc zbiór wartości zmiennej jest stosunkowo stabilny. Dla zmiennej objaśnianej reszty surowe nie wykraczają poza dwukrotną wartość odchylenia standardowego. Czyli dopasowanie funkcji regresji liniowej można uznać za dobre. 1.4 Dopasowanie rozkładu normalnego do reszt surowych (Y-Y').
Tab.1.8 Zawiera wartości empiryczne Y oraz szacowane na podstawie modelu Y'.
| t | Obserwow Wartość | Przew. Wartość | Reszta |
| 1990 | 1778,000 | 1766,053 | 11,9471 |
| 1991 | 1567,800 | 1594,957 | -27,1570 |
| 1992 | 1418,000 | 1359,121 | |
| 1993 | 1257,000 | 1282,430 | -25,4298 |
| 1994 | 1138,000 | 1123,603 | 14,3970 |
| 1995 | 1321,000 | 1358,026 | -37,0264 |
| 1996 | 1421,000 | 1424,466 | -3,4662 |
| 1997 | 1568,000 | 1598,380 | -30,3802 |
| 1998 | 1794,000 | 1793,909 | ,0907 |
| 1999 | 1956,000 | 1923,643 | 32,3572 |
| Minimum | 1138,000 | 1123,603 | -37,0264 |
| Maksimum | 1956,000 | 1923,643 | 58,8789 |
| Średnia | 1521,880 | 1522,459 | -,5789 |
| Mediana | 1494,400 | 1509,712 | -1,6877 |
1.5

Podsumowując model oszacowany za pomocą programu Statistica można powiedzieć, że równanie to należycie opisuje zmienną objaśnianą. Skup żywca rzeźnego opisywany jest trzema zmiennymi objaśniającymi, a mianowicie: zużyciem nawozów sztucznych w przeliczeniu na czysty składnik, na 1 ha użytków rolnych, ilością zwierząt gospodarskich (bydła) oraz indeksem całościowym skupu produktów rolnych. Dysponując wartościami parametrów z tabeli 1.7 można stwierdzić o ile może podnieść się lub spaść ilość skupowanego żywca wraz ze zmianą wartości poszczególnych zmiennych objaśniających. Jeśli zakładamy zmianę wartości jednej zmiennej i niezmienność pozostałych, wówczas należy spodziewać się różnicy wynikającej z wartości standaryzowanego BETA współczynnika regresji liniowej. Jeśli natomiast zakłada się w oparciu o wyłoniony trend lub z na podstawie innych przesłanek (dla poszczególnych zmiennych objaśniających) wzrost lub spadek wszystkich wartości zmiennych objaśniających należy założyć ten wzrost o wartości parametrów niestandaryzowanych B. Jeśli więc z różnych to względów spodziewać się można wzrostu wszystkich zmiennych o jednostkę, w jakiej zostały przyjęte do modelowania, to nastąpi wzrost lub spadek zmiennej objaśnianej o sumę wszystkich B wyrażoną w jednostkach własnych zmiennej endogenicznej. Wszystkich tych założeń należy dokonywać z uwzględnieniem błędów, jakimi są obarczone BETA oraz B. O dobrym dopasowaniu modelu do danych empirycznych może świadczyć ponadto wykres linii regresji 1.5.