Ekonometria

Opracowania !
Przykład modelu ekonometrycznego
Strona główna
Krótka definicja słowa Ekonometria i modeli ekonometrycznych. Fragment pracy licencjackiej napisanej pod kierunkiem dra J.Korola. Uniwersytet Szczeciński, 2000r.


Przedmiotem Ekonometrii jest statystyczne badanie ilościowych prawidłowości ekonomicznych. Ekonomista chcąc wpływać na kształtowanie się zjawisk gospodarczych, przewidywać je i kontrolować zmuszony jest badać poznawać te zjawiska. W odkrywaniu i formułowaniu ilościowych praw ekonomicznych zasadniczą rolę odgrywa badanie statystycznych prawidłowości w kształtowaniu się procesu gospodarczego. Ekonometria wywodzi się z połączenia trzech podstawowych nauk; matematyki, statystyki i ekonomii. Z połączenia Matematyki i statystyki powstała Statystyka Matematyczna, a z połączenia Statystyki i Ekonomi - Statystyka ekonomiczna. Wspólne zainteresowania Matematyki i Ekonomi utworzyły Ekonomię matematyczną, wspólne zainteresowania zaś Ekonomii, Matematyki i Statystyki są podstawą rozwoju nauki zwanej Ekonometrią.

Prognozowanie ekonometryczne jest funkcją materiału empirycznego i ma charakter ekstrapolacyjny. Zależności przewidywania ekonometrycznego od materiału empirycznego objawia się tym, że podstawą wnioskowania w przyszłość jest obserwacja zmiennych ekonomicznych w przeszłości, Wykryte w trakcie analizy danych statystycznych z przeszłości prawidłowości i powiązania między zmiennymi są z kolei podstawą do zbudowania modelu ekonometrycznego. Niektóre modele ekonometryczne wskazują, w jaki sposób jedne wielkości ekonomiczne zależą od pewnych wielkości i odzwierciedlają powiązania o charakterze przyczynowo - skutkowym między zmiennymi. Jeżeli zjawisko ekonomiczne rozwijało się w przeszłości wskutek pewnego układu zmiennych objaśniających, jak to wskazuje model, to przewidywanie rozwoju tego zjawiska w przyszłości następuje przy założeniu, że zespół wspomnianych czynników nie ulegnie większym zmianom. Przenoszenie w przyszłość przedstawionych modelowo powiązań ilościowych jest możliwe pod warunkiem przyjęcia potwierdzonych przez rzeczywistość założeń co do warunków panujący w okresie prognozowanym. Prognozowanie ekonometryczne jest szczególnym przypadkiem prognozowania w ogóle.

Por.; (schemat) J. Hozer, Zawadzki, Ekonometria stosowana, Politechnika Szczecińska, 1985, także Piszczała J. Matematyka i jej zastosowanie w naukach ekonomicznych, Akademia Eekonomiczna, Poznań 1999, s.100-120.

Zasadniczym narzędziem badawczym Ekonometrii jest model ekonometryczny, który ma stochastyczny charakter, przejawiający występowaniem składnika losowego. Ze względu na to należy wymienić warunki w jakich metody ekonometryczne mogą być stosowane:

Ekonometryczne modele odnoszą się zawsze do konkretnej praktyki gospodarczej, w której zmieniają się warunki działania, zakresy kompetencji, cele działania. Model ekonometryczny stanowi matematyczną formę zapisu zależności między badanymi zjawiskami ekonomicznymi a innymi zjawiskami tak i ekonomicznymi jak i pozaekonomicznymi. Ujmuje on te związki, które są trwałe i istotne. Istotnym problemem przy badaniu prawidłowości w zakresie współzależności zjawisk jest rozstrzygnięcie, jakie własności posiada zbiór zmiennych objaśniających i czy jest to zbiór zmiennych losowych, czy też nielosowych.

Ekonometryczne modele opisowe odpowiednio od rodzaju prawidłowości statystycznych możemy podzielić na trzy grupy:

Modele przyczynowo opisowe to takie, których zmienne endogeniczne odgrywają rolę skutkowa zmienne objaśniające rolę przyczyn, ale de facto nie zawsze nimi są. badając efektywność zasobów porównujemy kształtowanie się poziomu produkcji z zasobami jednak poziom zasobów nie stanowi przyczyny takiego a nie innego kształtowania się produkcji. zasoby te są składnikiem koniecznym, ale nie wystarczającym dla poziomu produkcji. Modele przyczynowo-opisowe dzielą się na modele:

Innym kryterium podziału modeli ekonometrycznych jest kryterium czasu. Ze względu na nie wyróżniamy modele:

Modele ekonometryczne ze względu na postaci związków prezentowanych przez model:

Modele tendencji rozwojowej są to modele budowane dla danych w postaci szeregów czasowych; rocznych, kwartalnych, miesięcznych, dekadowych itp. Modele tendencji rozwojowej możemy podzielić na modele trendu i modele wahań oraz na modele ciągłe i skokowe

Modele struktury są t modele opisujące rozkład badanej cechy.

Etapy procesu ekonometrycznego modelowania

Wyłączając cele dydaktyczne i badania naukowe na rzecz rozwoju metodologii, modele ekonometryczne w zakresie ekonometrii stosowanej możemy budować w celu:

Poniżej zamieszczony zostaje opisowy model regresji wielowymiarowej, dotyczący kształtowania się badanego zjawiska w czasie z uwzględnieniem czynników, które mają na to wpływ. Estymacji parametrów tego modelu dokonano przy użyciu najpopularniejszej chyba metody, a mianowicie Metody Najmniejszych Kwadratów (MNK) wraz z zachowaniem statystycznych reguł doboru zmiennych, oceny istotności szacowanych parametrów i ogólnej poprawności sporządzanego modelu.
Jak widać nie jest to opracowanie pełne. Ze względu na możliwości interntu zaniechałem umieszczania większości wykresów i niektórych tablic, za co przepraszam!

W przypadku jakichkolwiek pytań proszę o kontakt. Jeśli będę znał tylko odpowiedź na pewno natychmiast ją otrzymacie. Natomiast jeśli pytanie miałoby zmusić mnie do pogłębienia wiedzy, na odpowiedź będziecie musieli nieco poczekać, ale takie pytanie bardziej mnie być może ucieszy.

Model opisowy kształtowania się skupu żywca rzeźnego w tysiącach ton na podstawie danych GUS z lat 1990 - 1999

Wstęp

W pracy niniejszej podjęty został problem budowy opisowego modelu ekonometrycznego. Modele ekonometryczne, budowane dla potrzeb gospodarki muszą cechować się dużą dokładnością i poprawnością, aby na ich podstawie dokonywać podstawowych prognoz. Prognoza nie jest zadaniem modelu opisowego, jednakże poprawnie skonstruowany model opisowy ma zawsze pewne własności prognostyczne. Chcąc oszacować relacje pomiędzy różnymi procesami gospodarczymi należy odwołać się do dokładnych danych statystycznych zbieranych przez wojewódzkie urzędy statystyczne. Oszacowany w tej pracy model ekonometryczny poziomu skupowanego żywca rzeźnego w przeliczeniu na mięso (w tys. ton), łącznie z tłuszczami, zostaw dokonany na podstawie danych rocznikowych z lat 1990-1999. Zmiennym-kandydatkami do modelu są:

  1. Y- Skup żywca rzeźnego w przeliczeniu na mięso (łącznie z tłuszczami) w tys. ton,
  2. X1 - Skup ziarna zbóż podstawowych w tys. ton,
  3. X2 - Powierzchnia zasiewów (stan w czerwcu) w mln. ha,
  4. X3 - Zużycie nawozów sztucznych w przeliczeniu na czysty składnik na 1ha użytków rolnych,
  5. X4 - Zwierzęta gospodarskie (stan w czerwcu) w milionach sztuk-bydło,
  6. X5 - Skup produktów rolnych (ceny stałe)-(rok bazowy) 1990=100,
  7. X6 - Nakłady inwestycyjne w rolnictwie (ceny stałe)- (rok bazowy)1990=100,
  8. X7 - Spożycie niektórych artykułów konsumpcyjnych - mięso na osobę w ciągu roku w kg.,
  9. X8 - Obroty handlu zagranicznego-eksport w mln. $ USA.

Doboru zmiennych kandydatek dokonano z założeniem zależności ze zmienną objaśnianą.

Chcąc zbadać zależność np. spożycia mięsa na osobę i ilości skupowanego mięsa można to zrobić prostym modelem regresji liniowej z jedną zmienną i dwoma parametrami (w tym jednym stałym). Natomiast badanie zależności wielorakich jest bardziej skomplikowane i składa się na większą ilość operacji arytmetycznych, aby określić oceny numeryczne parametrów równania 1.0

Zbudowany model określający kształtowanie się badanej zmiennej endogenicznej nie jest jedynym równaniem, które może zostać skonstruowane. Określa ono bowiem tylko zależności pomiędzy zmiennymi niezależnymi, a zmienną objaśnianą. Należy zatem zaznaczyć, że można dokonać konstrukcji kolejnych modeli z uwzględnieniem innych zmiennych niezależnych, należy pamiętać, aby zmienne te miały ze sobą udokumentowany wcześniej związek, wiadomy z doświadczenia. Można także odkryć nowy związek pomiędzy różnymi zmiennymi, ale trzeba zachować ostrożność w badaniu bowiem teoretycznie jeśli istnieje związek pomiędzy np. wzrostem bezrobocia, a spadkiem ilości pożarów nie można twierdzić, że spadek ilości pożarów zawdzięczamy wzrostowi bezrobocia. Znaczy to tyle, że pierwsza zmienna nie implikuje wartości drugiej zmiennej. Ogólna postać modelu badającego zależności liniowe dana jest wzorem:
1.0 Y=a1X1+a2X2+a3X3+,...,akXk,
gdzie:
a - parametr przy danej zmiennej,
k - numer parametru przy zmiennej,
n - ilość obserwacji.

Podstawowe zasady weryfikacji zmiennych kandydatek

Poza tym dobierając zmienne do modelu należy zweryfikować ich poprawność pod względem takich cech, jak: dostatecznie duża zmienność, rodzaj i poziom istniejących związków pomiędzy zmiennymi.

Badanie zmienności zmiennych

(Tab. 1.1)
X1 - 0,182893 X5 - 0,136162
X2 - 0,044735 X6 - 0,452139
X3 - 0,33899 X7 - 0,045641
X4 - 0,134018 X8 - 0,299807

Należy założyć określony poziom krytyczny zmienności dla danej zmiennej, który powinien być podyktowany także znajomością kształtowania się zmienności zmiennej we wcześniejszych okresach, lub , jak w tym przypadku w innych państwach. Jeśli bowiem poziom zmienności nakładów inwestycyjnych w rolnictwie ma poziom vs=0,06 nie można stwierdzić natychmiast, że ten poziom dyskwalifikuje zmienną ponieważ obserwowane nakłady na inwestycje w innych krajach na przełomie wielu lat nigdy nie wykazywały większej zmienności aniżeli vs=0,08. Określenie prawidłowego poziomu krytycznego vs dla każdej zmiennej (dany wzorem 1.1) nastręcza zatem wiele trudności.
1.1 vs=Sei/średnia arytmetyczna zmienneji,
gdzie:
Se -odchylenie standardowe zmiennej z numerem i,
i - numer zmiennej i=1,2,3,...,k.

Dla potrzeb modelu zostanie zbadany poziom zmienności wszystkich zmiennych lecz zmienne nie zostaną zweryfikowane w oparciu o jego poziom. Wszystkie zmienne zostaną zakwalifikowane do dalszego etapu modelowania. Dysponując danymi z tabeli 1.2 określić można na podstawie wzoru 1.1 następujące wartości vs dla wszystkich zmiennych kandydatek

(Tab. 1.2)
Średnia Mediana Minimum Maksimum Rozstęp Wariancja Odch.Std Skośność Kurtoza
X1 4575,60 4442,00 3556,00 6063,00 2507,00 700313, 836,847 1,010561 ,18442
X2 13,01 12,90 12,30 14,20 1,90 0,0 0,582 ,929418 ,46866
X3 86,10 82,50 62,00 164,00 102,00 852,00 29,187 2,463859 6,93501
X4 7,79 7,45 6,60 10,00 3,40 1,00 1,044 1,264758 1,09307
X5 82,02 80,75 65,40 100,00 34,60 125,00 11,168 0,328777 -0,85029
X6 44,42 37,20 33,00 100,00 67,00 403,00 20,084 2,859190 8,52658
X7 61,59 61,55 57,40 65,90 8,50 8,00 2,811 0,009770 -1,28296
X8 20236,85 20067,50 13186,60 28228,90 15042,30 36810245,00 6067,145 0,102309 -2,07332

Obniżony poziom zmienności wykazują zmienne X2,X7 przyjmuje się, że ich zmienność w czasie jest na poziomie, który gwarantuje ich poprawność.

1.2 Badanie związków pomiędzy zmiennymi

Rodzaj i poziom zależności pomiędzy wszystkimi zmiennymi zostanie zmierzony przy pomocy współczynnika korelacji liniowej Pearsona

Brak tablicy zawierającej wyniki związków korelacyjnych!

Wartości r wskazują na silniejszy związek zmiennych niezależnych ze zmienną endogeniczną niż pomiędzy sobą. Jest to jeden z warunków akceptacji zmiennej kandydatki do dalszego etapu modelowania.

Estymacja parametrów strukturalnych modelu Estymacja parametrów strukturalnych modelu polega na wyznaczeniu takich ocen numerycznych a1, a2, a3, ..., ak, parametrów a1, a2, a3, ...,ak, że suma kwadratów reszt osiąga minimum. Oznacza to, że każda liniowa funkcja o parametrach innych od oszacowanych dałaby sumę reszt (regresyjnych) większą od uzyskanej. Warunki wymienione powyżej można zapisać wzorem 1.3.
1.3 Set2=S(Y - Y' ) 2 ťť min ťť 0,
gdzie:
e - odchylenie wartości empirycznych od wartości teoretycznych (reszta),
t - numer okresu.

2.1 Wyznaczenie ocen parametrów

Przyjmując za istotny warunek dany wzorem 1.3 oceny numeryczne (wektor a) parametrów równania wyznaczymy za pomocą następującej zależności:
1.4 [a1,a2,a3 ... ak]=(X’X)-1X’Y,
Kolejno, więc należy wyznaczyć wszystkie elementy prawej strony równania 1.4. Wyznaczenie macierzy CROSS (z wyrazem wonym=0).
1.5 =(X'X),
gdzie:
X - macierz obserwacji zmiennych objaśniających.
Wartość tego równania jest symetryczna macierz iloczynów skalarnych, zwana macierzą CROSS

(Tab. 1.6) MatrixCrossProdOfDev
  • 215671276,
  • 595928,
  • 4111168,
  • 358188,
  • 3827479,
  • 2130284,
  • 2819281,
  • 938776398,
  • 215671276,
  • 595928,
  • 1696,
  • 11283,
  • 1018,
  • 10679,
  • 5841,
  • 8022,
  • 2606770,
  • 595928,
  • 4111168,
  • 11283,
  • 81922,
  • 6858,
  • 72797,
  • 43327,
  • 53099,
  • 17440543,
  • 4111168,
  • 358188,
  • 1018,
  • 6858,
  • 617,
  • 6412,
  • 3592,
  • 4812,
  • 1532982,
  • 358188,
  • 3827479,
  • 10679,
  • 72797,
  • 6412,
  • 68395,
  • 37660,
  • 50574,
  • 16798922,
  • 3827479,
  • 2130284,
  • 5841,
  • 43327,
  • 3592,
  • 37660,
  • 23362,
  • 27441,
  • 8737334,
  • 2819281,
  • 8022,
  • 53099,
  • 4812,
  • 50574,
  • 27441,
  • 38004,
  • 12366000,
  • 2819281,
  • 938776398,
  • 2606770,
  • 17440543,
  • 1532982,
  • 16798922,
  • 8737334,
  • 12366000,
  • 44265932E2
  • 938776398,

 Podniesiona do potęgi (-1) macierz CROSS daje macierz odwrotną tej macierzy - 1.7. Obie wartości zostały wyznaczone przy użyciu wyspecjalizowanych programów (MatLabStatistica 5.01) komputerowych, z założeniem wartości wyrazu wolnego = 0.

(Tab. 1.7) MatrixInverse
  • 0,00000094
  • 0,00000274
  • -0,0000212
  • -0,0000064
  • -0,0000489
  • 0,00002119
  • 0,00000663
  • 0,00000001
  • 0,00000274
  • 0,99527317
  • -0,0461761
  • -0,2715982
  • 0,04631677
  • 0,04453277
  • -0,2008755
  • -0,0000132
  • -0,0000212
  • -0,0461761
  • 0,00705471
  • 0,01426247
  • -0,0022451
  • -0,0086334
  • 0,00991095
  • -0,0000031
  • -0,0000064
  • -0,2715982
  • 0,01426247
  • 0,56777707
  • -0,0092677
  • -0,0302348
  • -0,0102353
  • 0,00003194
  • -0,0000489
  • 0,04631677
  • -0,0022451
  • -0,0092677
  • 0,00829420
  • 0,00128259
  • -0,0127283
  • -0,0000032
  • 0,00002119
  • 0,04453277
  • -0,0086334
  • -0,0302348
  • 0,00128259
  • 0,01209476
  • -0,0071315
  • 0,00000495
  • 0,00000663
  • -0,2008755
  • 0,00991095
  • -0,0102353
  • -0,0127283
  • -0,0071315
  • 0,05156848
  • -0,0000003
  • 0,00000001
  • -0,0000132
  • -0,0000031
  • 0,00003194
  • -0,0000032
  • 0,00000495
  • -0,0000003
  • 0,00000001

Wyznaczenie wektora X'Y;
(Tab. 1.8)oraz wyznaczone parametry modelu (1.9)
X'Y= =(X'X)-1X'Y=
[71232117,84
197963,78
1347370,42
118636,78
1273479,02
694481,52
938676,5
314294767,6]
a1
a2
a3
a4
a5
a6
a7
a8
[-3,0306825
4138,729472
988,545607
-10059,3762
1063,963884
-1555,14564
89,67231758
-3,4243082]
Dysponując wartościami wyrażeń 1.7, 1.8 można wyznaczyć wartość wektora ocen parametrów modelu.

Wyznaczone parametry strukturalne modelu pozwalają na zdefiniowanie równania modelu w sposób następujący:
2.0 Y=-3,03X1+4138,7 X2+988,5X3 -10059,3X4+1063,9X5 -1555,1X6+89,6X7-3,42X8

Szacowanie średnich błędów ocen parametrów

Szacowanie średnich błędów szacunku polega na wyznaczeniu wartości całkowitej wariancji resztowej i wyznaczeniu kolejnych pierwiastków kwadratowych z iloczynów przekątnej macierzy MatrixInverse (1.7) i wartości całkowitej wariancji. Zapisać to można w postaci wzoru 2.4. Wyznaczenie wartości całkowitej wariancji składnika losowego polega na wyznaczeniu regresyjnej sumy kwadratów i podzielenia jej przez różnicę obserwacji i ilości szacowanych parametrów, co można zapisać wzorem 2.1 lub posługując się bardziej skomplikowaną notacją macierzową 2.2.
2.1 Se2= S(Y-Y')2 /n-k
2.2 Se2= (Y'Y-Y'X(X'X)-1X'Y) /n-k

(Tab. 1.4) Obliczenia pomocnicze do wzoru 2.1
t Wartości
prognozowane Y'
Wartości
empiryczne Y
Y-Y' (Y-Y')2
  1. 1990
  2. 1991
  3. 1992
  4. 1993
  5. 1994
  6. 1995
  7. 1996
  8. 1997
  9. 1998
  10. 1999
  • 9466,059
  • -444,689
  • 9239,175
  • 15017,69
  • -3335,29
  • -2086,79
  • -17112,5
  • -14756,8
  • 5317,747
  • 10109,11
  • 1778
  • 1567
  • 1418
  • 1257
  • 1138
  • 1321
  • 1421
  • 1568
  • 1794
  • 1956
  • -7688,06
  • 2012,489
  • -7821,18
  • -13760,7
  • 4473,293
  • 3407,786
  • 18533,48
  • 16324,83
  • -3523,75
  • -8153,11
  • 59106253,9
  • 4050111,622
  • 61170781,42
  • 189356500,9
  • 20010351,54
  • 11613008,03
  • 343489901
  • 266500030,4
  • 12416793,4
  • 66473284,14
Dysponując danymi z tabeli 1.4 wyznaczyć można całkowitą wariancję składnika losowego;
2.3 Se2 - wyznaczone za pomocą wzorów;
2.1 Se2= 1034187016/10-2 =517093508,2
2.2 Se2= 1077278401/10-2 =538639201

Średnie błędy szacunku Sak dla wszystkich parametrów w modelu wyznaczamy posługując się wzorem;
2.4 Sa2k=Se2(X’X)-1=Sak Wszystkie wartości średnich błędów szacunku zawarte są w tabeli 1.5.

(Tab.1.5) Średnie błędy szacunku parametrów równania
    Sa1 Sa2 Sa3 Sa4 Sa5 Sa6 Sa7 Sa8 =
  1. 22,0947646
  2. 22685,8832
  3. 1909,95934
  4. 17134,5802
  5. 2070,96063
  6. 2500,82450
  7. 5163,88673
  8. 2,37242262
Otrzymane wartości średnich błędów szacunku pozwalają na uzupełnienie równania modelu do postaci:
2.6 Y= -3,03X1[22,09]+4138,7 X2[22685,8] +988,5X3[1909,9] -10059,3X4[17134,5] + 1063,9X5[2070,9] -1555,1X6[2500,8] +89,6X7[5163,88] -3,42X82,37,

Jak widać błędy średnie estymowanych parametrów nie są duże, co jest zadowalającym rezultatem przeprowadzonego modelowania, wnioskować można, że model ma znamiona poprawności.

Weryfikacja równania. Testowanie istotności statystycznej parametrów modelu

Weryfikacja modelu ma za zadanie, dzięki dostępnym metodom dać odpowiedź na pytanie czy model jest zbudowany poprawnie. Dokonać można tego sprawdzając istotność statystyczną parametrów modelu oraz stosując miary sprawdzające dopasowanie funkcji do danych empirycznych.

Test t-Studenta Sprawdzając istotność statystyczną (indywidualną) parametrów modelu należy postawić hipotezę zerową, która mówi, że parametr jest statystycznie różny od zera, zatem założyć jego istotność przeciwko hipotezie alternatywnej, która mówi, że parametr nie jest istotny statystycznie. Można to zapisać w następujący sposób;
2.7 H0 :ak=0

H1 :aką0

Wykorzystując statystykę t daną wzorem: 2.8 t= ak/Sak gdzie: k - numer parametru przy zmiennej.

(Tab. 1.6) Wyniki statystyki t - Studenta
    t1 t2 t3 t4 t5 t6 t7 t8 =
  • -0,006208
  • 22685,883161
  • 1909,959336
  • 17134,580181
  • 2070,960633
  • 2500,824503
  • 5163,886732
  • 2,372423

Dla n-k=2 stopni swobody przy poziomie p=0,05 (odczytane z tablic rozkładu t-Studenta ) wartość statystyki t, przy której nie ma podstaw do odrzucenia hipotezy zerowej to t= 4,303. Analizując wartości t z tabeli 1.6 widać, że dwa parametry nie posiadają indywidualnej istotności statystycznej lub inaczej mówiąc nie są statystycznie różne od zera. Wynik taki kwalifikuje model do powtórnego rozpatrzenia.
Test F Snedecora Test F dany wzorem 3.0 pozwala na weryfikowanie hipotezy dotyczącej wartości wszystkich składowych wektora a danego wzorami 1.4, 1.9.
3.0 F = M*(k+1)Se2
gdzie:
M dane wzorem; 3.1 M=(a - a0)'X'X(a - a0)

Stawiana jest zatem hipoteza zerowa przeciwko hipotezie alternatywnej dana wzorem 3.2. Wyników testowanie parametrów za pomocą statystyki F nie zostało zamieszczone w powyższszym opracowaniu.

  H1 :a0 ą

  • -3,03
  • 4138,72
  • 988,54
  • -10059,37
  • 1063,96
  • -1555,14
  • 89,67
  • -3,42

  H1 :a0 ą

  • -3,03
  • 4138,72
  • 988,54
  • -10059,37
  • 1063,96
  • -1555,14
  • 89,67
  • -3,42

Badanie dopasowania modelu do danych empirycznych

Wykorzystując dostępne miary dopasowania można zbadać, czy dane równanie modelu w sposób należyty opisuje zmienną objaśnianą. Posługując się wzorem na wskaźnik zbieżności 2.3 można uzyskać odpowiedź na pytanie w ilu procentach model nie wyjaśnia kształtowania się danych empirycznych.
3.3 j2=S(Y-Y’)2 /S(Y-Y)2 ,  
gdzie:/
Y -wartości empiryczne skupu żywca rzeźnego w latach 1990-1999,
Y'- wartości szacowane na podstawie modelu,
Y średnia wartość z okresów (wartości empirycznych) t.

Wartość wskaźnika zbieżności dla szacowanego modelu równa jest:
3.4 j2= 1034187016 = 0,99039 1044222512, - co wskazuje na absolutny brak dopasowania równania modelu do danych empirycznych. Przy tak wysokim poziomie j2 dalsza weryfikacja modelu nie ma większego znaczenia, gdyż model, który w ponad 99% nie wyjaśnia zmiennej objaśnianej jest modelem nieprzydatnym.

Podsumowanie

Analizując dotychczas przeprowadzone etapy budowy modelu stwierdzić można, że jedynie użycie algorytmów komputerowych pozwoli na uzyskanie w szybkim czasie poprawnie zbudowanego modelu ekonometrycznego. Wszystkie działania arytmetyczne, jakie zostały do tej pory wykonane pociągają za sobą duże nakłady pracy, a co za tym idzie są czasochłonne obarczone są także dużą niedokładnością wynikającą z zaokrągleń (dwie różne wartości całkowitej wariancji składnika losowego). Korzystając więc z pomocy maszyny liczącej zbudowany model zostanie zweryfikowany-ponownie skonstruowany. Korzystając z tych samych danych empirycznych przy użyciu programu Statistica został wyznaczony nowy model kształtowania się wartości rocznych skupu żywca rzeźnego. Model regresji wielorakiej oszacowany za pomocą programu Statistica Basic Podsumowanie regresji zmiennej zależnej Tabela 1.7 zawiera współczynniki regresji standaryzowane BETA (czyli kolejne a w modelu-parametry równania), tzn. takie które zakładają udział danej zmiennej w analizie, jako niezależnej (wykluczając jej ścisły związek z innymi zmiennymi niezależnymi). Natomiast B oznacza współczynniki regresji (parametry), zakładając istnienie współzależności zmiennych objaśniających. Interesujące nas ze względu na wcześniejsze założenie o braku współzależności są wartości BETA. 

(Tab. 1.7)Współczynniki regresji standaryzowane BETA (czyli kolejne a w modelu-parametry równania
"BETA" Błąd st. "BETA" "B" Błąd st. "B" Poziom "p"
  • X3
  • X4
  • X5
  • -0,19022
  • 1,533158
  • -0,35232
  • 0,034194
  • 0,083335
  • 0,063255
  • -3,24286
  • 28,58313
  • -8,81180
  • 0,582917
  • 1,553647
  • 1,582035
  • ,000848
  • ,000000
  • ,000842
  • Błąd st. BETA-wartość błędu szacunku dla (parametru) współczynnika regresji, gdyby została ona wprowadzona do równania regresji jako zmienna niezależna. B- niestandaryzowany współczynnik regresji, Poziom p- poziom istotności statystycznej dla współczynników regresji. R= 0,99982007-współczynnik korelacji wielorakiej wyjaśnia, w jakim związku pozostaje zmienna objaśniana z pozostałymi zmiennymi (objaśniającymi) w modelu. Poziom współczynnika R wskazuje na to, że kształtowanie się wartości zmiennej objaśnianej podyktowane jest niemalże całkowicie kształtowaniem się wartości zmiennych objaśniających.

    R2= ,99948597- współczynniki determinacji, czyli różnica 1-j2 wskazuje na to, że model wyjaśnia kształtowanie się zmiennej objaśnianej w ponad 99%, co jest bardzo zadawalającym wynikiem. Badanie istotności statystycznej parametrów modelu Wynik statystyki F (Snedecora)-patrz strona 13 i 14. df F(3,7)= 164,3882 p<,000001- stopnie swobody i poziom istotności. Parametry modelu są "łącznie" istotne statystycznie przy poziomie istotności p. Wykazują tym samym dużą istotność statystyczną Badanie autokorelacji składnika losowego (reszt) Test Durbina-Watsona służy do testowania hipotezy o występowaniu lub braku autokorelacji składnika losowego, tzn., czy istnieje liniowa zależność pomiędzy odchyleniami losowymi z różnych jednostek czasu. Stawiając hipotezę zerową, mówiącą o niewystępowaniu autokorelacji składnika losowego przeciwko hipotezie alternatywnej, posłużyć się należy statystykami d (3.5)oraz d'(3.6). 

    3.5 d=S(et-et-1)2/Set2,

    3.6 d'=4-d 

    Wartości d pochodzą z przedziału <0,4>. Dla modelu wartość d=2,816289, co świadczy o występowaniu autokorelacji ujemnej oraz d'=1,19, co potwierdza istnienie autokorelacji składnika losowego, a zarazem, ze względu na wartości graniczne dl=1,48 oraz du=1,96 skłania do odrzucenia hipotezy zerowej mówiącej o braku autokorelacji reszt w modelu. Świadczyć to może, że kolejne wartości zmiennej objaśnianej mogą nie być niezależne od ich wartości je poprzedzających. Dopasowanie rozkładu normalnego do reszt surowych Określenie kształtowania się poziomu reszt jest ważne z powodu tego, że rozkład reszt odbiegający znacznie swym rozkładem od normalnego wskazuje na występowanie wartości ekstremalnych zmiennej objaśnianej, co tłumaczyć można jako zwiększone prawdopodobieństwo występowania wartości nietypowych (losowych ),nieporównywalnie dużych lub małych w stosunku do pozostałych. Większość zjawisk społeczno-gospodarczych ma rozkład normalny, czyli przybiera wartości typowe z określonego przedziału, nie wykraczające poza wartość kilkakrotną odchylenia standardowego, wyznaczonego dla tego zjawiska. Inaczej mówiąc zbiór wartości zmiennej jest stosunkowo stabilny. Dla zmiennej objaśnianej reszty surowe nie wykraczają poza dwukrotną wartość odchylenia standardowego. Czyli dopasowanie funkcji regresji liniowej można uznać za dobre. 1.4 Dopasowanie rozkładu normalnego do reszt surowych (Y-Y').

    Tab.1.8 Zawiera wartości empiryczne Y oraz szacowane na podstawie modelu Y'. 

    58,8789
    t Obserwow Wartość Przew. Wartość Reszta
    1990 1778,000 1766,053 11,9471
    1991 1567,800 1594,957 -27,1570
    1992 1418,000 1359,121
    1993 1257,000 1282,430 -25,4298
    1994 1138,000 1123,603 14,3970
    1995 1321,000 1358,026 -37,0264
    1996 1421,000 1424,466 -3,4662
    1997 1568,000 1598,380 -30,3802
    1998 1794,000 1793,909 ,0907
    1999 1956,000 1923,643 32,3572
    Minimum 1138,000 1123,603 -37,0264
    Maksimum 1956,000 1923,643 58,8789
    Średnia 1521,880 1522,459 -,5789
    Mediana 1494,400 1509,712 -1,6877

    1.5

    Podsumowując model oszacowany za pomocą programu Statistica można powiedzieć, że równanie to należycie opisuje zmienną objaśnianą. Skup żywca rzeźnego opisywany jest trzema zmiennymi objaśniającymi, a mianowicie: zużyciem nawozów sztucznych w przeliczeniu na czysty składnik, na 1 ha użytków rolnych, ilością zwierząt gospodarskich (bydła) oraz indeksem całościowym skupu produktów rolnych. Dysponując wartościami parametrów z tabeli 1.7 można stwierdzić o ile może podnieść się lub spaść ilość skupowanego żywca wraz ze zmianą wartości poszczególnych zmiennych objaśniających. Jeśli zakładamy zmianę wartości jednej zmiennej i niezmienność pozostałych, wówczas należy spodziewać się różnicy wynikającej z wartości standaryzowanego BETA współczynnika regresji liniowej. Jeśli natomiast zakłada się w oparciu o wyłoniony trend lub z na podstawie innych przesłanek (dla poszczególnych zmiennych objaśniających) wzrost lub spadek wszystkich wartości zmiennych objaśniających należy założyć ten wzrost o wartości parametrów niestandaryzowanych B. Jeśli więc z różnych to względów spodziewać się można wzrostu wszystkich zmiennych o jednostkę, w jakiej zostały przyjęte do modelowania, to nastąpi wzrost lub spadek zmiennej objaśnianej o sumę wszystkich B wyrażoną w jednostkach własnych zmiennej endogenicznej. Wszystkich tych założeń należy dokonywać z uwzględnieniem błędów, jakimi są obarczone BETA oraz B. O dobrym dopasowaniu modelu do danych empirycznych może świadczyć ponadto wykres linii regresji 1.5.