Home - Rasfoiesc.com
Educatie Sanatate Inginerie Business Familie Hobby Legal
Doar rabdarea si perseverenta in invatare aduce rezultate bune.stiinta, numere naturale, teoreme, multimi, calcule, ecuatii, sisteme




Biologie Chimie Didactica Fizica Geografie Informatica
Istorie Literatura Matematica Psihologie

Fizica


Index » educatie » Fizica
» Regresie simpla


Regresie simpla


Regresie simpla

Avem la dispozitie 14 observatii refritoare la rata dobanzii si la rata inflatiei in perioada 1990-2003 in Germania. Dorim sa evaluam existenta unei regresii simple care sa explice rata dobanzii in functie de valoarea luata de rata inflatiei.

Dupa importarea prealabila a datelor dintr-un tabel excel, se poate defini ecuatia prin comanda

ls rata_dobanda c rata_inflatie

Rezultatul va fi:

Dependent Variable: RATA_DOBANDA



Method: Least Squares

Date: 06/30/07    Time: 08:52

Sample: 1990 2003

Included observations: 14

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

C

RATA_INFLATIE

R-squared

    Mean dependent var

Adjusted R-squared

    S.D. dependent var

S.E. of regression

    Akaike info criterion

Sum squared resid

    Schwarz criterion

Log likelihood

    F-statistic

Durbin-Watson stat

    Prob(F-statistic)


Valoare lui R2 arata ca aproximativ 80% din variatia ratei dobanzii este explicate prin variatia ratei inflatiei.
Valoarea mica a probabilitatii ne permite sa respingem ipoteza nula pentru coeficientul ratei de infaltie.

Regresie multipla

Avem la dispozitie 7 observatii privitoare la valorile veniturilor din impozite directe si indirecte si al PIB-ului in Franta in perioada 1997-2003

Vrem sa verificam existenta unui model de regresie multipla ce explica variatia PIB-ului prin variatiile incasarilor din impozite.

Avem ecuatia

LS PIB C IMP_DIR IMP_IND

care produce datele

Dependent Variable: PIB

Method: Least Squares

Date: 06/30/07    Time: 09:44

Sample: 1997 2003

Included observations: 7

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

C

IMP_DIR

IMP_IND

R-squared

    Mean dependent var

Adjusted R-squared

    S.D. dependent var

S.E. of regression

    Akaike info criterion

Sum squared resid

    Schwarz criterion

Log likelihood

    F-statistic

Durbin-Watson stat

    Prob(F-statistic)


Sa observam valoarea mare pe care o are coeficientul de determinatie precum si posibilitatea respingerii ipotezei nule pentru coeficientii celor 2 impozite la nivelul de 5%.

Sa mai observam ca valoarea mare a testului Durbin-Watson (tinand cont de numarul de observatii si de numarul de variabile dependente) indica posibilitatea ca erorile sa fie autocorelate.

Putem de asemenea atrage atentia ca diferenta existenta intre coeficientii celor 2 tipuri de impozite poate fi si o consecinta a faptului ca impozitele directe au fost introduse in regresie inaintea celor indirecte. Astfel cum cele doua tipuri de impozite sunt corelate intr-o anumita masura putem spune ca primul coeficient a preluat si din sarcina celui de-al doilea.

Serie de timp. Indicele BET-FI.

Avem la dispozitie 1611 de observatii din perioada noiembrie 2000 - mai 2007.

. Deoarece spre deosebire de alte piete de capital preturile din Romania cresc si datorita cresterii generalizate a preturilor va trebui sa ajustam indicele la inflatie.

Inflatia medie pe luna in perioada pe care o luam in calcul este de 1.013789.

Tinand cont ca dispunem de observatii zilnice pentru BET-FI iar inflatia este lunara, vom considera ca in medie intr-o luna sunt 20 de zile de tranzactionare si vom devalorizeaza cu radical in baza 20 din rata inflatiei medie lunara.

Dupa acest rationamet inflatia medie zilnica este 1.000682.

Graficul BET-FI arata asa:

Aplicand urmatorul program :

scalar t= 1611

scalar m= 1.000682

scalar p = 1

vector (t) betfi

vector (t) betfiajustat

for !i=1 to t

betfiajustat(!i) = betfi(!i)/ m^!i

next

In urma ajustarii graficul este:

Se observa ca seria ajustata nu depaseste valoarea de 25000 spre deosebire de cea initiala care ajungea la 70000.

Din grafic observam ca media nu este constanta de-a lungul timpului, deci seria nu este stationara. Folosim metodologia Dickey - Fuller pentru a stabili ce tip de nonstationaritate avem.

Estimand cele 3 modele ale testului Dickey - Fuller obtinem:

equation q3.ls bet_fi c w bet_fi(-1)

Dependent Variable: BET_FI

Method: Least Squares

Date: 06/30/07    Time: 12:19

Sample (adjusted): 2 1611

Included observations: 1610 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

C

W

BET_FI(-1)

R-squared

    Mean dependent var

Adjusted R-squared

    S.D. dependent var

S.E. of regression

    Akaike info criterion

Sum squared resid

    Schwarz criterion

Log likelihood

    F-statistic

Durbin-Watson stat

    Prob(F-statistic)

R2 inregistreaza o valoare ridicata. Ipoteza nula (coeficientul lui W e 0) trebuie respinsa la un prag de 5 %, dar poate fi acceptata la un prag de 1%.

Trecand la estimarea celui de-al doilea model avem:

equation q2.ls bet_fi c bet_fi(-1)

Dependent Variable: BET_FI

Method: Least Squares

Date: 07/03/07    Time: 02:36

Sample (adjusted): 2 1611

Included observations: 1610 after adjustments

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

C

BET_FI(-1)

R-squared

    Mean dependent var

Adjusted R-squared

    S.D. dependent var

S.E. of regression

    Akaike info criterion

Sum squared resid

    Schwarz criterion

Log likelihood

    F-statistic

Durbin-Watson stat

    Prob(F-statistic)


Ipoteaza nula in legatura cu C poate fi acceptata la un prag de 5%. Valoarea apropiata de 1 a coeficientului lui bet_fi(-1) ne conduce la un model de tip difference stationary.
Aplicand operatorul de diferentiere se obtine seria delta = bet_fi - bet_fi(-1) care arata ca mai jos.



Evolutia P.I.B. din Romania.

Datele de intrare au fost obtinute pentru 15 ani si prelucrate prin transformarea valorilor acestora din preturi curente in preturi constante , cu baza 1990, (folosind deflatorul P.I.B.), dar si logaritmare in vederea asigurarii comparabilitatii acestora in timp, dar si pentru evitarea aparitiei fenomenului de multicoliniaritate, fenomen ce afecteaza datele observate si nu regresia.

Tabel nr. 1- P.I.B., veniturile bugetului general consolidat, cheltuielile bugetului general consolidat, venituri fiscale (preturi curente- mil. RON), deflatorul P.I.B. (%)

Ani

P.I.B.

Deflatorul P.I.B. (%)

C.B.G.C

V.B.G.C.

V fiscale

1990

Tabel nr. 2- deflatorul P.I.B. exprimat in preturi constante (baza-1990)

Ani

Deflatorul P.I.B. (%) in P constante (baza-1990)

Tabel nr.3- Datele prelucrate (preturi constante logaritmate)

Ani

P.I.B.

C.B.G.C.

V.B.G.C.

V fiscale

In ceea ce priveste valoarea testului Durbin-Watson, interpretarea acesteia trebuie realizata in functie de tabelul distributiei Durbin-Watson cu nivelul de semnificatie de 0,05. Astfel, se remarca d1= 1,08 si d2= 1,36. Prin urmare, valoarea de 1,322 aferenta cazului de fata este inclusa in cadrul intervalului (1,08;1,36), in asa fel incat nu se poate o decizie finala cu privire la autocorelarea erorilor. Cu toate acestea, avand in vedere apropierea de intervalul (1,36;2,64), putem aprecia ca erorile nu sunt corelate intre ele, deci ipoteza independentei acestora este respectata. Metoda grafica are tendinta de a indica acelasi lucru:

Valoarea Log likelihood in modul este si de aceasta data foarte mare, ceea ce justifica distributia normala a erorilor.

Cu privire la respectarea ipotezei de varianta constanta a erorilor (homoscedasticitate), se va recurge din nou la testul lui White si metoda grafica.

White Heteroskedasticity Test:

F-statistic

Probability

Obs*R-squared

Probability

Test Equation:

Dependent Variable: RESID^2

Method: Least Squares

Date: 02/02/07    Time: 11:05

Sample: 1990 2004

Included observations: 15

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-2.45E+08

2.88E+08

CH

CH^2

R-squared

Mean dependent var

1.74E+09

Adjusted R-squared

S.D. dependent var

3.38E+09

S.E. of regression

9.39E+08

Akaike info criterion

Sum squared resid

1.06E+19

Schwarz criterion

Log likelihood

F-statistic

Durbin-Watson stat

Prob(F-statistic)

Analizand cele doua metode de detectare a heteroscedasticitatii, putem afirma ca aceasta este prezenta in modelul regresiei liniare simple de fata, intrucat, pe grafic se observa o abatere de la banda de fluctuatie a reziduurilor, iar testul White scoate in evidenta faptul ca parametrii atasati modelului (cu exceptia constantei) sunt semnificativ diferiti de 0, acceptarea ipotezei alternative pentru testul T avand la baza probabilitatile de 0 (sub 0,05) atasate acestuia. De asemenea, probabilitatea testului F este 0, ceea ce justifica inca odata prezenta heteroscedasticitatii.

Referitor la validarea ecuatiei de regresie estimate se pot face urmatoarele afirmatii:
In primul rand atat coeficientul de determinatie multipla,cat si cel ajustat sunt foarte apropiate de 1, ceea ce indica faptul ca o mare parte din varianta totala a variabilei dependente este explicate de factorul semnificativ, care in acest caz este :C.B.G.C.

Cu privire la semnificatia coeficientilor, se va interpreta probabilitatea atasata testului T. Prin urmare, se poate concluziona ca, in ceea ce priveste parametrul p-value este de 0, sugerand acceptarea ipotezei alternative, potrivit careia variabila "ch" influenteaza variabila dependenta. Pe de alta parte, termenul liber nu este semnificativ nici la un nivel de 0,05, drept pt care se impune estimarea ecuatiei fara acesta.

Testul F are o valoare deosebit de mare (aproximativ 9900), iar p-value atasat acestuia de 0, ceea ce sustine validitatea modelului (intre cele doua variabile luate in considerare exista o relatie puternica).

Din punctual de vedere al criteriilor informationale, se poate spune ca modelul de fata este slab valorile AIC si SC sunt destul de mari Daca tinem cont de faptul ca acest model cuprinde o singura variabila exogena, , acest lucru este normal. De asemenea, eroarea standard a modelului este foarte mare, lucru justificat atat de numarul mic de observatii, cat si de numarul redus de variabile independente.

Numarul mediu al salariatilor in perioada 1990 - 2003

Anul

Salariati

Reprezentare grafica

Indicatori statistici si histograma

Corelograma

Testul "Unit Root"

Null Hypothesis: SAL has a unit root

Exogenous: Constant

Lag Length: 1 (Fixed)

t-Statistic

Elliott-Rothenberg-Stock DF-GLS test statistic

Test critical values:

1% level

5% level

10% level

*MacKinnon (1996)

Warning: Test critical values calculated for 20 observations

and may not be accurate for a sample size of 12

DF-GLS Test Equation on GLS Detrended Residuals

Dependent Variable: D(GLSRESID)

Method: Least Squares

Date: 02/03/07 Time: 13:18

Sample(adjusted): 1992 2003

Included observations: 12 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

GLSRESID(-1)

D(GLSRESID(-1))

R-squared

Mean dependent var

Adjusted R-squared

S.D. dependent var

S.E. of regression

Akaike info criterion

Sum squared resid

Schwarz criterion

Log likelihood

Durbin-Watson stat





Politica de confidentialitate





Copyright © 2024 - Toate drepturile rezervate