Biologie | Chimie | Didactica | Fizica | Geografie | Informatica | |
Istorie | Literatura | Matematica | Psihologie |
Determinarea coeficientilor modelului matematic liniar sau liniarizabil
Coeficientii modelelor liniare se determina cu urmatoarele metode:
metoda grafica
metoda mediilor
metoda celor mai mici patrate
Metoda grafica se utilizeaza pentru modelele cu doi coeficientii si ofera rezultate cu o clasa de precizie redusa.
Metoda mediilor consta in solutionarea sistemului de ecuatii liniar, rezultat in urma inlocuirii a doua seturi de valori ale mediilor aritmetice ale datelor experimentale. Este o metoda a carei solutie depinde de asocierea in cele doua seturi ale variabilelor.
Cea mai utilizata este metoda celor mai mici patrate, deoarece calculeaza coeficientii modelului care coreleaza datele experimentale cu abatere patratica minima. Dupa cum sugereaza figura 2.2, dreapta de regresie exprima tendinta de evolutie a unor masuratori experimentale.
Pentru un model cu o variabila dependenta si una independenta modelul este de urmatoarea forma:
(2.5)
S-au notat cu b si b coeficientii modelului si cu e, eroarea absoluta cu care y nu poate descrie expresia liniara in functie de x. Daca e este egala cu zero, modelul este determinist si in acest caz cunoasterea lui x este suficienta pentru calcularea lui y. In mod analog, consideratiile anterioare se extind asupra unui model liniar cu n variabile independente a carui ecuatie de corelare este de urmatoarea forma:
(2.6)
Metoda celor mai mici patrate inlocuieste ecuatiile (2.5) si (2.6) cu urmatoarele expresii:
(2.7)
respectiv:
(2.8)
In figura 2.2, perechile de valori si x se gasesc pe dreapta de regresie in timp ce perechile y si x sunt reprezentate de punctele experimentale. Diferenta dintre valorile y si este cunoscuta sub denumirea de abatere sau reziduala.
Daca se noteaza cu yj si xij un set j de date experimentale, j = 1..M, se propune ca modelul matematic sa coreleze cu abatere patratica minima, S, datele experimentale:
(2.9)
Pentru un model cu o variabila independenta si ca urmare cu doi coeficienti, solutia sistemului obtinut prin derivare reprezinta minimul urmatorului sistem:
(2.10.1)
(2.10.2)
Dupa rezolvarea sistemului se obtine:
(2.11.1)
(2.11.2)
In cazul in care dependenta dintre variabilele procesului este neliniara si neliniarizabila, problema se solutioneaza prin minimizarea sumei rezidualei prin metode de optimizare specifice, iar activitatea se numeste analiza de regresie neliniara.
Regresia liniara se poate extinde si modelelor exprimate printr-o ecuatie parabolica de urmatoarea forma:
(2.12)
Sistem obtinut prin derivare in raport cu necunoscutele problemei, coeficientii de tip b, este, dupa cum se observa, liniar:
(2.13)
Observatie: Calculul coeficientilor modelului este o problema de optimizare. Ca orice problema de optimizare, solutia acesteia depinde de criteriul de selectie ales. In acest caz, solutia obtinuta corespunde sumei minime a patratelor rezidualelor, care constituie criteriul de selectie cel mai utilizat, deoarece prin formulare se introduce gradul de neliniaritate necesar solutionarii unei astfel de probleme. In cazul modelelor neliniare, criteriul de selectie se modifica, deoarece nu mai este necesar sa fie exprimat printr-o relatie neliniara.
Analiza calitatii modelului impune apelarea la un set de teste statistice pentru a aprecia cantitativ adecvanta modelului matematic sau gradul in care ecuatia de corelare reprezinta datele experimentale. Se utilizeaza:
coeficientul de determinare;
coeficientul de corelatie;
testul Fisher.
Coeficientul de determinare, r2y,x, reprezinta coeficientul cel mai utilizat pentru aprecierea calitatii ecuatiei de regresie. Se defineste ca raportul dintre:
(2.14)
S-au notat cu:
- valoarea furnizata de model in punctul i,
- valoarea mediei aritmetice a replicatelor in punctul i,
yij - valoarea unei replicate in punctul ij,
i = 1..n, contorul celor n puncte distincte in care s-au facut masuratori experimentale,
j = 1..mi, contorul replicatelor executate intr-un punct distinct i; in fiecare punct se efectueaza mi replicate.
Coeficientul de determinare ia valori cuprinse intre 0 si 1. Valoarea 1 semnifica o corelare foarte buna intre datele experimentale si model. Valoarea 0 atrage atentia ca datele experimentale nu se coreleaza printr-un model liniar. Pentru calculele stiintifice o valoare mai mare de 0,6 confirma corelarea de tip liniar. Exprimat in procente, coeficientul de determinare reprezinta procentul din datele experimentale care se coreleaza printr-o relatie liniara.
Coeficientul de corelatie, ry,x este o masura a legaturii de tip liniar care exista intre variabile. Se defineste astfel:
(2.15)
Valoarea coeficientului de corelatie variaza in intervalul (-1; 1); valoarea +1 confirma ca variabilele se coreleaza perfect printr-o dreapta in care variabilele sunt direct proportionale, iar valoarea -1 are aceeasi semnificatie cu deosebirea ca indica un raport invers proportional intre variabile. Valoarea zero semnaleaza ca variabile nu se pot corela printr-un model liniar.
Daca coeficientul de corelatie se calculeaza din coeficientul de determinare, i se atribuie semnul coeficientului b1 din ecuatia de regresie, adica a coeficientului aferent variabilei x1.
Testului Fisher, Fc, se defineste ca raportul dintre dispersia datelor experimentale si dispersia datelor experimentale fata de valorile calculate pe baza modelului matematic:
(2.16)
Pentru obtinerea dispersiei datorata erorilor experimentale, sunt necesare experiente cu replicate. Se defineste astfel:
(2.17)
unde reprezinta media aritmetica a raspunsurilor celor n' replicate.
Dispersia fata de modelul matematic, este:
(2.18)
unde reprezinta valoarea calculata cu modelul matematic, yi valorile experimentale, N numarul de determinari experimentale, n' numarul constantelor din model plus o unitate (N-n'', n'-1 reprezinta gradele de libertate ale dispersiilor si ).
Valorile calculate pentru testul Fisher rezultate din raportul celor doua dispersii se compara cu cele tabelate; daca Fc F se poate considera ca modelul matematic reprezinta datele experimentale. In tabelul 8 din anexa sunt date valorile testului Fisher Pentru modelele liniare cu mai multe variabile independente se utilizeaza testul G ale carui valori sunt date in tabelul 9 din anexa, iar definitia este prezentata in sectiunea 7 a lucrarii.
Analiza rezidualelor joaca un rol important in validarea unui model. Se presupune ca reziduala - diferenta dintre previziunea modelului si masuratoarea experimentala, satisface urmatoarele ipoteze:
este o variabila aleatoare a carei valoare se doreste sa fie zero,
legea de variatie a rezidualei este aceeasi cu a variabilei x,
valorile rezidualei sunt independente,
reziduala este normal distribuita.
Reprezentarea grafica a rezidualei in functie de , pentru toate punctele experimentale, este o banda orizontala de puncte pentru un model cu un coeficient de determinare mare. Abateri de la aceasta banda sugereaza adesea caile prin care modelul poate fi imbunatatit.
Analiza de regresie exprima o relatie de tip cauza - efect intre variabile, iar coeficientul de corelatie gradul in care variabilele se asociaza unui model liniar. Orice concluzie asupra rezultatelor obtinute, se recomanda sa se efectueze cu mare prudenta si numai dupa o judecata analitica a fenomenului fizic studiat.
Analiza de regresie este activitatea de identificare si obtinere a unui model matematic statistic
Calitatea modelului se apreciaza cu teste statistice
Copyright © 2024 - Toate drepturile rezervate