Biologie | Chimie | Didactica | Fizica | Geografie | Informatica | |
Istorie | Literatura | Matematica | Psihologie |
Selectarea celui mai bun model de regresie
E posibil ca pentru un anumit set de date sa existe mai multe modele de regresie statistic semnificative.
Alegerea celui mai bun model trebuie sa se faca in virtutea unui compromis intre maximizarea variantei lui y explicate si obtinerea unui model parcimonic, adica cat mai simplu
O modalitate relativ obiectiva de a selecta modelul cel mai potrivit este compararea coeficientilor de determinare ajustati (cu cat mai mare cu atat mai bun) sau a indicelui Akaike (cu cat mai mic cu atat mai bun).
Regresia logistica simpla
Aceasta permite ajustarea probabilitatii unei variabile de raspuns discontinue in functie de o variabila independenta continua. Daca y e o variabila ordinala, atunci se estimeaza probabilitatea de a obtine o valoare a lui y mai mica sau egala cu un nivel (stare) dat al variabilei y. Daca y e o variabila nominala, atunci se partitioneaza probabilitatea intre diverse raspunsuri. In ambele cazuri se estimeaza un set de curbe (c-1; c=nr nivelelor/starilor variabilei y) cu pante egale dar intercept diferit.
Cea mai frecventa si simpla situatie intalnita in biologie e atunci cand y e o variabila binara, in care starile sunt: prezent/absent, viu/mort etc. Ipoteza nula este ca: coeficientul b=0. Probabilitatile sunt masurate pe verticala, intre curbe si totalul lor trebuie sa fie egal cu 1. Daca x nu are nici un efect asupra lui y atunci curbele sunt paralele cu abscisa (au panta 0).
Toate testele care apar in output compara modelul specificat cu altele mai simple sau mai complexe:
Analiza univariata a variantei ANOVA-univariata
Ecuatia generala in cazul ANOVA univariata este aceeasi ca si in cazul regresiei liniare simple cu exceptia faptului ca x este o variabila discontinua (nominala sau ordinala). Este foarte important sa existe suficiente replicatii (valori ale lui y) pentru fiecare nivel (stare) a variabilei x, iar pe cat posibil (ideal) aceste replicatii sa fie egale intre grupe.
Ipoteza nula in acest caz e ca nu exista diferente semnificative intre mediile grupelor de subiecti.
!!! ANOVA nu face altceva decat sa compare mediile; nu compara distributiile
Prezumtii:
Este foarte important daca efectul lui x este fix sau aleatoriu.
In functie de calitatea pe care o are efectul lui x asupra lui y se aplica un algoritm diferit in testul ANOVA.
Analiza simpla a variantei intre grupe (am o singura variabila x)
(=one way between groups ANOVA)
Aceasta analiza e adecvata cand se dispune de o variabila dependenta cantitativa (y) masurata in scara de interval/de ratie si o variabila independenta calitativa (x) exprimata pe o scara nominala sau ordinala. Termenul "simpla" implica faptul ca avem o singura variabila x. Prin numarul de stari ale variabilei x se determina numarul grupelor de subiecti
Ex: daca avem 2 stari, avem 2 grupe. Termenul "intre grupe" indica faptul ca fiecare subiect masurat sau tratat apare doar intr-una din grupe, adica este supus unui singur tratament.
Copyright © 2024 - Toate drepturile rezervate