Home - Rasfoiesc.com
Educatie Sanatate Inginerie Business Familie Hobby Legal
Doar rabdarea si perseverenta in invatare aduce rezultate bune.stiinta, numere naturale, teoreme, multimi, calcule, ecuatii, sisteme




Biologie Chimie Didactica Fizica Geografie Informatica
Istorie Literatura Matematica Psihologie

Statistica


Index » educatie » » matematica » Statistica
» Compararea mediilor


Compararea mediilor


Compararea mediilor

Am prezentat pana acum un test popular (hi-patrat) care este folosit frecvent pentru analizarea legaturii dintre doua variabile de nivel nominal si am discutat apoi despre un alt test (coeficientul de corelatie r, a lui Pearson) destinat examinarii relatiei dintre doua variabile de nivel interval sau de rapoarte. In acest capitol, vom examina unul dintre testele statistice potrivite atunci cand una din variabile, de obicei cea dependenta, este cel putin de nivel interval iar cealalta variabila, de obicei variabila independenta, este de nivel nominal.

1. Popularitatea statisticii t

Exista cateva feluri diferite de teste proiectate pentru diferite necesitati de analizare a informatiilor. Vom prezenta doar unul dintre acestea. Testul t este foarte popular si in special foarte folositor pentru cercetarea in asistenta sociala.

Ce il face pe testul t (numit si testul Student) atat de folositor? Una dintre cele mai mari nevoi pentru asistenti sociali este in acele studii care cauta evaluarea eficacitatii diferitelor abordari ale interventiei. Avem nevoie sa stim daca o metoda de interventie este in mod real mai buna decat alta pentru obtinerea rezultatelor dorite. Testul t este ideal pentru a fi folosit in situatii in care avem doua categorii a unei variabile independente (interventia A / interventia B) care este de nivel nominal, pe cand variabila dependenta (comportamentul, atitudinea, valoarea sau orice altceva) pe care speram sa o gasim afectata, este cel putin de nivel interval.



Deobicei avem masuratori rezonabil de precise ale variabilei dependente. Exemplele pot include variabile ca: respectul de sine, aspiratia catre bunastare, satisfactia maritala, nivelul de functionare sociala, sau alte caracteristici ale clientului. Multumita muncii cercetatorilor care au imbunatatit instrumentele pentru aceste masurari, acum aceste variabile pot fi tratate statistic, ca fiind masurate la nivel interval. Alte variabile dependente frecvent folosite ca: numarul intalnirilor ratate, numarul impotrivirilor exprimate fata de un program de bunastare sociala, sau numarul comportamentelor violente indreptate catre sotie, sunt de nivel interval sau de rapoarte datorita naturii lor. Daca putem justifica o variabila ca fiind de nivel interval sau de rapoarte si cealalta variabila este doar de nivel nominal, t poate fi ales ca test statistic.

Alt motiv pentru care cercetatorii in asistenta sociala adesea folosesc testul t, este dimensiunea relativ mica a esantionului necesar pentru utilizarea acestui test. Esantioanele mari sunt rar disponibile in cercetarea in asistenta sociala, in special in situatii clinice. Testul t este potrivit pentru cercetarile care folosesc un numar mic de cazuri (de exemplu, un total de doar 20 sau 30 de cazuri). In plus cele doua grupuri nu trebuie neaparat sa contina un numar egal de cazuri. Chiar si in cercetarile planificate cu mare grija, de exemplu cele asupra eficacitatii unui tratament, exista oameni care renunta inainte ca studiul sa fie terminat. Aceasta conduce la o situatie in care exista mai multe cazuri intr-un grup decat in altul. Discrepanta dintre dimensiunea celor doua grupuri este automat controlata de formula lui t.

2. Logica statisticii t

Testul t, asemenea altor teste statistice, este folosit pentru a ne ajuta sa determinam daca o legatura aparenta dintre doua variabile este o legatura adevarata, care exista in interiorul populatiei, sau este rodul sansei. Cu t, se face de fapt o comparare intre doua medii. Esantionul este divizat in doua grupuri (sub-esantioane) pe baza valorii fiecarui caz pentru una din cele doua categorii, variabila de nivel nominal (de exemplu, interventia A sau interventia B). Marimile mediilor variabilei de nivel interval (sau de rapoarte) pentru cele doua grupuri sunt comparate apoi folosind formula lui t.

Mediile celor doua subesantioane sunt probabil diferite; t este o analiza a marimii acestei diferente. Daca diferenta se dovedeste ca fiind mica din punct de vedere matematic, atat de mica incat hazardul ar putea fi explicatia probabila pentru aceasta diferenta, ipoteza nula nu va putea fi respinsa. Vom putem atunci concluziona ca, mult mai probabil, diferenta dintre mediile celor doua grupuri se datoreaza sansei si nu reflecta o diferenta reala care ar exista in populatie. Dar daca testul nostru t, indica faptul ca diferenta este destul de mare ca ea sa nu fie explicata doar prin jocul sansei, vom fi abilitati sa respingem ipoteza nula si sa concluzionam ca diferenta observata in esantion este intr-adevar o reflectare a unei diferente reale in interiorul populatiei. Sansa, sub forma erorii de esantionare, va fi eliminata ca explicatie pentru o legatura observata intre doua variabile.

Daca esantionul este mic, chiar si o diferenta mare intre doua medii poate fi atribuita sansei. Dar exista un punct unde diferenta dintre doua medii este suficient de mare, astfel ca sansa sa fie putin probabil, o explicatie pentru legatura aparenta dintre doua variabile. Unde poate fi gasit acest punct? Testul t ni-l spune. Acest punct se determina sub forma unei probabilitati statistice, probabilitatea de a face o eroare de tipul I, adica de a respinge ipoteza nula si de a concluziona ca diferenta dintre cele doua medii este legata de prezenta valorilor diferite pentru variabila secundara (cea de nivel nominal).

Sa luam un exemplu pentru a ilustra utilizarea lui t. Un ghid teoretic de studiu a fost realizat pentru a ajuta la pregatirea absolventilor pentru examenul de licenta. Pentru a evalua rezultatele unui asemenea ghid de studiu, putem selecta la intamplare 15 din 30 de studenti care au planificat sa participe la examen si carora le vom furniza o copie a acestui ghid. Le vom da astfel cateva directii specifice pentru a‑si imparti timpul de studiu, fiecare putand folosi ghidul ca indrumator.

Cei 15 studenti care au folosit ghidul vor putea fi priviti ca un grup experimental, ramanand 15 care nu au folosit ghidul si care vor fi priviti ca si grup de control. Dupa ce cei 30 de absolventi vor reusi sa promoveze examenul de licenta, rezultatele lor vor fi comparate. Nu vom compara direct notele tuturor acelora care au folosit ghidul de studiu cu notele celor care nu l-au folosit. In schimb vom compara media notelor rezultate pentru cei 15 absolventi din grupul experimental cu media notelor celorlalti 15 absolventi din grupul de control.

Odata cu compararea marimilor celor doua medii, este necesar sa ne punem cateva intrebari:

Este oare diferenta dintre mediile celor doua grupuri suficienta pentru a ne permite sa respingem ipoteza nula, care spune ca nu exista nici o legatura intre folosirea respectiv nefolosirea ghidului de studiu si rezultatele lor la examen?

Cat de increzatori putem fi, pentru a spune ca diferenta nu s-a datorat erorii de esantionare? Altfel spus, este posibil ca diferenta dintre mediile celor doua grupuri sa reflecte o asociere reala intre cele doua variabile?

Cu ajutorul testului t putem compara marimile celor doua medii, folosind o formula matematica conceputa pentru a ne spune daca diferenta dintre marimile mediilor celor doua grupuri este suficient de mare pentru ca legatura dintre cele doua variabile sa fie putin probabila din cauza sansei. Testul t ne spune daca ipoteza nula poate fi respinsa si daca exista suport statistic pentru a sustine ca ghidul de studiu poate in mod real imbunatati rezultatele la examen. Desigur, chiar daca se demonstreaza ca exista o legatura statistic semnificativa intre cele doua variabile, va mai trebui sa decidem daca legatura este una substantiala. Diferenta rezultata din examinare este suficient de mare ca sa justifice pretul de achizitie a ghidului de studiu?

3. Calcularea si interpretarea valorilor lui t

Datorita extinderii utilizarii calculatoarelor, aflarea lui t nu mai este o problema in ceea ce priveste calculul matematic. Acest fapt este o usurare, deoarece formula lui t este complexa si va implica o cantitate considerabila de timp daca se lucreaza cu creionul si hartia. In plus, exista mai multe variante de formule de calcul a valorii t in functie de natura esantioanelor: daca avem doua esantioane diferite de subiecti (Independent Samples t Test) sau in cazul acelorasi subiecti la momente diferite de timp (Paired Sample Test).

Testul t pentru esantioane independente

Ana lucreaza ca asistent social intr-un program de preventie privind infectia cu HIV - SIDA. In calitate de coordonator de program, pregateste doua echipe de voluntari pentru implementarea programului intr-una din scolile profesionale din oras. Una dintre echipe va utiliza metode de informare indirecta, prin distribuirea de pliante si brosuri elevilor, iar cealalta echipa va folosi metode interactive, respectiv discutii si activitati de grup directe cu clasele de elevi. Dupa implementarea programului, ea evalueaza rezultatele activitatilor de preventie, incercand sa afle daca una dintre metodele folosite a fost mai eficienta decat cealalta, cu alte cuvinte daca exista diferente intre cunostintele elevilor privind riscurile infectiei cu HIV in functie de modalitatea de preventie folosita. In acest sens, utilizeaza un proces de selectie separat a elevilor in functie de metoda de preventie utilizata (adica fiecare esantion in parte este semnificativ pentru variabila "nivel de informare privind riscurile infectiei cu HIV") si le aplica un test de cunostinte, al carui scor minim este 0, iar cel maxim 10. Rezultatele obtinute sunt urmatoarele: pentru primul esantion: 5, 7, 8, 9, 6, 7, 10, 8, 6; pentru al doilea esantion: 9, 10, 8, 6, 8, 7, 9. Pentru a raspunde la aceasta intrebare, se aplica testul t, calculandu-se mai intai m1, m2, s1 si s2 (mediile si abaterile standard ale rezultatelor obtinute la testul de cunostinte aplicat elevilor din cele doua esantioane), iar apoi valoarea lui t, dupa formula:

Cele doua medii m1 si m2 sunt:

Pentru a calcula s1 si s2, ne este de ajutor constructia urmatorului tabel:

72

Acum putem calcula numitorul formulei lui t:

si

Pentru determinarea nivelului de probabilitate a valorii t obtinuta se procedeaza astfel:

Se calculeaza gradele de libertate (df) dupa formula

df = N - 2

In Tabelul 1 cuprinzand "valorile critice ale lui t", se cauta linia corespunzatoare gradelor de libertate df (afisate pe prima coloana a tabelului).

Se compara valoarea t obtinuta (valoarea absoluta, netinand cont de semnul valorii) cu valorile tabelate fie pentru testul directionat (one-tailed), fie pentru cel nedirectionat (two-tailed), in functie de tipul ipotezei de cercetare.

In esantionul din exemplu, valoarea lui t este -1,09, la 14 grade de libertate (df = 16 - 2 = 14). Intrebarea este: 'Care e probabilitatea de a comite o eroare de tipul I cu o valoare a lui t de -1,09, la 14 grade de libertate date?' Pentru a raspunde la aceasta intrebare, avem nevoie sa consultam tabelul de probabilitati al valorilor t (Tabelul 1). Daca valoarea t calcuata este mai mare decat valoarea critica de 2.145 (corespunzator la 14 grade de libertate), nivelul de semnificatie p va fi mai mic decat 0.05 pentru o ipoteza nedirectionata si decat 0.025 pentru o ipoteza directionata, deci se va respinge ipoteza nula.

In exemplul nostru, valoarea t este statistic nesemnificativa, atat pentru un test cu o ipoteza nedirectionata (two-tailed), cat si pentru un test directionat (one-tailed), deoarece 1.09 este mai mic decat 2.145.

Interpretare: De vreme ce 1.09 < 2.145, Ana accepta ipoteza nula si concluzioneaza ca nu exista diferente in capacitatea unei metode de preventie de a duce la cunostinte mai solide privind riscul infectiei cu HIV in randul elevilor. Rezultatele obtinute i-au aratat Anei ca nu exista suport statistic pentru ipoteza sa, in ciuda faptului ca valoarea medie a grupului de elevi cu care s-a lucrat prin metode indirecte indica un nivel de cunostinte mai redus decat media grupului elevilor care au participat la activitati interactive. Imposibilitatea de a respinge ipoteza nula releva ca metoda de preventie folosita produce mici diferente intre cunostintele elevilor despre riscurile contaminarii cu HIV. Fireste, Ana si-a pus intrebarea daca ipoteza de cercetare (aceea a diferentelor intre cunostintele elevilor in functie de metoda folosita) poate fi inca corecta. S-ar putea ca adevarata legatura dintre variabila dependenta (cunostintele dobandite in urma programului de preventie) si cea independenta (metoda de preventie folosita) sa fi fost ascunsa de tehnica masuratorilor sau de influenta altor variabile (de exemplu, experienta mai mare a voluntarilor care au aplicat metode interactive). Ana este constienta ca sunt necesare studii suplimentare pentru a clarifica acest aspect. In orice caz, pornind de la rezultatele acestui mini studiu, ea va stabili daca, pe viitor, va pastra folosirea unor metode diferite de preventie de la un grup de elevi la altul sau va merge pe combinarea metodelor de lucru indirecte cu cele directe. Cum rezultatele acestui studiu nu justifica deocamdata realizarea unor schimbari in modul de implementare a programului de preventie la elevi, Ana va continua punerea in aplicare a acestuia, pana cand rezultatele cercetarilor ulterioare ii vor furniza un raspuns mai transant la intrebarea sa.

Tabelul 1 Valori Critice pentru testul t

Nivele de semnificatie pentru testul directionat (one-tailed)

0.10 0.05 0.025 0.01 0.005 0.0005

Nivele de semnificatie pentru testul nedirectionat (two-tailed)

df 0.20 0.10 0.05 0.02 0.01 0.001

1 3.078 314 12.706 31.821 63.657 63619

2 1.886 2.920 4.303 965 9.925 31.689

3 1.638 2.353 3.182 4.541 5.841 12.941

4 1.533 2.132 2.776 3.747 4.604 8.610

5 1.476 2.015 2.571 3.365 4.032 859

6 1.440 1.943 2.447 3.143 3.707 5.959

7 1.415 1.895 2.365 2.998 3.499 5.405

8 1.397 1.860 2.306 2.896 3.355 5.041

9 1.383 1.833 2.262 2.821 3.250 4.781

 1.282 1.645 1.960 2.326 2.576 3.291

Valoarea t obtinuta din calcule este semnificativa daca ea este mai mare sau egala cu valoarea listata in tabel

Testul t pentru esantioane perechi

Testul t se poate utiliza pentru evaluarea de pilda a impactului unui program de interventie asupra unei trasaturi a populatiei cuprinse in esantion (atitudine, comportament, caracteristica psiho-sociala, etc.). Valoarea lui t se calculeaza pe baza mediei diferentelor dintre valorile variabilei respective inainte de interventie, respectiv dupa interventie. Valoarea lui t exprima "succesul" interventiei, adica masura in care, in medie, valorile variabilei respective s-au modificat. Modul de calcul difera insa fata de cel de la esantioanele independente, dar programul PACHETUL STATISTIC PENTRU STIINTELE SOCIALE trateaza, din fericire, toate variantele de calcul.

unde mD este media distributiei D (a diferentelor dintre cele doua masurari), iar sD este abaterea standard a distributiei D (masoara imprastierea distributiei D).

Exemplu: Doriti sa aflati daca in urma participarii la un grup de suport pentru mamele singure, nivelul de stres al celor 8 participante s-a redus. Aplicand acelasi chestionar care masoara nivelul de stres inainte si dupa 6 luni de participare la grupul de suport, obtineti rezultatele din tabelul urmator. Aplicati testul t, situandu-va la un nivel de semnificatie de .0.01.

Inainte de program

(X1)

Dupa program

(X2)

D

(X2 - X1)

D - mD

(D - mD)2

N

mD= - 0.5

Introducem valorile astfel obtinute in formula de mai sus si obtinem:

De retinut: In privinta procedurii statistice, nu conteaza care diferenta o utilizam, X1 - X2 sau X2 - X1. Depinde de ceea ce dorim sa determinam. Important este ca, in final, sa interpretam corect rezultatul obtinut, tinand cont de semnul diferentei si de semnificatia concreta a acestuia. Totusi, in modele de tipul "inainte/ dupa" (tratament, interventie), este mai potrivita utilizarea diferentei X2 - X1.

Interpretare: Comparam t calculat (in valoare absoluta) cu valoarea critica la nivelul de semnificatie 0.01, pentru o ipoteza nedirectionata (nu am specificat directia legaturii dintre variabile) si la 7 grade de libertate (df = N-1 = 8-1 =7) si observam ca 2.08 < 3.49. Deoarece probabilitatea de a obtine un nivel de stres mai redus ca urmare a sansei este mai mare decat nivelul pe care ni l-am propus drept criteriu de decizie (adica mai mica de 1%), acceptam ipoteza nula. In acest caz, datele noastre nu sprijina ipoteza cercetarii, ca urmare nu putem accepta ca efectul obtinut se datoreaza participarii la grupul de suport. In concluzie, grupul de suport nu reduce in mod semnificativ nivelul de stres al participantelor.

4. Prezentarea statisticii t

De obicei este util a prezenta marimile brute ale cazurilor in ambele grupuri (daca esantionul nu este prea mare) astfel ca cititorii sa poata face propriile comparari. Daca nu dorim sa raportam rezultatele individuale, vom prezenta cel putin rezultatele medii pentru fiecare grup. Trebuie retinut ca diferenta actuala intre medii ajuta cititorul in a determina daca o legatura semnificativ statistica este in mod real un rezultat esential. Astfel vor mai fi prezentate pe langa valoarea lui t, gradul de libertate (df) si valoarea probabilitatii p asociate. Daca se realizeaza mai multe teste t, este folositor un singur tabel care sa contina toate rezultatele obtinute. Daca sunt calculate doar putine teste t, rezultatele sunt de obicei prezentate in corpul textului, mai degraba decat intr-un tabel.

In majoritatea studiilor statistice, se raporteaza atat analizele care nu au permis respingerea ipotezei nule, cat si cele care au permis-o. In unele cazuri este suficient sa se raporteze ca nu s-a gasit ca variabilele ar fi legate la un nivel statistic semnificativ. In situatiile in care ipoteza nula este ipoteza centrala a cercetarii (adica, incercam sa dovedim ca falsa o legatura care in mod obisnuit este considerata ca fiind adevarata), suportul statistic sau nesprijinirea pentru respingerea ipotezei nule trebuie, fireste, sa fie prezentat.

5. Cand nu se foloseste testul t

Ca si testul hi-patrat, popularitatea testului t printre asistentii sociali ne poate conduce la utilizari gresite. In graba noastra de a folosi o statistica care ne este familiara, putem folosi cateodata testele t in situatii in care ele nu sunt corespunzatoare si in care ar fi putut fi utilizate alte teste mai potrivite. De obicei cand testul t este folosit gresit avem una din urmatoarele situatii: (1) cand ignoram forma distributiei pentru variabila de nivel interval in populatie si (2) cand nu suntem atenti la analizarea corecta a informatiilor, incercand sa prezentam un rezultat socant.

Forma distributiei

Faptul ca variabila independenta este de nivel interval si ca cea dependenta este de nivel nominal nu justifica folosirea lui t pentru a determina prezenta unei legaturi intre doua variabile. Testul t este un test din categoria celor parametrice, ceea ce inseamna ca este proiectat pentru a fi folosit doar cand variabila de nivel interval este considerata a fi normal distribuita in populatie. Daca distributia de frecvente pentru valorile variabilei in populatie este vizibil asimetrica, va trebui folosit un alt test, ca de pilda, testul Mc Neamar, testul exact Ficher, testul Man-Whitney, etc. Credibilitatea rezultatelor cercetarii este serios periclitata daca testul t este folosit cu variabile de nivel interval sau rapoarte care nu se prezinta ca o curba normala.

Abordarea socanta

O a doua greseala obisnuita implica calcularea in serie a testelor t, cu o singura variabila dependenta legata eventual de mai multe variabile independente. In cateva exemple particulare ale acestei erori, cercetatorii au calculat testele t folosind sute de posibile variabile independente (fara prea mare legatura), doar pentru a anunta cu mandrie ca ei au gasit o legatura semnificativ statistica intre una dintre variabilele independente si variabila dependenta.

Teoria probabilitatilor sugereaza ca astfel de rezultate reflecta probabil erori de Tipul I si ca legatura aparenta va fi legata de sansa si nimic mai mult. Conform legilor probabilitatii, o variabila dependenta va parea ca are o asociere semnificativ statistica cu cateva variabile independente daca sunt testate suficiente legaturi. In situatiile unde exista motive sa credem ca mai multe variabile independente diferite pot fi in legatura cu variabila dependenta, ar trebui sa folosim alte teste statistice, special proiectate pentru astfel de situatii.

Un exemplu

Descrierea situatiei care genereaza un studiu

Florin este un asistent social intr-un centru de planificare familiala. El a fost invatat in agentia sa ca cea mai buna forma pentru consilierea maritala este de a intalni ambii parteneri (sotul si sotia) impreuna. Inainte cu cinci ani, a tratat 20 de cupluri in care consilierea nu s-a putut realiza decat individual (sot sau sotie), din cauza programului pe care il aveau acestia la serviciu. El a fost surprins observand ca, desi ei nu au consiliati niciodata impreuna, dupa primele interviuri, toate cele 20 de cupluri pareau sa realizeze un progres excelent in rezolvarea problemelor lor maritale.

De-a lungul a catorva ani, Florin a consiliat tot mai multe cupluri pe o baza individuala. Crezand ca a obtinut rezultatele bune datorita metodei folosite, el a incurajat sase dintre colegii sai sa consilieze cuplurile cu dificultati maritale, intalnindu-i separat mai degraba decat impreuna. Alti asistenti sociali au fost de asemenea surprinsi de progresele excelente ale clientilor lor. Florin nu a fost pregatit sa concluzioneze ca metoda de consiliere maritala individuala este preferabila consilierii cuplului. El a decis sa realizeze o mica cercetare pentru a vedea daca poate gasi suport statistic pentru ipoteza ca satisfactia maritala este cel mai bine sporita cand partenerii sunt tratati in consiliere individuala si nu de cuplu.

Ipotezele care vor fi testate

A inceput sa caute in literatura de specialitate de asistenta sociala si a gasit suport pentru afirmatia conform careia consilierea in cuplu este mai adecvata in obtinerea satisfactiei maritale, decat cea individuala. Dar cum s-a aventurat in literatura de specialitate din alte domenii ca psihologia si consilierea pastorala, Florin a gasit o cantitate mare de suport pentru ideea ca satisfactia maritala ar fi mult mai probabil sa rezulte din consilierea individuala. Explicatia cea mai uzitata era ca persoanele consiliate tind sa discute despre insatisfactie mai usor si mai cinstit atunci cand celalalt sot nu este prezent. Florin a concluzionat ca literatura de specialitate era in contradictie. Totusi, el a simtit ca propriile observatii si cele ale colegilor sai au fost suficiente pentru a justifica o ipoteza directionala:

Printre clientii care a beneficiat de consiliere maritala, aceia care au fost consiliati individual vor reflecta un nivel mai inalt de satisfactie maritala decat cei care au fost consiliati in cuplu.

O privire asupra metodologiei

Florin a realizat o mica cercetare pentru a-si testa ipoteza. El a primit permisiunea din partea directorului agentiei de a-i fi repartizati la intamplare clientii noi care au cerut consiliere maritala pe o perioada de trei luni pentru a realiza consiliere individuala sau de cuplu. Pentru a realiza cercetarea, clientii au fost repartizati la intamplare in doua grupuri de subiecti. Toti cei sase asistenti sociali care au folosit anterior consilierea individuala (si care, deci, aveau experienta) au participat ca si consilieri la studiul lui Florin. Incepand cu luna urmatoare, fiecare cuplu care era de acord a fost repartizat la unul dintre cei sase asistenti sociali pentru a participa impreuna la o consiliere de 50 de minute pe saptamana; cuplurile care au ramas au fost repartizate pentru consiliere individuala, timp de 25 de minute in fiecare luna. Cei care nu au fost de acord cu acest aranjament au fost de asemenea tratati, dar nu au mai fost inclusi ca subiecti in acest studiu.

Metoda de consiliere (individuala sau in cuplu) a fost variabila independenta. S-a decis ca variabila dependenta, satisfactia maritala, va trebui masurata dupa zece saptamani consecutive de consultanta. A fost aleasa o scala pentru a masura gradul satisfactiei maritale, ea fiind adaptata pentru a produce informatii de nivel interval.

Paisprezece cupluri au fost vazute in sesiuni de consiliere individuala si paisprezece au fost vazuti ca si cuplu. Toti clientii au completat scala satisfactiei maritale. Florin a comparat marimea mediei scalei pentru clientii care au fost vazuti individual (grupul experimental) cu marimea mediei scalei pentru clientii care au fost vazuti ca si cuplu (grupul de control). Variabila 'satisfactie maritala' masurata pe scala a fost gasita ca fiind normal distribuita, deci Florin s-a simtit in masura sa foloseasca testul t pentru analiza statistica. El a incercat sa determine daca diferenta dintre marimile mediei (pentru cele doua grupuri) a fost suficient de mare pentru a-i permite sa respinga ipoteza nula. El a dorit sa fie capabil sa concluzioneze ca o legatura reala dintre doua variabile a fost probabil explicatia pentru diferentele observate in esantion.

Rezultatele

Valoarea lui t pentru informatiile lui Florin, a fost de 1.312 . Din tabelul valorilor critice ale lui t (Tabelul 1), el a observat ca ar fi avut nevoie de o valoare minima a lui t de 1.706 pentru a putea respinge ipoteza nula (pornind de la o ipoteza directionala si folosind o statistica semnificativa la nivelul 0.05, un esantion de 28 indivizi statistici si 26 de grade de libertate).

Interpretarea rezultatelor si tragerea concluziilor

Florin a notat ca daca ar fi respins ipoteza nula pe baza informatiilor lui, ar fi desconsiderat mai mult decat 1 din 10 (10 procente) sanse in comiterea unei erori de Tip I. El avea in mod clar o lipsa de suport statistic pentru ipoteza sa. Dezamagirea lui initiala a fost chiar si mai mare atunci cand a privit marimile mediilor celor doua grupuri. Clientii care au participat la consiliere individuala au avut media cu ceva mai mica decat cei care au fost consiliati impreuna. Florin a privit rezultatele sale cu mai multa obiectivitate. Astfel, el a realizat ca lipsa argumentului statistic pentru legatura dintre metoda de consiliere si satisfactia maritala poate fi un rezultat folositor pentru sine insusi. Imposibilitatea de a respinge ipoteza nula poate fi interpretata in termenii existentei unei diferente prea mici determinate de metoda de consiliere folosita.

Florin si-a pus, de asemenea, problema cum de a putut gresi. Rezultatele cantitative din studiul sau au fost inconsistente in ceea ce priveste impresiile anterioare. El s-a intrebat daca el sau alti asistenti sociali nu cumva au perceput doar ca consilierea individuala facuta de ei duce la rezultate superioare, pentru ca ei au fost surprinsi ca ceilalti clienti consiliati in cuplu au putut obtine rezultate superioare. Fireste el s-a intrebat daca ipoteza sa poate fi inca corecta. S-ar putea ca adevarata legatura dintre variabila dependenta si cea independenta sa fi fost ascunsa de tehnica masuratorilor sau de influenta altor variabile (de exemplu, experienta mare a asistentilor sociali care au efectuat consilierea in cuplu). Florin a concluzionat ca sunt necesare studii suplimentare pentru a clarifica aceasta situatie.

7. Folosirea PACHETUL STATISTIC PENTRU STIINTELE SOCIALE in compararea mediilor

Vom face o aplicatie PACHETUL STATISTIC PENTRU STIINTELE SOCIALE pentru acest test, folosind fisierul de date "1991 US General Social Survey". Dorim sa testam daca exista o diferenta semnificativa intre femei si barbati in ceea ce priveste nivelul educational atins, masurat in numarul total de ani de studiu absolviti. Nivelul educational al respondentilor este dat de variabila educ. Alegem secventa de optiuni: Statistics - Compare Means - Independent Sample T Test. Ultima optiune deschide o fereastra de dialog in care specificam variabila ale carei medii dorim sa le testam (Test Variable - educ) si variabila care ne da cele doua subpopulatii - in acest caz sexul (Grouping Variable, Define groups, in care trecem codurile celor doua sexe: 1 pentru barbati si 2 pentru femei). De asemenea, la Options specificam nivelul de incredere dorit (vom folosi 95%). Iata ce ne afiseaza programul PACHETUL STATISTIC PENTRU STIINTELE SOCIALE:

T-TEST

GROUPS=sex(1 2)

/MISSING=ANALYSIS

/VARIABLES=educ

/CRITERIA=CIN(.95) .

T-Test

Ca de obicei, apare sintaxa corespunzatoare optiunilor din meniu folosite. In tabelul urmator apar valorile mediilor variabilei "nivelul educational al respondentului" pentru cele doua populatii (din esantion), abaterile standard si erorile standard corespunzatoare. Ultimul tabel este cel care prezinta rezultatele testului de semnificatie. In primele doua coloane avem valori pentru testarea egalitatii variantelor distributiilor variabilei pentru cele doua populatii, sau altfel spus, similaritatea omogenitatii celor doua distributii, folosind testul F[1]. Aici cele doua distributii sunt semnificativ diferite (p=0.001 sau P=99.9%); in consecinta, vom citi valorile de pe randul de jos, calculate pentru variante semnificativ diferite ale celor doua distributii. Valoarea lui t este 3.824, la nivelul de semnificatie p=0.000, ceea ce inseamna ca sunt 99.99% sanse ca diferenta sa fie reala. De asemenea, daca ne uitam la intervalul de confidenta pentru diferenta mediilor - Confidence Interval of the (Mean) Difference, observam ca nu contine valoarea 0, deci nu este posibil ca diferenta mediilor sa fie 0, adica mediile sa fie egale. Asadar, exista o diferenta semnificativa intre femei si barbati, la nivelul populatiei, in ceea ce priveste numarul de ani de scoala absolviti (barbatii au, in medie, mai multi ani de scoala decat femeile: mediile lor sunt 13.23, respectiv 12.63).

Nota: In cazul esantioanelor perechi, procedura PACHETUL STATISTIC PENTRU STIINTELE SOCIALE este urmatoarea: din meniul Statistics, Compare Means, Paired-Sample T test. Introducem variabilele pe care le testam in rubrica Grouping Variables.

8. Intrebari pentru studiu

Care este combinatia de nivele de masurare a variabilelor utilizate in testul t?

De ce dimensiunile cerute de testul t pentru volumul esantionului si a subesantioanelor il fac ideal pentru cercetarile in asistenta sociala?

Daca ipoteza nula este corecta, valoarea medie a variabilei din esantion va fi similara sau foarte diferita de valoarea medie a variabilei din celalalt esantion?

Cum se determina gradele de libertate pentru statistica t, intr-un set de date concrete?

Ce pas suplimentar este necesar in a determina daca o valoare t semnificativa din punct de vedere statistic ofera suport pentru o ipoteza directionata?

Cum poate un test t care nu a gasit o valoare semnificativa statistic sa reflecte un rezultat care sa fie util pentru un practician?

9. Tema pentru acasa

Deschideti fisierul PACHETUL STATISTIC PENTRU STIINTELE SOCIALE "1991 U.S. General Social Survey". Comparati numarul mediu de copii pe care ii au albii si negrii in Statele Unite (variabilele "childs" si "race").

Pornind de la fisierul de date "1991 US General Social Survey", testati in programul PACHETUL STATISTIC PENTRU STIINTELE SOCIALE, daca exista o diferenta semnificativa intre femei si barbati in privinta prestigiului ocupational (variabile prestg80). Comentati rezultatele obtinute.



Puteti afla mai multe despre testul F din lucrarea "Metode statistice aplicate in stiintele sociale" (2000), Rotariu T. (coord.), Ed. Polirom, Iasi, pp. 102-10





Politica de confidentialitate





Copyright © 2024 - Toate drepturile rezervate

Statistica


Statistica






termeni
contact

adauga