Zadaci iz korelacije i regresije

9
http://www.psiholozi.net/statistika Vežbe 14 Zadatak 1: U fajlu D:\statistika\podaci\gzptbu.sav nalaze se, između ostalog, podaci o društvenosti (varijabla drus) i emocionalnoj uravnoteženosti (varijabla eu) slučajnog uzorka studenata. Grafički prikazati vezu između društvenosti i emocionalne uravnoteženosti; Izračunati kovarijansu između društvenosti i emocionalne uravnoteženosti; Izračunati koeficijent linearne korelacije između društvenosti i emocionalne uravnoteženosti; Testirati statističku značajnost koeficijenta linearne korelacije. Iscrpan opis procedura koje je potrebno izvesti radi dobijanja traženih vrednosti može se pronaći u Vežbama 08. Pošto kreiramo skater dijagram dvostrukim klikom na njega ulazimo u Chart Editor, a potom u meniju Chart biramo Options. U prozoru dijaloga Scatterplot Options u okviru Fit Line uključujemo opciju Total, a zatim klikom na dugme Fit Options i po otvaranju poddijaloškog prozora Scatterplot Options: Fit Line potvrđujemo Linear regression metod. 1

description

Zadaci iz korelacije i regresije

Transcript of Zadaci iz korelacije i regresije

Page 1: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14

Zadatak 1:

U fajlu D:\statistika\podaci\gzptbu.sav nalaze se, između ostalog, podaci o društvenosti (varijabla drus) i emocionalnoj uravnoteženosti (varijabla eu) slučajnog uzorka studenata.

♦ Grafički prikazati vezu između društvenosti i emocionalne uravnoteženosti; ♦ Izračunati kovarijansu između društvenosti i emocionalne uravnoteženosti; ♦ Izračunati koeficijent linearne korelacije između društvenosti i emocionalne

uravnoteženosti; ♦ Testirati statističku značajnost koeficijenta linearne korelacije.

Iscrpan opis procedura koje je potrebno izvesti radi dobijanja traženih vrednosti može se pronaći u Vežbama 08. Pošto kreiramo skater dijagram dvostrukim klikom na njega ulazimo u Chart Editor, a potom u meniju Chart biramo Options. U prozoru dijaloga Scatterplot Options u okviru Fit Line uključujemo opciju Total, a zatim klikom na dugme Fit Options i po otvaranju poddijaloškog prozora Scatterplot Options: Fit Line potvrđujemo Linear regression metod.

1

Page 2: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14 Dakle, dobijamo:

Vidimo da između dveju varijabli postoji umereno izražena pozitivna korelacija. Takođe, broj predstavljenih parova mera na skater dijagramu je manji od broja ispitanika u uzorku, tako da ovom dijagramu nedostaje neka vrsta treće dimenzije koja bi pokazala koliko se pojedinačnih slučajeva krije iza svakog kvadratića.

Kovarijansa iznosi 12.798, koeficijent linearne korelacije 0.361 i statistički je značajan na nivou 0.01.

2

Page 3: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14 Zadatak 2:

Fajl isti kao za zadatak 1.

♦ Napraviti linearni regresioni model za predviđanje društvenosti na osnovu emocionalne uravnoteženosti studenata;

♦ Napraviti linearni regresioni model za predviđanje emocionalne uravnoteženosti na osnovu društvenosti studenata;

♦ Izračunati koeficijent linearne korelacije između društvenosti i emocionalne uravnoteženost samo korišćenjem nestandardizovanih regresionih koeficijenata za predviđanje emocionalne uravnoteženosti na osnovu društvenosti studenata i za predviđanje društvenosti na osnovu emocionalne uravnoteženosti studenata;

♦ Izračunati koeficijent linearne korelacije između društvenosti i emocionalne uravnoteženost samo korišćenjem standardizovanih regresionih koeficijenata za predviđanje emocionalne uravnoteženosti na osnovu društvenosti studenata i za predviđanje društvenosti na osnovu emocionalne uravnoteženosti studenata.

Procedura: Analyze Regression Linear. U polje Dependent unosimo društvenost kao kriterijumsku varijablu, a u polje Independent(s) unosimo emocionalnu uravnoteženost kao prediktorsku varijablu.

3

Page 4: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14 Ispis iz prve procedure izgleda ovako:

Procedura: Analyze Regression Linear. U polje Dependent unosimo emocionalnu uravnoteženost kao kriterijumsku varijablu, a u polje Independent(s) unosimo društvenost kao prediktorsku varijablu.

4

Page 5: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14 Ispis iz druge procedure izgleda ovako:

Prva tablica, Model Summary, u oba ispisa ima identične vrednosti koeficijenata koje proističu iz njihove simetričnosti. Naime:

prva vrednost u nizu, a to je koeficijent multiple korelacije u oznaci R, isto je što i koeficijent linearne korelacije i u datom primeru iznosi 0.361;

druga vrednost u nizu, koeficijent multiple determinacije, pokazuje koliko procenata ukupne varijanse jedne varijable možemo da objasnimo razlikom u vrednostima druge varijablom, dakle 13% na uzorku;

treća vrednost u nizu jeste korigovani koeficijent multiple determinacije i isto je što i koeficijent multiple determinacije ali za populaciju.

Druga tablica, ANOVA, sadrži test značajnosti koeficijenta linearne korelacije. Suma kvadrata za regresiju (Regression) i suma kvadrata reziduala (Residual) podeljeni njima pripadajućim stepenima slobode (za regresiju df=m i za reziduale df=n-m-1) daju prosečne kvadrate odstupanja (Mean Squares), a njihov količnik F – statistik. U koloni Sig stoji verovatnoća da se na slučajnom reprezentativnom uzorku date veličine dobije toliki ili veći F – statistik ako je nulta hipoteza tačna. Treća tablica, Coefficients, sadrži vrednosti nestandardizovanih (B) i standardizovanih (BETA) regresionih koeficijenata. Količnik B/SEB daje T – statistik, a u koloni Sig su rezultati testiranja regresionih koeficijenta. Constant je intercept (odsečak) na Y-osi, tj. vrednost kriterijumske varijable kada je vrednost prediktorske varijable jednaka nuli. Logično, za standardizovane vrednosti nemamo intercept.

5

Page 6: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14 Dakle, regresioni koeficijent predstavlja nagib prave povučene kroz dijagram raspršenja tačaka (definisanih koordinatama prediktorske varijable i empirijskih vrednosti kriterijumske varijable) pomoću metode najmanjih kvadrata tako da najbolje aproksimira dati raspored tačaka i predstavlja:

♦ u slučaju nestandardizovanih vrednosti – za koliko se mernih jedinica prosečno menja skor na kriterijumskoj varijabli kada se skor na prediktorskoj varijabli promeni za jednu mernu jedinicu;

♦ u slučaju standardizovanih vrednosti – za koliko se standardnih devijacija prosečno menja skor na kriterijumskoj varijabli kada se skor na prediktorskoj varijabli promeni za jednu standardnu devijaciju.

Koeficijent linearne korelacije jednak je geometrijskoj sredini koeficijenata b (za predviđanje x na osnovu y i za predviđenje y na osnovu x) i iznosi:

1. r = √(byx * bxy) = √(0.344 * 0.378) = 0.361 – za nestandardizovane koeficijente 2. r = b* = 0.361 – za standardizovane koeficijente

Naše regresione jednačine izgledaju ovako:

1. drus = 12.878 + 0.378 * eu 2. eu = 8.372 + 0.344 * drus

Ukoliko bi ispitanik npr. na varijabli emocionalna uravnoteženost uzeo vrednost 10 predviđena društvenost bila bi 16.658 (empirijske vrednosti na uzorku iznose 4, 5, 7, 8, 10, 10, 10, 11, 12, 12, 13, 14, 16, 16, 16, 17, 20, 20, 21, 22). Ukoliko bi ispitanik npr. na varijabli društvenost uzeo vrednost 5 predviđena emocionalna uravnoteženost bila bi 10.092 (empirijske vrednosti na uzorku iznose 3, 4, 5, 6, 6, 7, 9, 9, 10, 11, 11, 12, 14, 14, 15, 15, 16, 18, 19, 22, 23, 29).

Zadatak 3:

U fajlu D:\statistika\podaci\nlin.sav nalaze se podaci o motivisanosti za obavljanje jednog zadatka (varijabla motiv) i o uspešnosti u obavljanju tog zadatka (varijabla uspeh).

♦ Grafički prikazati vezu između ovih varijabli; ♦ Izračunati kovarijansu između motivisanosti i uspeha; ♦ Izračunati koeficijent linearne korelacije između motivisanosti i uspeha; ♦ Testirati statističku značajnost koeficijenta linearne korelacije. ♦ Šta se na osnovu koeficijenta linearne korelacije i njegove statističke značajnosti

može zaključiti?

Primenjujemo postupke iz prvoga zadatka s tim što u polje Y axis unosimo uspeh kao zavisnu varijablu, a u polje X axis kao nezavisnu varijablu motiv. Takođe, umesto Linear Regression kao Fit Method potvrđujemo Quadratic Regression.

6

Page 7: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14

Kovarijansa je 1.869. Koeficijent linearne korelacije iznosi 0.062 i nije statistički značajan, što znači da među varijablama nema linearne povezanosti.

Međutim, neka vrsta veze ipak postoji i to inverzna U veza. Uočavamo izvesnu pravilnost koju bismo mogli iskazati preko dve regresione prave. Sa porastom motivisanosti raste uspešnost u obavljanju zadataka, ali samo do određene tačke kada počinje linearno da opada. U ovakvim slučajevima kao adekvatna mera asocijacije poslužio bi korelacioni razmer.

7

Page 8: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14

Zadatak 4:

Fajl isti kao za zadatak 3.

♦ Napraviti varijablu motiv2 = -6.82+4.13*motiv -0.19* motiv**2. ♦ Izračunati koeficijent linearne korelacije između varijable motiv2 i uspeha; ♦ Testirati statističku značajnost koeficijenta linearne korelacije. ♦ Šta se na osnovu koeficijenta linearne korelacije i njegove statističke značajnosti

može zaključiti?

Procedura Transform Compute:

8

Page 9: Zadaci iz korelacije i regresije

http://www.psiholozi.net/statistika Vežbe 14

Procedura Analyze Correlate Bivariate:

Koeficijent linearne korelacije iznosi 0.791 i statistički je značajan na nivou 0.01.

Novoizvedena varijabla motiv2 (kao predviđena varijabla uspeha) predstavlja nelinearnu (kvadratnu, pošto je u ovom slučaju reč o paraboli) funkciju motiva, te stoga dobro predviđa uspeh.

Između motivisanosti i uspešnosti postoji jaka veza nelinearnog tipa.

9