Kvantitativ metode - folk.uib.nofolk.uib.no/ssojh/PDF/Hovden2002KvantMetodeMEV.pdf · Kvantitativ...
Transcript of Kvantitativ metode - folk.uib.nofolk.uib.no/ssojh/PDF/Hovden2002KvantMetodeMEV.pdf · Kvantitativ...
Kvantitativ metode
Einingar, variablar, verdiar
Operasjonalisering
Reliabitet og validitet
Surveydesign
Deskriptiv statistikk
Statistisk estimering
Bivariat og multivariat analyse
4t forelesingar MEVved høgskulen i Volda
våren 2002
Jan Fredrik [email protected]
Refleksjon ved metodebruk
”We belive that these diaries accurately reflecct the mind of one out outstanding national leaders: if the reflection seems clouded it may not be the fault of the mirror.
Hacker himself processed events in a variety of ways, and the readers will have to make their own judgement as to whether any given statement represents
(a) what happened(b) what he belived happened(c) what he would have liked to happen(d) what he wanted others to belive happened(e) what he wanted others to belive that he belived happened
”Editors’ Note” i Lynn&Jay: The Complete Yes Minister
0 %
20 %
40 %
60 %
80 %
100 %
M e d isin N H H H u m an ist. R e alfag In g ./S ju k.
0 %
20 %
40 %
60 %
80 %
100 %
M e d isin N H H H u m an ist. R e alfag In g ./S ju k.
! Menn ! Kvinner
SeinfeldFriends
Frå ”Bergensstudentar & kultur” (Gripsrud/Hovden 1998)
Kulturell Uorden (Cultural Disorder)
”Utgangspunktet for prosjektet .... er at våre begreper om kunst og estetikk står overfor grunnleggende utfordringer i vår tid, knyttet til tre forhold:
1. Økende grad av overlapping og gjensidig påvirkning mellom kunst og populœrkultur.
2. Økende utbredelse av estetiske fenomener og forståelsesmåter påtradisjonelt ikke-estetiske områder.
3. Økende nœrvœr av ikke-europeiske kulturuttrykk og økt utveksling mellom det europeiske og det ikke-europeiske.
Prosjektet er primœrt motivert av et ønske om å bidra til en bedre forståelse av den aktuelle situasjonen på det estetiske området.....”
frå prosjektets program på http://www.svf.uib.no/media/kulturell-uorden/prosjekt_frames.html
Smaksdanning i høgare utdanning
“Ifølge Pierre Bourdieus undersøkelser er [..] utdanningsinstitusjonene ved siden av primœrsosialiseringen i familien den viktigste kilden til såkalt "kulturell kapital", forutsetningen for adgang til den seriøse eller "legitime" delen av kulturlivet. Den relative betydningen av utdanning i forhold til familiebakgrunn er imidlertid i liten grad avklart. Et hovedmål med dette prosjektet er å bidra til en slik avklaring, med empirisk materiale fra universitets- og høgskolemiljøene i Bergen.
Studenter er dessuten kulturelt sett en spesielt dynamisk gruppering på flere vis. En hypotese for dette prosjektet er bl.a. at de endrer kulturell smak i løpet av studietiden, dels gjennom studier og dels gjennom aktivitetene i studentmiljøet.....”
frå JGs prosjektbeskriving på http://www.svf.uib.no/media/kulturell-uorden/prosjekt_by.html#gripsrud
Forskingsprosessen (Hellevik)
1) Val og utforming av problemstilling2) Utveljing av variablar og einingar som skal
undersøkjast3) Innsamling av data (data-PRODUKSJONEN, min merknad)4) Behandling av data5) Analyse av data6) Tolking av resultata i analysen7) Utarbeiding av rapport
Databehov
A. Kvantitative (systematiske) data om....1. Studentane sin ”kultursituasjon” i brei forstand
" Kulturelle praksisar, preferansar og kunnskap2. Studentane sin sosiale bakgrunn
" Indikatorar for foreldre sin sosiale posisjon med særskild vekt på kulturell kapital
3. Studentane si utdanningskarriere
B. Kvalitative intervjudata
Einingar, variablar, verdiar
EINING = KVEN vil me studere? («Kven skal skjemaet sendast til?»)= studentar i høgare utdanning i Bergen
" − her personnivå, kan og vere høgare nivå som td. kommuner
VARIABEL = KVA vil me studere? (Kva info. er me interessert i?)= familiebakgrunn, utdanning, kulturell smak (...)
VERDIAR = Korleis ser det me vil studere ut? (Kva verdi har den einskilde eininga på variablane?)
" - døme: KJØNN (variabel)- verdiar: (1) Kvinne (2) Mann
Operasjonalisering
= delen av forskingsprosessen der ein bestemmer korleis ein skal omgjere og avgrense abstrakte konsept (teoriar, einingar, variablar) til noko meir konkret og gjennomførleg
TEORETISK DEFINISJON
Med sosial klasse meinast ein person sin posisjon i samfunnets grunnleggjande ulikskapsstrukturar, definert ved deira tilgang til og samansetning av kapital, tilgangar som gjev makt, ære og status på eit gjeve tidspunkt i eit gjeve samfunn.
OPERASJON. DEFINISJON
Ein persons klasseposisjon er gjeve utifrå deira volum og samansetjing av økonomisk kapital, utdanningskapital, kulturell kapital samt yrke.
OPERASJONAL. VAL AV VARIABLAR
Yrke: yrkesgruppe klassifisert etter ISCO-88 (tosiffer-nivå)Økonomisk kapital: brutto årsinntekt for 1997.Utdanningskapital: antal års utdanning utover folkeskuleKulturell kapital: antal meter bøker i heimen++
ABSTRAKT
KONKRETGj.førleg
OPERASJONALISERING
" KVA VAR FORELDRENE SIN ØKONOMISKE KAPITAL?
" VAKS STUDENTEN OPP I EIN ”KULTURELL” HEIM?
Mange måtar å operasjonalisere på
a. Er heime med sjuke born # Alltid eg # Oftast eg # Oftast den andre # Alltid den andre
b. Tek initiativet til å rydde og vaske i huset
# Alltid eg # Oftast eg # Oftast den andre # Alltid den andre
”I ditt parforhold, kven av dykk gjer dei fylgjande oppgåvene i heimen?”Eit kryss for kvart spørsmål
# Kvinne # Mann
Kvinne Mann1 2 3 4 5
a. Kva var ditt fysiske kjønn når du vart føydd?
b. På ein skala frå 1 til 5, kvar vil du i dag plassere deg sjølv i høve til kjønn? (sett ring)
# XX # XY # XXY # XYY # Anna: ___ ” XY-kromosonbinding?”
# Kvinne # Mann”Er du kvinne eller mann?”
VERDIARVARIABEL
Reliabilitet og validitetKor gode data har me? Har det sneke seg inn tilfeldige / systematiske feil?
Teoretisk definertvariabel
Operasjonelt definertvariabel
Data
Definisjonsmessigvaliditet
Reliabilitet
Datas validitet
Resultatet av kombinasjonen av dei to føregåande punkt.DATAS VALIDITET
Måler variabelen det me ynskjer den skal måle (i høve teorien/hypotesa)?
DEFINISJON. VALIDITET =
Er dei ulike stega i datainnsamlinga gjort nøyaktig? Høg reliabilitet om to ulike målingar av same fenomen gjev likt resultat.
RELIABILITET =
”Skal vi stenge grensene for flyktninger fra fjerne land?” (Aarebrot 1999)
0 %
89 %
11 %
6 %16 %
77 %
0 %
20 %40 %
60 %80 %
100 %
Holmgang 16.3.99 OPINION 17.3.99
Ikke sikker Ja Nei
SurveydesignSurveydesign
Svarkategoriar må vere ...
1. UTTØMANDE: må dekke alle svarmuligheiter.”Månadeleg inntekt?” # 1.000-4.000 # 5.000-10.000 # 11.000-30.000
2. GJENSIDIG UTELUKKANDE: svaralternativa må ikkje overlappe.
«Ei gamal kinesisk inndeling av dyr: Dyr er inndelt i: (a) dei som tilhøyrer keisaren, (b) balsamerte, (c) tame, (d) pattegrisar, (e) sirenar, (f) forunderlege, (g) lausbikkjer, (h) inkludert i denne klassifikasjonen, (i) skrekkslagne, (j) utallige, (k) teikna med ein svært fin kamelhårspensel, (l) og så vidare, (m) som nettopp har knust ei vassmugge, (n) som på langt hald ser ut som fluger»
(Jorge Luis Borges)
Dyribal: Universets fire kategoriar
Menn, kengeruar, flaggermus, dei fleste typar slangar, dei fleste typar fisk, nokre fuglar, dei fleste insektar, månen, stormar, regnbogar, boomerangar, nokre typar spyd...
I. BAYI
Deler av kroppen, kjøt, biar, vind, yamrøter, nokre typar spyd, dei fleste typar tre, gras, gjørme, stein, lyder, språk .........
IV. BALA
All etandes frukt og plantane dei kjem frå, honning, sigarettar,vin, kake .......
III. BALAM
Kvinner, pungrotter, hundar, nebbdyr, nokre slangar, nokre fiskar, dei fleste typar fuglar, skorpionar, grashopper, alt knytt til vatn eller eld, sola og stjernene, skjold, nokre typar spyd,nokre typar tre ....
II. BALAN
SurveydesignSurveydesign
Spørsmålsformulering
1. Er språket enkelt? Unngå sjargong og tekniske spørsmål 2. Kan spørsmålet forenklast? Di kortare, di mindre vagt og mindre rom for tolking3. Har spørsmålet fleire tydingar? «Kor ofte vitjar du dine foreldre?» (mor/far?)4. Er spørsmålet leiande? «Bør Norge gå ut av NATO sjølv om dette aukar krigsfaren?»5. Unngå negasjonar. «Marijuana bør ikkje avkriminaliserast. # Einig # Ueinig»6. Er det truleg at respondenten vil ha den naudsynte kunnskapen?7. Vil spørsmålet verte tolka likt av alle?8. Er det ein fare for «prestisje»-feil?9. Bør spørsmålet «pakkast inn»?10. Er rammene for spørsmålet klåre? (td. tidsrom)11. Vil spørsmålet skape kunstige haldningar? (om ting som respondenten ikkje har
meining om?)12. Er spørsmålet unødig detaljert eller vanskeleg å svare på?13. «Social desirability»-problem
SurveydesignSurveydesign
Rekkefylgje av spørsmål
1. Sikre at dei fyrste spørsmåla er klart relevante for surevyen2. Gå frå enkle til vanskelege spørsmål3. Gå frå konkrete til abstrakte spørsmål4. Opne spørsmål bør haldast på eit minimum og helst plasserast seint
i skjemaet5. Grupper spørsmåla inn i seksjonar. Dette betrar flyten.6. Bruk filter-spørsmål for å sikre at folk ikkje må svare på irrelevante
spørsmål7. Varier spørsmålstypane slik at skjemaet vert interessant
Val av surveyform dels etter Dillmann 1978
BRA+TILFREDSDÅRLEGBRAGjennomføring: Kostnadar
TILFREDS.BRADÅRLEGTILFREDS.Gjennomføring: Hurtigheit
BRADÅRLEGGjennomføring: Finne eigna folk
TILFREDS.
BRA
TILFREDS.
TILFREDS.
BRA
BRA
DÅRLEG
TILFREDS.
BRA
BRA
Telefon
TILFREDS.BRADÅRLEGSvarkvalitet: Hjelp med utfylling
DÅRLEGTILFREDS.DÅRLEGSvarkvalitet: Påverkad frå andre
BRATILFREDS.BRASvarkvalitet: Påverknad frå intervjuars haldningar
BRADÅRLEGBRASvarkvalitet: ”Social desirability”-problem
DÅRLEGBRADÅRLEGSurveydesign: Opne spørsmål
TILFREDS.BRATILFREDS.Surveydesign: Manglande utfylling
TILFREDS.BRATILFREDS.Surveydesign: Handerer komplekse spørsmål
TILFREDS.BRATILFREDS.Surveydesign: Handerer lange skjema
(DÅRLEG)TILFREDS.BRARepresentative utval: Tilgang til respondent
?BRABRAResponsrate
Internett /e-post
Andlet-til-andlet
Post
Populasjon og utval
" Populasjon (dei ein trekk utvalet frå)= alle studentar ved UiB, NHH, HiB og KHIB
" Tilfeldig eller ikkje-tilfeldig utval?– Tilfeldig utval: sjangsane for at ei eining vert trukke ut er kjend
– Statistisk generalisering føreset eit tilfeldig utval" Utvalsstorleik: 1650 personar (7%)
Ikkje-tilfeldig utval= Sannsynligheita for å verte trukke er ukjend
Som 3, men forskaren har på førehand og bestemt seg for ei "kvote" av sosiale karakteristiska (td. like mange av begge kjønn).
4. KVOTE-UTVELJING
Utval basert på skjøn eller sjølvseleksjon der og slump spelar inn.(td. "5 på gata")
3. SLUMP-UTVAL
Einingane avgjer sjølv om dei vil vere med i utvalet eller ikkje.(td. innringingsprogram).
2. SJØLVSELEKSJON
Forskaren gjer utval basert på eige skjøn (td. om kor typiske einingane er)
1. SKJØNSMESSIGT UTVAL
Tilfeldig utval= Sannsynligheita for å verte trukke er kjend på førehand
Deler populasjonen inn i (geografiske) områder. Trekk så tilfeldig utval innanfor desse.
4. KLYNGE-UTVAL
Bestemmer seg for ulike grupper ein vil ha med, og trekk tilfeldig innanfor desse.”10% av alle jenter og 10% av alle gutar”
3. STRATIFISERT UTVAL
Sikrar utval med viss avstand mellom respond.”Kvar tiande i telefonkatalogen”
2. SYSTEMATISK UTVAL
”Lotto”-metoden1. ENKELT TILFELDIG UTVELJING
Deskriptiv (beskrivande) statistikk= Statistiske metodar for å forenkle og samanfatte informasjonen i ei matrise
.................................................................
..........GrunnfagSosiologi19Kvinne0003
..........UklassIng. Data31Mann0002
..........UklassSjukepleie45Mann0001
..........Stud.nivåStudiumAlderKjønnRespond.
Kva er samanhengen mellom tre eller fleire variablar?(korrelasjon, regresjon, klyngeanalyse...)
MULTIVARIATanalyse
Kva er samanhengen mellom to variablar i eit utval?(krysstabellar, stat. mål på bi-variat samanheng)
BIVARIATAnalyse
Korleis fordelar verdiane på ein variabel seg i eit utval?(frekvensfordeling, stat. mål på sentralitet og spreiing)
UNIVARIATAnalyse
Frekvensfordeling Univariat statistikkUnivariat statistikkv88 V15_TVTI: Timar fjernsyn sett pr. veke
Kategori Kode Antall %Alle %Gyldige----------------------------------------------------
0.0 0.0 39 3.5 3.60.2 0.2 1 0.1 0.10.3 0.3 1 0.1 0.10.5 0.5 6 0.5 0.61.0 1.0 16 1.4 1.51.5 1.5 6 0.5 0.62.0 2.0 26 2.3 2.42.5 2.5 6 0.5 0.63.0 3.0 55 4.9 5.13.5 3.5 10 0.9 0.94.0 4.0 51 4.6 4.74.5 4.5 2 0.2 0.25.0 5.0 76 6.8 7.05.5 5.5 5 0.4 0.56.0 6.0 44 3.9 4.06.5 6.5 4 0.4 0.47.0 7.0 71 6.4 6.57.5 7.5 7 0.6 0.68.0 8.0 45 4.0 4.18.5 8.5 2 0.2 0.29.0 9.0 14 1.3 1.310.0 10.0 168 15.1 15.411.0 11.0 11 1.0 1.012.0 12.0 47 4.2 4.313.0 13.0 4 0.4 0.413.5 13.5 2 0.2 0.214.0 14.0 63 5.7 5.815.0 15.0 109 9.8 10.0
16.0 16.0 17 1.5 1.617.0 17.0 7 0.6 0.617.5 17.5 4 0.4 0.418.0 18.0 9 0.8 0.820.0 20.0 81 7.3 7.4
21.0 21.0 9 0.8 0.8
22.0 22.0 2 0.2 0.2
23.0 23.0 1 0.1 0.1
24.0 24.0 3 0.3 0.3
25.0 25.0 19 1.7 1.7
28.0 28.0 10 0.9 0.9
30.0 30.0 19 1.7 1.7
35.0 35.0 11 1.0 1.0
40.0 40.0 1 0.1 0.1
45.0 45.0 1 0.1 0.1
49.0 49.0 1 0.1 0.1
50.0 50.0 1 0.1 0.1
55.0 55.0 1 0.1 0.1
60.0 60.0 1 0.1 0.1
Ikkje sv. 999.0 16 1.4 -
----------------------------------------------------
SUM 1114 100.0 100.0
----------------------------------------------------
Frekvensfordeling – forenkling
Kategorinavn Kode Antall %Alle %Gyldige%Akkumulert--------------------------------------------------------------<1t 1.00 47 4.3 4.3 4.31-5t 2.00 248 22.8 22.9 27.26-10t 3.00 355 32.6 32.7 60.011-15t 4.00 236 21.7 21.8 81.716-20t 5.00 118 10.8 10.9 92.6>20t 6.00 80 7.3 7.4 100.0--------------------------------------------------------------
Sum 1089 100.0 100.0
Univariat statistikkUnivariat statistikk
Frekvenspolygon 15_TVTI: Timar fjernsyn sett pr. veke
M O M Q M S M
Univariat statistikkUnivariat statistikk
Stolpediagram 15_TVTI: Timar fjernsyn sett pr. Veke REK 6
0
R
N M
N R
O M
O R
P M
P R
Y N í
QKP
N J R í
OOKV
S J N M í
POKT
N N J N R í
ONKU
N S J O M í
NMKV
[ O M í
TKQ
Statistiske mål
= freister beskrive eigenskapar ved ei datamatrise ved eit einskild tal.
To hovudtypar av statistiske mål (univariate)" Mål på SENTRALITET
– Kva er den typiske verdien?
" Mål på SPREIING– Kor stor variasjon er det i verdiane?
30,020,015,012,09,07,06,04,53,52,5,0
10
8
6
4
2
0
Timar fjernsyn sett pr. veke
1 1,6 1,6 1,61 1,6 1,6 3,11 1,6 1,6 4,74 6,3 6,3 10,91 1,6 1,6 12,56 9,4 9,4 21,91 1,6 1,6 23,46 9,4 9,4 32,84 6,3 6,3 39,11 1,6 1,6 40,62 3,1 3,1 43,85 7,8 7,8 51,61 1,6 1,6 53,19 14,1 14,1 67,22 3,1 3,1 70,35 7,8 7,8 78,14 6,3 6,3 84,41 1,6 1,6 85,97 10,9 10,9 96,91 1,6 1,6 98,41 1,6 1,6 100,0
64 100,0 100,0
,01,02,53,03,54,04,55,06,06,57,08,09,010,012,014,015,016,020,025,030,0Total
ValidFrequency Percent Valid Percent
CumulativePercent
>40 år
Mål på sentralitet: Timar fjersyn pr. veke
MODUS (vanlegaste verdi)
MEDIAN (deler fordelinga i to like delar)
ARTEMETISK GJENNOMSNITT
MÅLENIVÅ for variablar
Timer fjernsyn sett pr. Veke0...............168 timar
Preferanse for D.D.E.1. Liker godt2. Liker litt3. Hverken liker / misliker4. Liker ikke noe særlig5. Liker ikke i det hele tatt
Nasjonalitet.1. Norsk2. Dansk3. Svensk4. Anna
Døme
SENTRALITET:Art. gjennomsnitt
SPREIING:Standardavvik
"Gjensidig utelukkande"Kan rangerast"Har abs. nullpunkt
HØVETAL(metrisk)
SENTRALITET:Median
SPREIING:VariasjonsbreiddeKvartildifferanse
"Gjensidig utelukkande"Kan rangerast
ORDINAL(ikkje-metrisk)
SENTRALITET:Modus
SPREIING:Modal%
"Gjensidig utelukkandeNOMINAL(ikkje-metrisk)
MÅLKrav til verdierMålenivå
Statistiske målStatistiske mål
Mål på SENTRALITET: Seinfeld & Offshore1 = Liker godt, 2 = Liker litt, 3 = Hverken liker/misliker, 4 = Liker ikke noe særlig, 5 = Liker ikke i det hele tatt
N O P Q R
SEINFELD78%
14%5% 2% 1,5%
N O P Q R
OFFSHORE
6%
15%21% 20%
37%
51MODUS: Den vanligaste verdien i ei fordelingOffshoreSeinfeld
Statistiske mål Statistiske mål -- ordninalnivåordninalnivå
Mål på SPREIING: Seinfeld & Offshore1 = Liker godt, 2 = Liker litt, 3 = Hverken liker/misliker, 4 = Liker ikke noe særlig, 5 = Liker ikke i det hele tatt
N O P Q R
SEINFELD78%
14%5% 2% 1,5%
N O P Q R
OFFSHORE
6%
15%21% 20%
37%
37 %78 %MODAL%: Andelen einingar som har modusverdienOffshoreSeinfeld
30,020,015,012,09,07,06,04,53,52,5,0
10
8
6
4
2
0
Timar fjernsyn sett pr. veke
1 1,6 1,6 1,61 1,6 1,6 3,11 1,6 1,6 4,74 6,3 6,3 10,91 1,6 1,6 12,56 9,4 9,4 21,91 1,6 1,6 23,46 9,4 9,4 32,84 6,3 6,3 39,11 1,6 1,6 40,62 3,1 3,1 43,85 7,8 7,8 51,61 1,6 1,6 53,19 14,1 14,1 67,22 3,1 3,1 70,35 7,8 7,8 78,14 6,3 6,3 84,41 1,6 1,6 85,97 10,9 10,9 96,91 1,6 1,6 98,41 1,6 1,6 100,0
64 100,0 100,0
,01,02,53,03,54,04,55,06,06,57,08,09,010,012,014,015,016,020,025,030,0Total
ValidFrequency Percent Valid Percent
CumulativePercent
>40 år
Mål på spreiing: Timar fjersyn pr. veke
Gj.snitt9.8
St.avvik6.5
3. Kvartil14.0
Median8.0
1. Kvartil5.0
Max30
Min0
Antal64
M N M O M P M Q M R M S M
<30 år
3. Kvartil15.0
St.avvik8.0
Median8.0
1. Kvartil5.0
Gj.snitt11.2
Max60
Min0
Antal908
6.58.0STANDARDAVVIK: Gjennomsnittleg avvik frå gjennomsnittet
9.010.0KVARTILDIFFERANSE: Diff. mellom dei midterste 50% av fordelinga
3060VARIASJONSBREIDDE: Differansen mellom høgste / lågaste verdi
>40 år<30 år
Standdard-avvik= utrykk for det gjennomsnittlege avviket frå gjennomsnittet i ei fordeling
M R M M N M M M N R M M O M M M
M
N M
O M
P M
Q M
R M
S M
Framgangsmåte ved berekning av standardavviket
14 personar (av 1100) sitt avvik frå gj.snittet Framgangsmåte ved berekning av standardavviket
1.1. For kvar einskild eining bereknar ein avviket frå gjennomsnittet (x-M)
2.2. Avvika vert kvadrerte (x-M)2
3.3.Dei kvadrerte avvika vert summerte saman Σ(x-M)2
4.4. Summen vert delt på antal valide einingar (= variansen)
5.5. Kvadratrota vert trekt ut (= standardavviket)
M R NM NR OM OR
NSMM
NSMS
NSNT
NSOO
NSOQ
NSPP
NSUU
NSVU
NTNQ
NTRM
NTST
NUNQ
NUQP
NUVU
Statistiske mål – kva seier gj.snitt og standardavvik oss om eigenskapene ved ei fordeling?
7.011.4Lærar Mann
7.411.5Lærar Kvinne
5.86.2Medisin Kvinne
8.39.4Medisin MannStand. avvikGj.snittFag/kjønn
Bivariat analyseBivariat analyse
Krysstabellar - D’Sound x Kjønn++= Liker godt, + = Liker litt, 0 = Hverken liker/misliker, - = Liker ikke noe særlig, -- = Liker ikke i det hele tatt
20% 12% 16%33% 29% 31%29% 30% 30%11% 18% 14%6% 11% 9%
100% 100% 100%
Liker godtLiker littHverken liker/mislikerLiker ikke noe særligLiker ikke i det hele tatt
D'Sound
Total
Kvinne MannRespondentens kjønn
Total
% t espo de te s jø
Bivariat analyseBivariat analyse
Krysstabellar - D’Sound x Alder++= Liker godt, + = Liker litt, 0 = Hverken liker/misliker, - = Liker ikke noe særlig, -- = Liker ikke i det hele tatt
12% 16% 17% 16%30% 32% 31% 31%32% 28% 30% 30%20% 15% 14% 14%6% 10% 8% 9%
100% 100% 100% 100%
Liker godtLiker littHverken liker/mislikerLiker ikke noe særligLiker ikke i det hele tatt
D'Sound
Total
1958-1967 1968-1973 1974-80Alder
Total
Bivariat analyseBivariat analyse
Stat.mål på SAMANHENG mellom to variablar(= gjev utrykk for STYRKE og RETNING)
Pearsons R(produktmomentkorrelasjons-koeffisienten)
HØVETAL-NIVÅγ (Gamma), ρ (Rho)ORDINALλ (Lambda), Yules QNOMINAL
MålMålenivå
Gamma & Pearsons RKORRELASJONSMÅL. Syner i kva grad verdiane (høg/låg) på ein variabel (X) for ei eining går saman med høge/låge verdiar på den andre variabelen
(Y). Varierar mellom -1 og 1.
Bivariat analyseBivariat analyse
D’Sound: Mål på samanheng (gamma)++= Liker godt, + = Liker litt, 0 = Hverken liker/misliker, - = Liker ikke noe særlig, -- = Liker ikke i det hele tatt
12% 16% 17% 16%30% 32% 31% 31%32% 28% 30% 30%20% 15% 14% 14%6% 10% 8% 9%
100% 100% 100% 100%
1958-1967 1968-1973 1974-80Alder
Total20% 12%33% 29%29% 30%11% 18%6% 11%
100% 100%
Liker godtLiker littHverken liker/mislikerLiker ikke noe særligLiker ikke i det hele tatt
D'Sound
Total
Kvinne MannRespondentens kjønn
γ (Gamma) = 0.24
% espo de e s jø
γ (Gamma) = - 0.04
Gamma: Musikkartistar og kjønn/alder
- 0.26
- 0.29
0.33
0.26
0.15
0.24
KJØNN
0.35Tom Waits
- 0.13Motorpsycho
- 0.07Celine Dion
0.08DDE
0.22Kari Bremnes
- 0.04D’Sound
ALDER
- Mann $% Kvinne +
-Yngre $% Eldre +
Gamma: Musikkartistar
.41
1.00
Motorpsycho
-,34-,23.01.34Motorpsycho
1.00-.42-.22.27.19Tom Waits
1.00.49-.07.02Celine Dion
1.00.07.03DDE
1.00.06Kari Bremnes
1.00D’Sound
Tom WaitsCeline Dion
DDEKariBremnes
D’Sound
Bivariat analyseBivariat analyse
Bivariat lineær regresjon
NAUDSYNTE FØRESETNADAR FOR BRUK AV METODEN:•Me har to variablar der me trur X påverkar Y•Begge variablane er på høvetalsnivå (forholdstall)•Tilhøvet mellom variablane beskrivast ved den lineærefunksjonen:
Y = a + bX(a = skjeringspunkt for linja ved Y-aksen når X=0 og b er
stigningstalet til linja.)
MÅLSETJING:ME VIL PREDIKERE EININGANE SIN VERDI PÅ Y-variablen UTIFRÅ DEIRA VERDI PÅ X-variabelen.
384363705479658968
Spreiingsdiagram høgde-vekt 9 studentar
25
35
45
55
65
75
85
95
150 160 170 180 190 200Høgde
Vekt
Råtal
Student: Høgde (X): Vekt (Y):1 152 382 157 433 163 634 168 705 173 546 178 797 183 658 188 899 193 68
Gjennomsnitt: 173 63St. avvik 13,9 16,2Pearsons R = 0,76
Beste regresjonslinje: Y = -90 + 0,3X(Dømer på predikert vekt utifrå regr.linja: 160 cm = 55 kilo, 180 cm = 70 kilo)
Forklart varians ved beste linje = R2 = 0,76*0,76 = 0,58 (58% av variansen i vekta er forklart ved høgda)
Tv-sjåing og alder (alle)
1 9 2 0 1 9 3 0 1 9 4 0 1 9 5 0 1 9 6 0 1 9 7 0 1 9 8 0
0
1 0
2 0
3 0
4 0
Tv-sjåing og alder(1970-)
NVTM NVTO NVTQ NVTS NVTU NVUM
M
NM
OM
PM
QM
Statistikk er ikkje ”virkeligheit”
" Data er kreata" Datamaterialet er produkt av ein forskingsprosess" Validititet? [Måler me det trur me måler?]
" Reliabilitet? [Td. er utvalet vårt skeivt?]
" Statistiske samanhengar er ingen garanti" Spuriøse samanhengar [Inntekt-skonummer]
" Illusjon å tru ein kan analysere to variablar åleine" Nivåfeilslutningar [Norske kvinner liker betre D’Sound enn menn]
" Tidsfeilslutningar [Hestedrosjetrafikken i Paris år 2000]
Puss tennene
Likestilling
STATISTISK ESTIMERING
" Statistikken vår er basert på eit UTVAL" Men: I kva grad er våre data (utvalet) representative
for POPULASJONEN?" Me kan aldri vere 100% sikre...." Men det er mogleg å antyde eit ca. resultat gjeve ein
viss sjanse for å ta feil
ENKEL SANNSYNLIGHEITSTEORI
" Kastar me 1 terning, finst det 6 moglege utfall:– 1 2 3 4 5 6– Det er 1/6 sjanse for å få 6 på eit kast (p=0.167)
" Kastar me 2 terningar, finst det 36 moglege utfall
Summen av to terningar: Nokre utfall er meir sannsynlege enn andre
SUM ALLE MOGLEGE UTFALL =
252
GJENNOM-SNITT
252/36 = 7
02 && 1/3603 &' '& 2/3604 &( '' (& 3/3605 &) '( (' )& 4/3606 &* ') (( )' *& 5/3607 &+ '* () )( *' +& 6/3608 '+ (* )) *( +' 5/3609 (+ )* *) +( 4/3610 )+ ** +) 3/3611 *+ +* 2/3612 ++ 1/36
ENKEL SANNSYNLIGHEITSTEORI
" Me veit at det TEORETISKE gjennomsnitt-summen når me kastar to terningar er 7
" I RØYNDA vil dette variere frå gong til gong– I teorien kan me få to 1-arar 1000 gongar på rad
" I praksis er det likevel slik (statistisk sett over tid): – di fleire kast me gjer ....– di nærmare vil resultat ligge...– det ”sanne” snittet (7)
20 forsøk: To terningar kasta 20/500 gongar
6,00
6,20
6,40
6,60
6,80
7,00
7,20
7,40
7,60
7,80
8,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
S20S500
Di større utval, di meir vil fordelinga i utvalet likne på populasjonen
Feilmarginar
" Feilmarginar er knytt til utvalet sin storleik UAVHENGIG av populasjonen sin storleik
" I tillegg kjem alle vanlege forbehald om dårleg datakvalitet pga. dårleg def.validitet og reliabilitet.
± 1,5%4500± 5,0%400± 2,0%2500± 5,5%300± 3,0%1000± 7,0%200± 4,5 %500± 10,0%100Feilmargin (5%)UtvalFeilmargin (5%)Utval
Feilmarginar og standardavvik
Feilmarginar og konfidensintervall (95%)
x = resultat (0.0-1.0)
N = antal i utvalet vårtNxxinFeilm )1(96,1arg −
±=
" Døme: AP får 20% i ei måling med eit utval på 1000." Feilmarginane er då
" Me er 95% sikre på at det verkelege talet er 20% ± 2,5%." Konfidensintervallet: 17,5%-22,5%" I 1 av 20 målingar vil det verkelege talet ligge utanfor
%5,20247,01000
)20.01(20.096,1 ±==−
KonfidensintervallEr det signifikante skilnadar i fjernsynsbruk mellom kvinnlege og mannlege studentar?
M NM OM PM QM RM SM
hîáååÉ
j~åå
V NM NN NO NP
hî áååÉ
j~åå
Konfidens-intervall
Gj.snitt 99% min 95% min 95% max 99% max----------------------------------------------------Kvinne 10.30 10.46 10.66 10.93 11.13Mann 11.69 10.76 10.98 12.41 12.63----------------------------------------------------Totalt 10.91 10.29 10.44 11.39 11.54----------------------------------------------------
V88 Timar fjernsyn sett pr. vekeV3 Respondentens kjønn
Gj.snitt St.avvik Antall----------------------------------Kvinne 10.30 7.73 573Mann 11.69 7.71 451----------------------------------Totalt 10.91 7.75 1024----------------------------------
Bivariat analyseBivariat analyse
Signifikansmål (Kji-kvadrat)++= Liker godt, + = Liker litt, 0 = Hverken liker/misliker, - = Liker ikke noe særlig, -- = Liker ikke i det hele tatt
Chi-Square Tests
27,27 5 ,000PearsonChi-Square
Value dfAsymp. Sig.
(2-sided)
D’Sound x Kjønn Aqua x KjønnChi-Square Tests
8,989 6 ,174PearsonChi-Square
Value dfAsymp. Sig.
(2-sided)
Sjansane for at mønstera me ser i tabellen skuldast utvalet er:
< 0.0% 17,4%Som tommelfingelregel bør det vere <5% sjanse (=95% sign)
Multivariat analyseMultivariat analyse
Trivariate krysstabellar
Kari Bremnes * Alder * Respondentens kjønn Crosstabulation
% within Alder
35% 37% 21% 28%34% 25% 23% 25%16% 17% 29% 24%
7% 14% 18% 15%7% 8% 9% 8%
100% 100% 100% 100%19% 25% 10% 18%35% 33% 22% 26%19% 21% 35% 28%23% 11% 22% 18%
5% 11% 11% 10%100% 100% 100% 100%
Liker godtLiker littHverken liker/mislikerLiker ikke noe særligLiker ikke i det hele tatt
KariBremnes
TotalLiker godtLiker littHverken liker/mislikerLiker ikke noe særligLiker ikke i det hele tatt
KariBremnes
Total
Respondentens kjønnKvinne
Mann
1958-1967 1968-1973 1974-80Alder
Total
Multivariat analyseMultivariat analyse
Multivariat lineær regresjon
Meter bøker i heimen
Kjønn
Alder
.16
.02
.12Fars utdannings-nivå Preferanse D’Sound
-.05
Multivariat analyseMultivariat analyse
Hierarkisk klyngeanalyse (Chi2)
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
RAP 13 òûòòòòòòòøHARDROCK 14 ò÷ óSAMT.MUS 2 òòòòòòòòòüòòòøMOD.JAZZ 4 òòòòòòòòò÷ ùòòòòòøHOUSE 9 òòòòòòòòòòòòò÷ óOPERA 1 òòòòòòòòòòòòòòòòòòòüòòòòòøCOUNTRY 7 òòòòòòòòòòòòòòòòòòò÷ ùòòòòòòòòòø50'ROCK 5 òòòòòòòòòòòòòòòòòòòòòòòòò÷ ùòòòòòòòòòòòøREGGAE 12 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ùòøTEATERMU 3 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòûòòòòòòòø ó óWIENKLAS 10 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ùòòò÷ óGOSPEL 6 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòûòòò÷ óIRSKFOLK 11 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ óDISCO 8 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
Mult. korrespondanseanalyse
Multivariat analyseMultivariat analyse