Generaliserade linjära modeller, individvariationer och Rasch-modeller
description
Transcript of Generaliserade linjära modeller, individvariationer och Rasch-modeller
![Page 1: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/1.jpg)
1
Generaliserade linjära modeller, individvariationer och
Rasch-modeller
Sture Holm2011-11-30
![Page 2: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/2.jpg)
2
Linjära modeller
• Linjära modeller = parameterlinjära modeller
• Parametrar, ”inställningspunkter”, kontinuerliga eller diskreta
• Linjära ekvationssystem inga svåra numeriska problem
• Lättförståelig additivitet• Klassisk normalteori
2x x z
![Page 3: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/3.jpg)
3
Generaliserade linjära modeller
• Fördelning, fördelningsparametrar, länkfunktion, linjärmodell
• Exempel: Poissonfördelning λ, positiv parameter, loglänk
• Exempel: Binomialfördelning p, parameter i intervallet (0;1), logistisk länk
( )L g
ln( )L
ln( )1pLp
![Page 4: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/4.jpg)
4
Individvariation i linjär modell
• Oberoende och beroende• Additiva felkomponenter i linjära modeller
• Alltid positiv korrelation i modellen !• Variationer inom individer och variationer mellan
individer• Stegvisa ”övergripande variationer” går in i flera
observationer• Försöksplaneringssynpunkter
i ijZ U
![Page 5: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/5.jpg)
5
Individvariation i generaliserad linjär modell
• Inte lika självklart• Relation mellan variation inom och mellan• Slumpvariansen i fördelningen behöver inte
vara konstant i linjärmodellen !• Transformationen i generaliserade modellen
behöver inte ge approximativt konstant varians
![Page 6: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/6.jpg)
6
Variabeltransformationer för konstant varians
• Rottransformation ger approximativt konstant varians i Poisson
• Poisson λ=10, μ=3.12, σ=0.51• Poisson λ=25, μ=4.97, σ=0.50• Basal grundnivå ?• Additivt tillskott i undersökningsgrupp• Individvariation proportionell mot roten ur λ ?• Binomialfördelning arksin-transformation ger
approximativt konstant varians. Inte så bra för additiva tillskottsmodeller?
![Page 7: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/7.jpg)
7
Lognormalfördelning
• Positiva variabler, logaritmen normalfördelad• Oberoende multiplikativa effekter• Större varians för större variabler• Additiva effekter i normalmodellen är
multiplikativa effekter för originalvariablerna• Ett naturligt basval för positiva variabler, doch
inte livslängdsvariabler
![Page 8: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/8.jpg)
8
Individvariation kan ge ökad varians
• I Poisson- och binomialfördeningen syns individvariationen som ökad varians
• Poissonfördelning med λ=25, varians 25• 100 observationer på individer med egna
Poissonparametrar normala μ=25, σ=6 empirisk varians 59.4.
• Klart större än 25, tyder på individvariation• Kan man få minskad varians i någon praktisk
situation ?
![Page 9: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/9.jpg)
9
I enstaka indikatorvariabler syns inte individvariationer
• Summan av 100 indikatorobservationer med p=0.6 har varians 4.9
• Med individer som har 50 % sannolikhet för p=0.4 och p=0.8 har en slumpmässig individ också sannolikheten 0.5 0.4+0.5 0.8=0.6 och ∙ ∙samma varians 4.9
• Gäller på samma sätt även för kontinuerliga fördelningar för individeffekter (väntevärdet är lika med effektiva p-värdet)
![Page 10: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/10.jpg)
10
Samspel mäter individvariation
• Två indikatorvariabler mäts för alla individer
• Indikation på individvariation om
p10 p11 p1∙
p00 p01
p 1∙
11 1 1p p p
![Page 11: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/11.jpg)
11
Binomiala och multinomiala fördelningar
1. Ej upprepade (0,1)2. Flera lika eller olika (0;1) inom individ3. Ej upprepad kategori-fördelning4. Upprepad dito5. Ej upprepad fördelning för ordnade kategorier6. Upprepad ditoPrincipiellt ingen individinformation i fallen 1, 3
och 5
![Page 12: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/12.jpg)
12
Grundkomponenten i Rasch-modellerna
• En sannolikhet p beror av individeffekt Z som
1
Z
Z
epe
![Page 13: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/13.jpg)
13
Kan inte i sig själv identifieras
• Konstant sannolikhet utan variation och en fördelning (frekvensfunktion f(z)) med individeffekter kan inte särskiljas om
• Till exempel gruppskillnader ej mätbara ( och eller två fördelningar ??)
0 1
z
z
ep f z dze
0p
1p 2p
![Page 14: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/14.jpg)
14
• Rasch model….represents the structure which data should exhibit in order to obtain measurements…….different from statistical modelling….
• Rasch model…..the objective to obtain data which fit the model.
• Rasch model is not altered to suit data. Instead the method of assessment should be changed…
• (grundbeskrivning i Wikipedia)
![Page 15: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/15.jpg)
15
• What is a Rasch Analysis? The Rasch model, where the total score summarizes completely a person's standing on a variable, arises from a more fundamental requirement: that the comparison of two people is independent of which items may be used within the set of items assessing the same variable. Thus the Rasch model is taken as a criterion for the structure of the responses, rather than a mere statistical description of the responses. For example, the comparison of the performance of two students' work marked by different graders should be independent of the graders. (Introduction in rasch-analysis.com)
![Page 16: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/16.jpg)
16
Rasch-analysen förutsätter en ”endimensionell” styrvariabel
• Äldre människors livskvalitet• Kan lösa normalsvåra korsord• Kan gå en tur i skogen för att plocka svamp• Är det rimliga resultat av en och samma
endimensionella styrvariabel för att mäta livskvalitet ?
![Page 17: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/17.jpg)
17
Imputering används ofta i program
• This is how many specific-purpose statistical packages prepare the raw data for IRT analysis. These packages set aside any items or persons that provide no useful information for the analysis. They analyze the IRT model with the remaining data. From the solutions derived from the remaining data, these packages extrapolate to come up with estimates for items and persons first set aside. (www.unt.edu/rss/rasch_models)
![Page 18: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/18.jpg)
18
• Logittransformationen ger observationer i oändligheten för de maximala och minimala originalobservationerna
• Alternativa varianter? Avrundningsprincip för empiriska observationer? ”Delningstal” med en enhet mer? Jämför ordnade statistikor.
• Om jag är 176 cm lång, hur lång är jag då?• N kontinuerliga likformiga (0,1). Den ordnade
nummer j har väntevärdet j/(N+1)
![Page 19: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/19.jpg)
19
Principförklaring av hur gemensam modell kan påverka
• KONTROLL BEHANDLING• Dubbel förekomst (uppe till höger) har större
andel än oberoende förklarar (1.4 resp 7.2). Indikerar individvariation. Gemensam modell ger ungefär balans mellan förekomsterna. Mellanfallen ((0,1) och (1,0)) skattas som ganska lika sannolika i Rasch-modellen.
6 4
78 12
19 11
57 13
![Page 20: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/20.jpg)
20
Typisk individvariation för två ordningsvariabler
• Över oberoendefallet nära diagonalen och under oberoendefallet långt därifrån (positivt samspel)
- - +- + +
+ + ++ ++ + -
+ - - -
![Page 21: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/21.jpg)
21
Raschmodellen för ordnade kategorier
• Sannolikheten för kategori j
• där är en konstant, en individparameter• en ”stegparameter” och en normering
för individen.• Vid flera ordnade variabler alla parametrar
byts utom individparametern .
1
1 expj
j s vsv
p j
v
s v
v
![Page 22: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/22.jpg)
22
Figur över Raschmodellen för ordnade kategorier
![Page 23: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/23.jpg)
23
• För en enda ordnad kategorivariabel kan inte individeffekten skiljas från fördelningen på kategorier.
• ”Tänka-efter”-exempel:• Kategorifördelning 0.2, 0.3, 0.4, 0.1 med 10%
”grannspill” kan inte skiljas från fördelningen• 0.2-0.02+0.03=0.21, 0.3-0.06+0.02+0.04=0.30• 0.4-0.08+0.03+0.01=0.36, 0.1-0.01+0.04=0.13
![Page 24: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/24.jpg)
24
• För samma individer i fristående 0-1-försök kommer individeffekten in i samvariationen
• För en ordnad kategorivariabel är samvariationen given av strukturen (kategoriresultat uteslutande, kumulativa resultat implicerande)
![Page 25: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/25.jpg)
25
Principskillnad på summaskala och ordningsskala
• Ordningsskala uteslutande fall 5 möjligheter
• Summaskala 16 möjligheter• 5 summor
A B C D E
10
1
010
10
0 1 2 3 4
![Page 26: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/26.jpg)
26
Logistiska metoder med kumulativa sannolikheter för ordningsvariabler
• För kumulativa sannolikheten för kategori j och bakgrundsvariabel x
• Man kan arbeta med alla ”brytningspunkter” simultant (Agresti)
• Eller betingade ”övergångssannolikheter” som i livslängdsproblem (McCullagh)
j
ln ( ) /(1 ( )) Tj j jx x x
![Page 27: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/27.jpg)
27
Stokastisk ordning
• Y är minst lika stor som X om för alla z Y XF z F z
![Page 28: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/28.jpg)
28
• Inte lätt att genomskåda i massfördelning
1 2 3 4 50
0.05
0.1
0.15
0.2
0.25
0.3
Serie 1Serie 2
![Page 29: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/29.jpg)
29
Lehmann-alternativ
• Exponent på ”överlevnadssannolikhet”
• Tendens till värden över norm för och tendens till värden under norm för
• Koppling till Wilcoxon-parametern
fundamentalt ickeparametriskt mått
1 1 normj j
1 1
( )P Y X
![Page 30: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/30.jpg)
30
Separata direktberäkningar
Kontroll Behandling
och analogt för övriga.
P10 P11
P00 P01
q10 q11
q00 q01
1 1 11ˆ 1Var p p pn
1 1 11 1 11ˆ ˆ,Kov p p p p pn
![Page 31: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/31.jpg)
31
• Direkta skillnader mellan behandling och kontroll eller skillnader i logitskala genom räknelagar. Information om varje item och möjlighet till samtidig utsaga om båda.
![Page 32: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/32.jpg)
32
Ett enkelt exempel
• Kontroll Behandling• ”Radskillnad” 0.30-0.10 = 0.20• Varians 0.0030 (SE 0.055)• ”Kolonnskillnad” 0.24-0.16=0.08• Varians 0.0032 (SE 0.056)• Kovarians 0.00062 (positiv !)• Ingen modell för eventuell individvariation
6 4
78 12
19 11
57 13
![Page 33: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/33.jpg)
33
Tillämpningssynpunkter på modellbyggnad och modellval
• Fundamentala grundkarakteristika för data måste man få in. Diskret eller kontinuerlig, positiv, betingade bidrag osv.
• Klassiska modeller med närhetskomplettering, andragradsterm, beroende osv.
• Ockhams rakkniv, så enkelt som möjligt (för både analys och förstående)
• ANALYSERA MÅLSÄTTNINGEN och inrikta modell och analys på den.
![Page 34: Generaliserade linjära modeller, individvariationer och Rasch-modeller](https://reader035.fdocument.pub/reader035/viewer/2022062501/568160b8550346895dcfdd1c/html5/thumbnails/34.jpg)
34
Några få författare och årtal om man vill fördjupa sig
• Rasch G. (Berkeley symposium 1961)• Andrich D. (Biometrics 1979)• Andersen E.B. (Scand Journ Stat 1982)• Tjur T (Scand Journ Stat 1982)• Agresti A. Categorical Data Analysis. (Wiley 1990)• McCullagh P. (J Roy Stat Soc 1980)• McCullagh P, Nelder J.A. Generalised Linear
Models. (Chapman and Hall 1983)