χ -test i GeoGebra - Science Gym · χ2-test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium...
Transcript of χ -test i GeoGebra - Science Gym · χ2-test i GeoGebra Jens Sveistrup, Gammel Hellerup Gymnasium...
χ2-test i GeoGebra
Jens Sveistrup, Gammel Hellerup Gymnasium
Man kan nemt lave χ2-test i GeoGebra – både goodness-of-fit-test og uafhængighedstest. Den følgende
vejledning bygger på GeoGebra version 4.2, og hvis man ikke allerede har GeoGebra installeret, så kan
seneste version hentes på http://www.geogebra.org/cms/da/download. I det følgende vises eksempler på
løsning af begge typer af test, og på forskellige måder. Først ved brug af GeoGebras indbyggede
Sandsynlighedslommeregner og sidst ved brug af GeoGebras CAS-værktøj.
Sandsynlighedslommeregneren
Indledningsvis skal vi finde Sandsynlighedslommeregneren i GeoGebra.
Åbn GeoGebra. Afhængig af opsætningen, ses nu to eller flere hovedvinduer: ’Algebra vindue’,
’Tegneblok’ og evt. ’CAS’. Klik på den lille trekant nederst til højre i ikonet med bogstaverne ABC og
vælg Sandsynlighedslommeregneren – se figuren.
Nu skal GeoGebra (nogenlunde!) se ud som på følgende figur. Vær opmærksom på at
Sandsynlighedslommeregneren er et vindue for sig selv, og dermed kan gemme sig under
GeoGebra-vinduet (eller et andet vindue).
Opgaveløsning – uafhængighedstest
Når vinduet med Sandsynlighedslommeregneren åbnes, vises en normalfordeling. Det skal vi ikke
bruge. Klik på fanebladet ’Statistik’ og vælg den ønskede test i rullemenuen. χ2-testene findes
nederst i rullemenuen. Vælg ’Chi_i_anden Test’, der er uafhængighedstesten, og som er den test
der skal bruges følgende opgave hentet fra hæftet med vejledende eksamensopgaver:
Der opstilles en nulhypotese (det må I selv gøre…), og data skal indtastes i
Sandsynlighedslommeregneren. Da der i opgaven optræder en 2x2-tabel, vælges antal rækker og
søjler begge til 2.
Indtast data fra opgaven og eventuelt titler på rækkerne og søjlerne. Så snart sidste celle er udfyldt
trykkes enter, og GeoGebra udregner antallet af frihedsgrader (’df’), teststørrelsen (’χ2’) og p-
værdien (’P’):
Nu kan man på baggrund af p-værdien og det givne signifikansniveau på 5 % i spørgsmål a,
formulere en passende konklusion – men det må I selv gøre! Ligeså i spørgsmål b hvor
signifikansniveauet er ændret 1 % – læg mærke til at man ikke skal ændre data for at svare på
spørgsmål b.
GeoGebra kan endvidere beregne værdierne for den forventede fordeling. Sæt et flueben
’Forventet antal’, og værdierne fremkommer i tabellen. – Desværre ikke i en tabel for sig, det kan
måske virke forvirrende!?
Læg også mærke til muligheden for at få vist værdien af de enkelte led i summen
ved
at sætte et flueben i ’χ2 bidrag’ (ikke vist her).
Opgaveløsning – Goodness of Fit-test
Er det opgave hvor man i stedet skal udføre en goodness-of-fit-test, som i nedenstående, skal man i
Sandsynlighedslommeregnerens rullemenu under fanebladet ’Statistik’, vælge ’Goodness of Fit
Test’ (og ikke ’Chi_i_anden Test’, som blev gennemgået ovenfor).
De forventede hyppigheder udregnes fx i Regnearket i GeoGebra, så tilbage til GeoGebras
hovedvindue, og vælg ’Regneark’ under ’Vis’ i menulinjen. Indtast data som vist nedenfor i de tre
første kolonner. Celle B5 indeholder summen af de eksperimentelle værdier, udregnet som
”=sum[B2:B4]”
I sidste kolonne (kolonne D) udregnes de forventede hyppigheder. Start med celle D2 (der er
markeret), indtast ”=C2/100 * $B$5” og tryk enter. Referencen til celle B5 er en fast reference,
derfor er der $-tegn om B’et. Når der så trækkes i den lille blå firkant forneden til højre for tallet 59
(se figuren), kopieres den indtastede formel således at D3 og D4 udregnes med de korrekte
referencer. Dette er gjort i figuren.
Igen opstilles en nulhypotese, og igen må I selv gøre dette…
I Sandsynlighedslommeregneren vælges 3 rækker svarende til de tre mulige farver i opgaven: ’rød,
’lyserød’ og ’hvid’. De eksperimentelle data indtastes i kolonnen ’Observeret antal’ sammen med
evt. titler. De forventede hyppigheder indtastes i kolonnen ’Forventet antal’. Tryk enter.
En nulhypotese opstilles, og en konklusion drages på baggrund af p-værdien og det valgte
signifikansniveau. χ2-teststørrelsen og antallet af frihedsgrader kan ligeledes aflæses.
Der er en begrænsning på 12 rækker i en goodness-of-fit-test. Tilsvarende er grænsen 12x12 for
tabeller i uafhængighedstest.
Brug af CAS eller algebra-vinduet
p-værdier kan også beregnes i GeoGebras CAS-vindue eller i algebravinduet. I det følgende arbejdes
der i CAS-vinduet. Hvis ikke det er åbent, så klik på ’Vis’ i Geogebras menulinje og vælg ’CAS’.
Beregningen udføres med kommandoen ChiKvadreret[]. Kommandoen kræver to argumenter: antal
frihedsgarder og værdien af teststørrelsen χ2 (der jo fx kan være beregnet i
Sandsynlighedslommeregneren). Husk at afslutte indtastningen ved at klikke på det krøllede
lighedstegn (markeret med blåt i figuren), eller bruge shift-enter:
Læg mærke til at man skal indtaste 1-ChiKvadreret[] for at beregne p-værdien! Sammenlign med
resultatet i goodness-of-fit-testen ovenfor.
Ønsker man at bestemme den kritiske værdi for teststørrelsen, skal man benytte kommandoen
InversChiIAnden[]. Igen har kommandoen to argumenter: antallet af frihedsgrader og en
sandsynlighed, der afhænger af signifikansniveauet. Hvis signifikansniveauet vælges til 5 %, skal
sidste argument indtastes som 0.95. (Her det i øvrigt ikke vigtigt at bruge det krøllede lighedstegn.)
Ovenstående to kommandoer fungerer også i algebra-vinduet, dvs. ved indtastning i input-feltet
nederst i GeoGebra-vinduet.
Samme resultat kan man komme til med kommandoen Chi2test[]. Hvis de observerede værdier er
gem i en liste med navnet obs, og de forventede værdier er gemt i en liste med navnet forv, er
kommandoen ’Chi2test[obs,forv]’. Lister laves fx ved at markere de relevante celler i Regnearket,
højreklikke og vælge ’Lav -> Liste’. Som det ses på nu to værdier: 0.5549 som er p-værdien og 1.178
som er værdien af teststørrelsen – sammenlign med resultaterne ovenfor.
Kritisk værdi med Sandsynlighedslommeregneren
Den kritiske værdi kan i øvrigt også bestemmes med Sandsynlighedslommeregneren. Denne gang
skal man vælge fanebladet ’Fordeling’ og ’Chi i anden’. Indtast værdien 2 i feltet ud for ’df’; det er
antal frihedsgrader. Af de tre knapper lige nedenunder skal man vælge den der ligner en kantet
højreparentes: ].
Nederste linje er selve udregningen af p-værdien. I feltet til højre (efter lighedstegnet) indtastes
0.95 og der trykkes enter. Den kritiske værdi aflæses i feltet til venstre: 5.9915, som vi også fik
ovenfor. Samtidigt vises resultatet grafisk:
På GeoGebraTube er uploadet en tilsvarende app der viser χ2-fordelinger:
http://www.geogebratube.org/material/show/id/38404
Uafhængighedstest med CAS
Den første opgave kan også løses med kommandoen Chi2test[]. Værdierne indtastes i Regnearket
og markeres. Højreklik og vælg ’Lav -> Matrix’, der automatisk får navnet matrix1 (hvis ellers det er
den første matrix). I CAS-vinduet indtastes Chi2test[matrix1]. Resultatet bliver 0.0171 og 5.6863,
der er henholdsvis p-værdien og værdien af teststørrelsen χ2.
Denne metode viser i modsætning til den først beskrevne, ikke af antallet af frihedsgrader. Ej heller
kan man få beregnet de forventede værdier.