"Klassrummet" -Statistikguiden, SCB, pdf

61
Klassrummet

Transcript of "Klassrummet" -Statistikguiden, SCB, pdf

Page 1: "Klassrummet" -Statistikguiden, SCB, pdf

Klassrummet

Page 2: "Klassrummet" -Statistikguiden, SCB, pdf

STATISTIKGUIDEN

Introduktion till statistik Del 1: Statistik beskriver verkligheten 3Del 2: Statistik i praktiken 4Del 3: Undersökningens ABC 5Del 4: Statistisk årsbok 8

Undersökning och urval Del 1: Frågeteknik 9Del 2: Välja intervjupersoner 12Del 3: Undersökning med urval 15Del 4: Test och experiment 17

Kvalitet i statistiken Del 1: Kvalitet hela vägen 20Del 2: Felmarginaler 21Del 3: Fel i statistiken 22

Räkna rätt Del 1: Central- och spridningsmått 24Del 2: Sannolikhet och slump 28

Trender och analyser Del 1: Tabeller 31Del 2: Diagram 33Del 3: Kartor 37Del 4: Trender 42Del 5: Analysmetoder 44

Övningsuppgifter 47

Page 3: "Klassrummet" -Statistikguiden, SCB, pdf

3Introduktion till statistik

INTRODUKTION TILL STATISTIK

Del 1: Statistik beskriver verklighetenOrdet statistik har två betydelser. Statistik är sifferuppgifter som beskriver en sak eller en verksamhet. Statistik är också metoder för att samla in, bearbeta och analysera material.

Statistik används ofta som underlag när man ska ta beslut. Det kan handla om hur många skolor som behövs i en kommun. Då är det samhällsplanerare och politiker som använder statistiken. Eller det kan handla om hur många mataffärer som behövs i ett område. Då är också företag intresserade. Ur ett historiskt perspektiv är statistik sifferuppgifter om staten.

En beskrivning av verklighetenMan kan också se statistik som ett viktigt underlag för det politiska samtalet och en förutsättning för demokrati. Vid en diskussion om t.ex. arbetslöshet behövs en gemensam bild av hur stor den faktiskt är. Men man behöver kunna förstå och använda statistiken på rätt sätt. När vi tolkar statistik måste vi komma ihåg att den är ett förenklat sätt att beskriva verkligheten. Statistik kan inte spegla verkligheten från alla aspekter. Om vi lär oss att använda och tolka statistik kan vi göra den till ett bra hjälpmedel. Gör vi inte det är risken stor att bli vilseförda av den.

Se upp för undersökningar med svag kvalitet!Uppgifter som har tagits fram för att förklara en bestämd fråga används ibland för att visa något annat än det avsetts för. Ofta görs det i brist på statistik som visar precis det man vill diskutera. Då har statistiken dålig relevans. Därför är det viktigt att veta syftet med datainsamlingen och statistiken som gjordes. .

Hur skall man veta att statistiken är tillräckligt bra för min användning? När det gäller de flesta andra produkter och tjänster så kan man själv bedöma hur bra kvaliteten är genom att se eller prova. Ofta finns tester som visar vad som är bra och mindre bra eller har man bekanta som kan tipsa om egna erfarenheter. Alla dessa möjligheter saknas när det gäller statistik. Man kan inte se på siffrorna vilken kvalitet de håller. Därför är användare av statistik helt beroende av den dokumentation som den som har tagit fram statistiken presenterar.

Page 4: "Klassrummet" -Statistikguiden, SCB, pdf

4Introduktion till statistik

För att se om en undersökning håller tillräcklig kvalitet behöver man i första hand veta:n HUR har frågorna ställts?n Hur har urvalet dragits?n Hur stort blev bortfallet?

Del 2: Statistik i praktikenDen officiella statistiken omfattar många helt olika ämnesområden. För individer och hushåll beskrivs t.ex. befolkningsutveckling, inkomster och sysselsättning. Företagsstatistiken omfattar t.ex. prisutvecklingen (KPI), utrikeshandel och nationalräkenskaper. I det följande är exemplen hämtade från individstatistik.En stor del av den officiella statistiken grundas på administrativa register, främst från skatte¬myndigheter. Alla urvalsundersökningar är också viktiga för att belysa alla de frågor som inte kan hittas i register.

Här går vi igenom:nOlika sätt att ta fram statistiknHur man kan använda resultaten

Ett exempel med läroböckerVid ett universitet klagade studenterna på läroböckerna. De tyckte att det var besvärligt att en del böcker var skrivna på engelska. De ville hellre ha böcker på svenska. Visserligen var det inte så många som hörde av sig och klagade. Men läraren tänkte att det kanske var fler som tyckte likadant men att de inte sa något.

Statistisk information kan visa hur stort ett problem ärLärarna tog klagomålen på allvar och gjorde en enkät. Studenterna fick svara på vad de tyckte om läroböcker på engelska. Resultatet av enkäten visade att bara två procent tyckte att det var jobbigt med böcker på engelska. Det var med andra ord inte något stort och utbrett problem.

Läraren bestämde sig därför för att fortsätta med de böcker som var på engelska. Om många studenter hade haft besvär med de engelska böckerna hade läraren kanske valt att göra något åt problemet.

Siffror belyser samhällsproblemPå liknande sätt kan man använda statistiken för andra frågor i samhället, till exempel arbetslöshet eller socialbidrag. Statistiken ger information om hur stor arbetslösheten är och hur många som får socialbidrag. I stora samhällsfrågor är det särskilt viktigt att se hur saker förändras över tiden. Genom siffrorna kan

Page 5: "Klassrummet" -Statistikguiden, SCB, pdf

5Introduktion till statistik

man se om arbetslösheten, eller socialbidragen, ökar eller minskar. Man kan också tränga djupare i frågorna och till exempel se hur arbetslösheten skiljer sig åt mellan personer i olika åldrar.

Bortom siffrorna finns upplevelsenTill slut finns det naturligtvis gränser för vad siffror kan berätta. För att förstå situationen för personer som är arbetslösa, eller har socialbidrag, räcker det inte med att få fram siffror. Då behöver man göra studier av annat slag, till exempel djupintervjuer. Djupintervjuer gör man för det mesta med ganska få personer. Till djupintervjuerna väljer man ut personer som man tycker är typiska för en viss grupp eller för en viss situation som man vill veta mer om, till exempel arbetslösa som är under 25 år. För att få en fördjupad bild av en viss frågeställning behövs med andra ord både siffror och verbal beskrivning.

Del 3: Undersökningens ABCDu gör en statistisk undersökning på ungefär samma sätt vare sig det är en stor studie eller en mindre undersökning. Du formulerar din fråga, bestämmer dig för hur du vill försöka hitta svaret, samlar in information, och försöker svara på frågan.

Här går vi igenom:nFörberedelsernMetoder för att hitta svaretnDra en slutsats och svara på frågannMöjliga fel i arbetet

Förberedelser – bestäm vilken fråga du vill ha svar påDet första steget i en statistisk undersökning är att tydliggöra den frågeställning man vill ha svar på. Vad är det egentligen du vill ha reda på?

SakproblemSakproblem är problem som en statistisk undersökning kan hjälpa till att lösa eller belysa. De är ofta komplicerade och kan handla om politiska, sociala eller ekonomiska frågor. Till exempel vill du kanske ta reda på hur pojkar mellan 13 och 17 år mår.

Statistiskt problemMed utgångspunkt från sakproblemet specificerar du ett statistiskt problem. I exemplet med pojkarna får du fundera ut vad du ska fråga om och som kvantifieras med god kvalitet. Ska du ta reda på hur de växer, hur de sover eller hur ofta de är hemma från skolan?

Page 6: "Klassrummet" -Statistikguiden, SCB, pdf

6Introduktion till statistik

ObjektObjekt är de personer, föremål, händelser eller liknande, vars egenskaper eller attityder du vill studera. I exemplet är det pojkar mellan 13 och 17 år som är objekt.

PopulationEn population är summan av de personer, föremål eller andra objekt som du vill beskriva. Vill du ta reda på hur alla pojkar i hela Sverige mår, pojkarna i din kommun eller pojkarna i din skola?

RamRamen är en lista, förteckning eller ofta en datafil över alla individer i populationen.

UrvalEtt urval är en delmängd av den population som valts ut för en undersökning. Ska du fråga alla pojkarna eller räcker det om du frågar varannan pojke?

Hur stort urval som behövs beror främst av hur stort urvalsfel som kan accepteras, men också på hur detaljerad redovisning som skall göras.

Variabel En variabel är en egenskap som varierar mellan individer. Den kan vara kvantitativ (numeriska värden som ålder, inkomst) eller kvalitativ (icke-numeriska värden som kön, civilstånd). Du kanske vill veta hur pojkar som är med i idrottsföreningen mår jämfört med dem som inte är med i idrottsföreningen. Då behöver man information om vilka som är med i idrottsföreningen för alla dem som ingår i undersökningen.

TabellplanEn tabellplan är en samling skisserade tabeller som undersökningens resultat senare ska presenteras i. Tabellplanen görs redan när du definierar syfte och metod för undersökningen. I exemplet med pojkarna finns tabeller för pojkar som är med i idrottsföreningen, och för dem som inte är med. Du behöver också tabeller för deras ålder och för svaren på de frågor du ställer om hur de mår.

DatainsamlingNär du väl vet vilka frågor du vill ha svar på är nästa steg att bestämma dig för hur du ska samla in uppgifterna.

MätmetodMätmetoden är sättet du skaffar information om undersökningsvariablerna på. Exempel på olika mätmetoder är registerdata (uppgifter som redan finns insamlade), enkäter, telefon- och besöksintervjuer. I exemplet med pojkarna

Page 7: "Klassrummet" -Statistikguiden, SCB, pdf

7Introduktion till statistik

kanske du använder information som redan finns hos skolhälsovården eller så gör du en egen undersökning.

MätinstrumentMätinstrumentet är en blankett där du formulerar frågor. Oavsett om du gör enkäter, ringer upp eller träffar pojkarna så ska du ställa frågorna på samma sätt. Resultaten av datainsamling är ifyllda enkäter och/eller intervjusvar.

DatabearbetningDe insamlade uppgifterna granskas, kodas (uppgifter om till exempel kön eller utbildning får en sifferbeteckning) och registreras.

Dra en slutsats och svara på fråganNär svaren är insamlade är det dags att sammanställa svaren. Det gör du genom att beräkna resultaten från undersökningen i form av tabeller.

Analys och publiceringAnalys och publicering är de sista stegen i processen. Då sammanställs resultaten, oftast i form av tabeller eller diagram och resultaten kommenteras. Vilka slutsatser kan man dra från undersökningen?

Många orsaker till fel i en undersökning Fel är avvikelser från ett sant värde. Det innebär att undersökningen inte svarar på frågan på ett korrekt sätt. Varje steg i undersökningen kan bidra till fel. Här går vi igenom de vanligaste.

TäckningsfelTäckningsfel uppstår på grund av brister i ramen (förteckningen över vilka som ska ingå):nPersoner som borde ingå i undersökningen men som saknas (t.ex. nyfödda och invandrare).nPersoner som inte ska vara med i undersökningen men som inte sorterats bort (t.ex. avlidna eller emigranter).

UrvalsfelUrvalsfel uppkommer om man undersöker en del av undersökningspopulationen från ett urval.

Bortfallsfel Bortfallsfel beror på att mätvärden för vissa objekt saknas. Bortfallet kan dels bero på att personer inte vill delta i undersökningen eller inte går att få tag på, dels på uteblivna svar på någon eller några frågor.

Page 8: "Klassrummet" -Statistikguiden, SCB, pdf

8Introduktion till statistik

MätfelMätfel kan bero på att fel person svarar på frågorna, att intervjuaren ställer frågorna på ett ledande sätt eller skriver ner svaren felaktigt. Det kan också bero på fel i frågeställningen, det vill säga att en fråga är fel formulerad.

BearbetningsfelBearbetningsfel kan bero på att uppgifter kodats eller registrerats fel.

Del 4: Statistisk årsbokStatistisk årsbok för Sverige är en bok som rymmer hela det svenska samhället. Genom texter, tabeller, kartor och diagram får du veta hur det ser ut i Sverige – egentligen.

Hur många heter Amanda? Erik? Hur många bebisar föddes under en vanlig vecka? Hur mycket godis sätter familjen Medelsvensson, förlåt, Johansson, i sig varje vecka? Hur många 16 – 24-åringar misshandlades 2007? Ja, detta och mycket, mycket mer hittar du i Statistisk årsbok. I Statistisk årsbok finns nämligen hela Sverige i sammanfattad form. Boken är i färg och innehåller kartor, texter, diagram och tabeller.

Studiematerial för Statistisk årsbok finns på SCB.se

Uppslagsverk eller nöjesläsningAnvänd boken som uppslagsverk. Det är enkelt. Varje kapitel inleds med en klickbar innehållsförteckning över alla tabeller, diagram och texter. Det är bara att välja vad du vill veta mer om.

Du kan också använda boken för nöjesläsning. Många udda statistikredo-visningar ger dig säkerligen en och annan aha-upplevelse. Eller så kan du glänsa lite med ditt vetande: ”Visste du att av de barn som föddes 2008 så föddes flest tisdagen den 6 maj? 379 stycken? Visste du att bland de 100 dagarna med flest födda, föddes ingen alls på en lördag?”

Uppgifterna har du givetvis fått från Statistisk årsbok.

Surfa vidareOch om du vill veta mer om ett ämne, klickar du bara på källhänvisningen längst ner på sidan. Därifrån kan du sedan surfa vidare. Och en ny värld full av siffror, tabeller och diagram öppnar sig.

Statistisk årsbok för Sverige finns både i bokform och som pdf-fil på webben. Det är gratis att ladda ner boken som pdf.

Page 9: "Klassrummet" -Statistikguiden, SCB, pdf

9Undersökning och urval

UNDERSÖKNING OCH URVAL

Del 1: Frågeteknik”Skräp in, skräp ut” är ett uttryck som används om statistik. Om den information som analyseras är dålig spelar det ingen roll vilka metoder eller verktyg man använder. Genom att ställa rätt frågor på rätt sätt slipper du få in skräp i din undersökning.

Här går vi igenom:nFrågekonstruktionnVanliga konstruktionsfelnÅteranvändning av frågornFrågor för internationella undersökningar

Det finns många fallgropar när man gör en undersökning. Vanliga fel är att man inte har tillräckligt tydliga definitioner på det som ska mätas, eller att man använder fel metoder när man samlar information eller analyserar den. En definition är en förklaring av något som gör att alla uppfattar det på samma sätt.Om du till exempel vill att alla ska tänka på en joggingsko är det bättre att nämna det som är speciellt för den sortens sko än att bara säga sko. En metod är det sätt man väljer att göra något på. När det gäller datainsamlingen kan det handla om att be människor svara på en enkät, ringa dem eller träffa dem personligen när man vill få svar på frågor.

Att göra frågorna – frågekonstruktionFör att få en bra undersökning behöver man vara noga med frågorna. Olika personer kan uppfatta en fråga på olika sätt. Hur gammal man är, vad man jobbar med, hur bra man är på svenska är saker påverkar hur man uppfattar en fråga. Svarsalternativen är också viktiga eftersom alla som är med ska uppfatta svarsalternativen på samma sätt. Om en fråga uppfattas på olika sätt av olika personer blir det svårt att tolka svaren. I värsta fall blir hela undersökningen omöjlig att använda. De som är med har ju svarat på «olika» frågor.

Du som gör frågorna måste alltså veta vilka som ska besvara frågorna. Hur svåra ord förstår de? Vad vet de om det som de ska svara på? Vilka ord behöver

Page 10: "Klassrummet" -Statistikguiden, SCB, pdf

10Undersökning och urval

förklaras? Att göra bra frågor är svårt. Ett sätt att lära sig är att titta på andras frågor och fundera på vad som inte är så bra med dem. Tänk på undersökningar du själv svarat på, till exempel från skolhälsovården om trivsel i skolan, om motion och sömn eller om alkohol och droger.

Vanliga fel vid frågekonstruktionHur ska du ställa frågorna i en undersökning? Det är svårt att svara på den frågan för det beror ju helt och hållet på vad du vill veta. Det är enklare att förklara hur du inte ska ställa dina frågor. Att det är enklare beror på att de vanligaste felen ser likadana ut oavsett vilken undersökning man arbetar med.

1: Tid och rum (när och var)Exempel: Läser du någon kvällstidning? Frågan kan uppfattas lite olika eftersom frågan inte tar upp någon speciell tid. Några kan svara nej, för de läser bara tidningen på helgerna och inte varje dag. För att frågan ska bli rätt behöver du veta varför du vill veta om någon läser kvällstidningen. Vill du veta vem som läser kvällstidningar mest varje dag kan frågan vara: Läser du någon kvällstidning minst fem dagar i veckan?

2: Obestämda frågor och oklara svarExempel: Hur ofta gick du i kyrkan förra året? Svarsalternativen är: Aldrig, Sällan, Då och då och Regelbundet. I det här exemplet är svarsalternativen alltför oklara. Olika personer tycker att uttryck som ”sällan, då och då, ibland eller ofta” betyder olika saker i verkligheten. Det är bättre att göra tydliga svar, det vill säga hur många gånger om dagen, i veckan, i månaden eller om året.

3: Man har inte samma erfarenheter som den som svararExempel: Har du någon långvarig sjukdom? Frågan kan uppfattas olika eftersom man menar olika saker med långvarig sjukdom. Ordet långvarig kan uppfattas olika, för någon handlar det om tre veckor, för andra om flera år. Personer med diabetes, allergi och astma, svarar ofta nej på en sådan här fråga. De tycker inte att de är sjuka.

4. Flera frågor i enExempel: Har du ofta, ibland, nästan aldrig eller aldrig haft skuldkänslor för att du varit otrogen mot din partner? Av de som svarar nej på frågan finns säkert många som inte har någon partner, eller som inte varit otrogna. Genom att först be dem som inte har någon partner, och dem som har en partner men inte varit otrogen, gå vidare till nästa fråga hade rätt personer svarat på frågan. En sådan fråga som talar om vilka som ska svara på en speciell fråga och vilka som inte ska svara på just den frågan kallas för filterfråga.

Page 11: "Klassrummet" -Statistikguiden, SCB, pdf

11Undersökning och urval

5: Ja/Nej-frågorNär man frågar om åsikter och värderingar ska du inte använda svar med ja och nej. För många är det lättare att hålla med andra än att säga emot när någon frågar vad man tycker. I exemplet vill man ta reda på hur populär statsministern är. Exempel 1: Tycker du att statsministern XX gör ett bra jobb? Här kan man svara ja eller nej.Exempel 2: Hur tycker du att XX är som statsminister? Här kan man svara Bra, Ganska bra, Ganska dålig och Dålig.

6. Ledande frågor och laddade ordGenom att ställa frågan så att det känns mindre bra att svara på ett speciellt sätt påverkar du den som svarar. På samma sätt påverkar du den som svarar genom att ha med starka ord i frågan. Exempel 1: Tycker du själv att du är positivt inställd till grönsaker? Årets kock säger att grön paprika är gott. Vad tycker du? I den första frågan är det lättare att svara ja” än ett nej. I den andra frågan är det enklare att hålla med en berömd kock än att säga emot. Frågorna blir bättre om du skriver: Är du positivt eller negativt inställd till grönsaker? och En del kockar tycker att grön paprika är gott, medan andra forskare inte tycker att det är gott. Vad tycker du? Exempel 2: I ett experiment ställde ett undersökningsföretag två liknande frågor. Den första var: Inom EU arbetar man för att bilda en valutaunion EMU, med gemensam valuta för de länder som är med i EU. Är du för eller emot att Sverige går med i EMU? Svarsfördelningen blev: För 38 procent, Emot 48 procent och Vet ej 13 procent. Den andra frågan löd: Sannolikt kommer Belgien, Holland, Luxemburg, Italien, Portugal, Spanien, Irland, Frankrike, Österrike, Tyskland och Finland gå med i EMU från start. Om det blir så, tycker du då att Sverige också bör gå med i EMU eller tycker du inte det? Svarsfördelningen blev: Bör gå med 50 procent, Bör inte gå med 42 procent och Vet ej 8 procent. Frågorna i det här experimentet innehåller inte samma sak. I den första frågan förklaras EMU medan den andra frågan utgår från att man vet vad EMU är. Svaren man kunde välja mellan är också olika. De här två olika frågorna ger därför olika svar. Skillnaden i svarsfördelning visar tydligt hur man kan ge olika bilder av vad folk tycker genom att ställa frågorna på olika sätt. De som är osäkra på frågans innehåll, eller på vad de själva tycker, är lättast att påverka.

Page 12: "Klassrummet" -Statistikguiden, SCB, pdf

12Undersökning och urval

Återanvändning av frågorMånga gånger vill du kunna jämföra resultaten av en undersökning med resultaten från tidigare undersökningar. Då vill du gärna använda samma frågor varje gång. Men eftersom den verklighet du vill beskriva, och attityderna till den kan ha förändrats, behöver du tänka igenom om det går. Det är tre saker du behöver svara på innan du bestämmer sig för om man ska använda de gamla frågorna.

1. Gav frågorna säkra resultat då de användes?

2. Är frågorna fortfarande relevanta? Duger samma svarsalternativ?

3. Har språket ändrats så att man ska välja andra ord och skriva på ett nytt sätt?

10 tips när man gör frågor och svar:nNär – tidsbegrepp

nVar – rumsbegrepp

nVad – definition av begrepp

nEn fråga i taget

nAnvänd inte ledande frågor

nAnvänd inte bildspråk

nUndvik oklara svarsalternativ

nUndvik negationer, värderingar och laddade ord

nUndvik laddade ord i påståenden

nUndvik ja/nej-alternativ i attitydfrågor

Del 2: Välja intervjupersonerEnkätundersökningar är det vanligaste sättet att fråga efter information. Djupintervjuer är ett annat vanligt sätt att göra en studie. Innan du gör det ena eller det andra måste du välja ut dina intervjuobjekt.

Här går vi igenom:nDra urvalnVälja personer för telefonintervjuernEnkäter med post och e-postnWebbenkäter

Om du ska göra en statistik undersökning kan du skicka ut enkäter eller intervjua personer. Intervjun kan du göra över telefon. En fördel med telefonintervju är att du får in svaren snabbt. Om du behöver dagsfärska uppgifter i din undersökning kan telefonintervjuer vara det bästa sättet.

Page 13: "Klassrummet" -Statistikguiden, SCB, pdf

13Undersökning och urval

Att skicka ut enkäter tar lite längre tid. Samtidigt påverkas inte svaren av den som intervjuar. Att lägga upp enkäter på webben har blivit allt vanligare. Det går snabbt och är billigt, nackdelen är att du inte vet så mycket om dem som svarar.Urval kallas den grupp av personer, de adresser eller de telefonnummer som du vill kontakta för dina intervjuer

Dra urvalEtt sätt att göra urvalet är att utgå från ett register. Om du slumpvis väljer personer ur ett fullständigt register blir det ett statistiskt korrekt urval under förutsättning att det drogs så att man på förhand visste med vilken sannolikhet varje individ drogs. Det kallas då för ett sannolikhetsurval. Den enklaste formen av sannolikhetsurval är ett så kallat obundet slumpmässigt urval. Där har alla samma chans att komma med. Två saker är viktiga: alla som skulle kunna vara med i undersökningen ska finnas i registret och tillräckligt många personer ska vara med i urvalet.

När du vill ta reda på något om befolkningen i Sverige använder man ofta befolkningsregistret. Du kan göra på samma sätt med till exempel föreningsregister, företagsregister eller andra register som passar för undersökningen.

Ett exempel om tandvård Om du vill ta reda på hur vuxna i Sverige sköter sina tänder och hur mycket pengar de lägger på tandvårdsartiklar använder du befolkningsregistret. Sannolikheten för varje vuxen person i Sverige att komma med i urvalet från befolkningsregistret är lika stor. Ditt urval blir som en miniatyrkopia av den vuxna befolkningen om man dragit det som ett obundet slumpmässigt urval där alla individer haft samma sannolikhet att komma med i urvalet.

Välja personer för telefonintervjuerI en undersökning med telefonintervjuer måste du försöka få tag i personen på telefon. Det finns två sätt att arbeta med telefonintervjuer. Ett sätt är att lotta fram personer ur registret och ta reda på deras telefonnummer. Då måste du bestämma hur du ska göra med dem som saknar telefon eller har hemligt nummer. Ett annat sätt är att slumpa fram telefonnummer ur telefonkatalogen eller slumpa fram själva siffrorna.

Gemensamt för alla telefonintervjuer är att det ibland inte är någon som svarar. Ska du strunta i att försöka få tag i någon på det numret eller försöka igen? Om du bara intervjuar dem som svarar direkt består intervjuerna till stor del av personer som håller sig hemma mycket. Det kan ge en ganska missvisande bild av förhållandena i befolkningen som helhet. Alltså måste du försöka få tag i personerna vid ett senare tillfälle eller på ett annat telefonnummer.

Page 14: "Klassrummet" -Statistikguiden, SCB, pdf

14Undersökning och urval

Statistikens tillförlitlighet vid telefonintervjuerAlla personer har ju inte egen telefon. På vissa telefonnummer bor det flera vuxna. Dessutom går vissa nummer till företag och liknande.

Ett sätt att lösa problemet med att det bor flera vuxna på samma telefonnummer är att fråga hur många personer som bor i hushållet. Svaren från gifta och sambor kan viktas upp så att de får väga dubbelt så tungt som svar från dem som bor en vuxen på varje telefonnummer. Varje vuxen person som bor ihop med en annan vuxen räknas alltså som två – sig själv och sambon/makan.

Det finns några frågor kvar att fundera över. Är det samma chans för män som för kvinnor att komma med i telefonintervjuerna? Ska du intervjua den som först lyfter på luren? Att alltid intervjua den som svarar i telefon är inte bra. Det är bättre att fråga vilka personer som bor i hushållet och sedan välja rätt person av dem utifrån ditt urval.

En annan nöt att knäcka är när ingen svarar. Ska du strunta i att försöka få tag i någon på det numret? Men då skulle urvalet till stor del bestå av de grupper som håller sig hemma mycket. Det kan ge en ganska missvisande bild av förhållandena i befolkningen som helhet.

Enkäter med posten eller e-postenNär du skickar enkäter med post eller e-post är det viktigt att enkäten är lätt att förstå. Den som svarar ska både förstå varför den ska svara, vad svaren kommer att användas till, och hur man ska fylla i enkäten. Det är också bra att skicka med ett färdigadresserat och frankerat svarskuvert om svaren ska skickas in med post.Precis som vid telefonintervjuer kan du lotta fram personer ur ett register, men du tar reda på deras post eller e-postadress. Då måste du bestämma hur du ska göra med dem som saknar adress eller har hemlig adress.

En annan nöt att knäcka är när posten kommer i retur, när e-posten studsar eller när du inte får svar. Ska du strunta i att försöka få in enkätsvaren från dem som inte svarar? Men då skulle urvalet till stor del bestå av de grupper som har aktuella adresser eller som snällt svarar på post- eller e-postenkäter. Det kan ge en ganska missvisande bild av förhållandena i befolkningen som helhet. Det bästa är om du försöker hitta en fungerande adress och/eller skickar enkäten igen.

Enkät på webbenSjälva enkäten på webben skiljer sig inte så mycket från den man skickar med posten. En skillnad är att många snabbt väljer bort saker på webben om deras intresse inte fångas direkt: du måste alltså snabbt tala om varför de ska delta i undersökningen.

Page 15: "Klassrummet" -Statistikguiden, SCB, pdf

15Undersökning och urval

Den stora skillnaden är att du inte riktigt vet vem som svarar. Det kan ju vara vem som helst som besöker webbplatsen. Därför får du be alla fylla i uppgifter om sådant som är viktigt, till exempel kön, ålder, bostadsort eller utbildning. Du kan också välja om enkäten ska visas direkt för alla som besöker webbsidan, om den ska visas när man klickar på speciella sidor eller om den ska visas först när man besökt ett visst antal sidor.

För att hindra att samma person svarar på enkäten flera gånger använder du en teknik som lagrar markörer i besökarens dator, så kallade cookies. De talar om för enkäten att personen som använder datorn redan besökt sidan och svarat på enkäten.

När de svarande är de som besöker en plats på webben blir resultatet inte ett sannolikhetsurval och man kan inte dra slutsatser för fler individer än de som svarade.

Om man vill kunna dra slutsatser för en större population från en undersökning på webben måste man även här dra ett sannolikhetsurval och då krävs som regel att man tar kontakt med alla per brev eller telefon och uppmanar dem att gå in på webben och fylla i enkäten.

Välja rätt metodSom du ser har alla metoder sina för- och nackdelar. Om allt ska göras statistiskt korrekt måste du tänka igenom din metod noga. Men det är inte alltid som en undersökning behöver vara helt statistiskt korrekt.. Hur noga du måste vara beror på vad du vill använda undersökningens resultat till. Vill du få en grov uppskattning av vad många tycker så kan lägre kvalitet fungera bra. Ska du däremot fatta viktiga beslut behöver du vara mer säker på att resultaten är helt korrekta.

Del 3: Undersökning med urvalSamhället behöver statistik inom många olika områden. Men det är för dyrt och besvärligt att regelbundet samla in uppgifter om varenda person i Sverige. Det finns ett enklare sätt som ofta räcker bra; att använda ett urval.

Här går vi igenom:nurvalsundersökningarnslumpens betydelse

Page 16: "Klassrummet" -Statistikguiden, SCB, pdf

16Undersökning och urval

Att man kan göra pålitlig statistik med hjälp av urval kan verka som lite av trolleri. Man går ut till personerna i ett urval av befolkningen, kanske några tusen personer, och ställer vissa frågor om dem. Utifrån svaren kan man sedan räkna fram statistik som gäller för befolkningen som helhet.

För att undersökningen ska vara tillförlitlig behöver den göras på rätt sätt. Bland det viktigaste är att personerna som är med i undersökningen väljs slumpmässigt och med på förhand kända urvalssannolikheter. Ett exempel på urvalsdragning är att dra lotter ur en tombola. I praktiken dras urvalen för större undersökningar med hjälp av särskilda datorprogram.

Urvalet hjälper oss att se helhetenIdén med urvalsundersökningar är ganska enkel. Vi tar ett exempel: Du är intresserad av att få veta hur stor andel av alla ungdomar som använder internet varje dag. I ett sannolikhetsurval visar det sig att 85 procent av alla ungdomar gör det. Du kan då dra slutsatsen att också av samtliga ungdomar i hela Sverige är det ungefär 85 procent som använder internet varje dag. På så sätt kan du ta fram statistik som gäller en grupp som helhet, trots att du bara har uppgifter från ett urval personer ur den gruppen.

Det fungerar om…Det är egentligen fantastiskt att det fungerar. Men det gör det – om bara de rätta villkoren är uppfyllda! Ett par av de viktigaste villkoren är att: nurvalet ska vara slumpmässigt och med på förhand kända urvalssannolikheter nurvalet skall vara tillräckligt stort.

Slumpen har fasta vanor Tänk dig ett stort lotteri där det är vinst på 10 procent av antalet lotter. När du drar en enstaka lott beror det på slumpens nycker om det blir en vinst eller en nitlott. Resultatet går inte att förutsäga. Men det blir annorlunda om du drar ett stort antal lotter, säg 1000 lotter. Då visar det sig ganska säkert att du bland dessa 1000 lotter får ungefär 10 procent vinster. Andelen vinster blir ungefär lika stor som i hela lotteriet, alltså 10 procent. När slumpmomentet upprepas, genom att du drar ett stort antal lotter, händer alltså något märkligt – slumpen tappar en del av sin ökända nyckfullhet. Resultatet blir nu ganska pålitligt, i form av ungefär ett visst antal vinster. Fenomenet kallas de stora talens lag.

Går det att få grepp om slumpen?Med 10 procent vinster på 1000 lotter får du 100 vinster. Naturligtvis kan du inte vara säker på att det blir på pricken 100 vinster på de 1000 lotterna, bara att det blir däromkring. Slumpens lagbundenhet är trots allt inte exakt. Men det går att få grepp om det problemet också ...

Page 17: "Klassrummet" -Statistikguiden, SCB, pdf

17Undersökning och urval

Vi fortsätter vårt exempel Vi tänker oss att du gör om alltihop ett stort antal gånger. Du drar 1000 lotter i ett stort lotteri med 10 procent vinstlotter och räknar antalet vinster på dessa lotter. Sen upprepar du den proceduren många gånger. Du ser då hur antalet vinster varierar från gång till gång. Första gången blir det kanske 94 vinster, andra gången 113 vinster, tredje gången 102, och så vidare. Då talar man om slumpmässig variation eller slumpvariation. I sina variationer håller sig antalet ändå troget ganska nära 100. Lagbundenheten visar sig alltså klart. Antalet gånger du får olika antal vinster kommer i det långa loppet att fördela sig på ett visst sätt.

I vårt exempel har fördelningen en topp kring 100 vinster. Det är alltså det mest sannolika antalet vinster, men ändå liten sannolikhet att det blir exakt 100 vinster. Ju mer ett tal avviker från 100, desto mindre sannolikt är det att antalet vinster blir just det talet. Som tur är behöver du inte alls dra massor av lotter i många omgångar för att komma fram till det, utan det går att räkna ut med hjälp av en sannolikhetskalkyl.

Från lotteri till urvalsundersökning Tack vare slumpens trogna lagbundenhet kan ett sannolikhetsurval ge en god bild av hela befolkningen eller den grupp av befolkningen du vill undersöka. Men den slumpmässiga variationen gör att bilden blir lite osäker. Sannolikhetskalkylen är ett utmärkt verktyg för att belysa hur stor den osäkerheten är.

Del 4: Test och experimentMänniskor är olika, och reagerar olika. Man påverkas olika av sådant som man utsätts för. Man reagerar också olika i olika situationer. Det gäller kemiska ämnen man får i sig och information man får. Det behöver man ta hänsyn till när man undersöker samband mellan människans reaktioner och saker som händer.

Här går vi igenom:nKontrollnFörsökspersoner och kontrollpersonernBlindprov

När man vill undersöka om ett nytt kemiskt preparat kan användas som läkemedel mot en viss sjukdom måste man noga testa ut att det fungerar som avsett och inte ger oacceptabla biverkningar. Lika viktigt är det när man ska pröva om en ny undervisningsmetod är mer effektiv än andra metoder. Det räcker inte att prova läkemedlet på en patient, eller undervisningsmetoden på en elev. Resultatet av ett test med en person kan bero på rena tillfälligheter.

Page 18: "Klassrummet" -Statistikguiden, SCB, pdf

18Undersökning och urval

För att testet ska säga något om läkemedlets eller undervisningsmetodens effekt måste det utföras på tillräckligt många personer. I grunden är det ett statistiskt problem. Med hjälp av statistisk analys kan man ta reda på hur tillförlitliga testen är.

Experiment under kontrollFör att den statistiska analysen ska bli rättvisande behöver testet följa ganska strikta normer. Ett vanligt sätt är att ha testgrupper med försökspersoner och se till att man har kontroll över det som kan påverka resultatet.

Vi fortsätter vårt läkemedelstest. Normalt utgår man från en grupp personer som lider av en viss sjukdom. Gruppen delas slumpmässigt in i två undergrupper. Man kallar den ena gruppen för försöksgrupp och den andra för kontrollgrupp. Personerna i försöksgruppen får behandling med den medicin man testar, medan de i kontrollgruppen inte får någon annan behandling än den de haft innan testet. Sedan kan man jämföra hur många som blir friskare i de båda grupperna.

Ta slumpen till hjälp Det man vill veta är om de i testgruppen blir friskare än personerna i kontrollgruppen. Om de blir det beror det troligen på medicinen. Om de inte blir det så visar testet att medicinen troligen inte hjälper mot den sjukdomen.

För att man ska kunna lita på resultatet får inte grupperna vara olika på något annat sätt än att försöksgruppen får medicinen medan kontrollgruppen inte får medicinen. Om det finns någon annan viktig skillnad mellan de båda grupperna är det ingen idé att göra experimentet. Tänk om det redan från början var fler sjuka i den ena gruppen än i den andra. I så fall kan det vara därför som det var olika många sjuka i de olika grupperna efter testet. Samma problem får man om personerna i den ena gruppen är svårare sjuka, har andra sjukdomar som påverkar den man vill testa i experimentet. På samma sätt är det bra om grupperna har lika många kvinnor som män, unga som gamla.

För att testresultatet inte ska påverkas av att grupperna är olika tar man slumpen till hjälp. I princip lottar man ut personerna till försöks- och kontrollgruppen. Om det är tillräckligt många personer med i experimentet kommer slumpens lagar att sköta jobbet. De garanterar att de båda grupperna får ungefär likvärdig sammansättning av personer med olika förutsättningar. Då blir det meningsfullt att jämföra grupperna och man kan dra de slutsatser om medicinen som man ville undersöka.

Fast slumpen för ändå med sig en osäkerhet som man behöver ta hänsyn till. Men osäkerhet på grund av slump har en mycket bra egenskap; den kan beräknas med hjälp av en sannolikhetskalkyl. Det kan du läsa mer om i kapitlet «Räkna rätt».

Page 19: "Klassrummet" -Statistikguiden, SCB, pdf

19Undersökning och urval

Ännu mer kontroll När man prövar något nytt vill man vara riktigt säker på att man har försökssituationen under kontroll. Medicinen kan ju påverka sjukdomen, men tänk om det räcker med tanken på att man ska bli friskare för att någon ska känna sig bättre? Eller tänk om en ny undervisningsmetod gör att eleverna lär sig bättre bara för att den är ny och annorlunda?

Därför brukar man utföra experiment på ett sätt som kallas blindprov. Med det menas att ingen mer än de som arbetar med själva experimentet vet vilka som tillhör försöksgruppen respektive kontrollgruppen.

I vårt läkemedelsexperiment får personerna i kontrollgruppen ett så kallat placebopreparat. Det är ett fysiologiskt verkningslöst medel, ibland kallas de för “sockerpiller”. På så sätt påverkas personerna i de båda grupperna lika mycket av sin tro på att ett nytt läkemedel kan hjälpa. Då kan man vara säkrare på att skillnaden mellan de två grupperna efter testet beror på medicinen.

Många tillämpningsområdenKontrollerade experiment där man jämför slumpmässigt indelade grupper av personer används inom många olika områden. I medicinska studier och inom beteendevetenskaper som psykologi, pedagogik och sociologi är de vanliga. På samma sätt som man studerar ett läkemedels verkan kan man jämföra olika pedagogiska metoder, eller hur man uppfattar olika meddelanden. Samma idéer används också i odlingsförsök med växter och i experiment med djur. För det mesta kan man inte vara fullt lika strikt som när man provar läkemedel. Ett pedagogiskt försök går inte att utföra som ett riktigt blindprov. Därför har sådana experiment inte samma säkerhet.

Som ett exempel vill man undersöka effekten av att eleverna använder datorer i skolan. Det kan då vara svårt att veta om en förändring beror på datorteknikens pedagogiska egenskaper, eller om det beror på att elevernas attityder till datorer påverkar deras motivation att lära sig.

Statistiska undersökningar är inte experimentDet finns en likhet mellan statistiska urvalsundersökningar och sådana här experiment. Men en statistisk undersökning i vår vanliga mening är inte något kontrollerat experiment. Där observerar man verkligheten som den är utan att ha någon särskild kontroll över människors situation. När man analyserar samband utifrån statistiska undersökningar kan det vara nyttigt att tänka på vad som egentligen behövs för att visa samband i ett regelrätt experiment.

Page 20: "Klassrummet" -Statistikguiden, SCB, pdf

20Kvalitet i statistiken

KVALITET I STATISTIKENLär dig granska statistik och undvik fällorna. I det här avsnittet går du igenom hur viktigt det är med kvalitet i alla delar av statistiken. Du får också lära dig vad felmarginaler är, och bli uppmärksam på några vanliga fel som man kan göra när man använder statistik.

Del 1: Kvalitet hela vägenFör att statistik ska hålla hög kvalitet behöver några övergripande villkor vara uppfyllda. Om de inte är det spelar enskilda delar, som att du ställt frågorna rätt eller räknat noggrant, inte så stor roll. Resultatet av undersökningen håller ändå låg kvalitet.

Här går vi igenom:n Innehålletn Tidsaspektenn Tillförlitlighetenn Tillgängligheten

Man kan säga att kvalitet är sådant som är betydelsefullt för att en kund eller en användare ska känna sig nöjd med en vara eller tjänst. Men olika personer vill förstås använda statistiken på olika sätt. Därför kan olika saker vara viktiga för olika personer. Vad som är viktigt beror på vad de ska använda statistiken till.

För de allra flesta är det några saker som är extra viktiga för statistikens kvalitet. Det är innehållet, tidsaspekten, tillförlitlighet och tillgänglighet. De kallas kvaliténs huvudkomponenter.

InnehålletInnehållet är vad statistiken handlar om. För att du ska kunna tolka statistiken rätt är det viktigt att veta att man menar samma sak med ett begrepp. Till exempel kan begreppen inkomst eller arbetslös definieras på olika sätt i olika undersökningar.

TidsaspektenOfta vill du ha så aktuella uppgifter som möjligt. Men ibland vill du göra jäm före l ser bakåt i tiden och istället ha äldre siffror. Jämförelser mellan olika tider kan vara luriga.

Page 21: "Klassrummet" -Statistikguiden, SCB, pdf

21Kvalitet i statistiken

Till exempel är det inte säkert att man samlat in statistiken på samma sätt under olika tidsperioder. I sådana fall är det kanske inte är precis samma sak man jämför.

TillförlitlighetTillförlitlighet gäller precisionen i de statistikvärden man tagit fram. God tillförlitlighet får man med litet urvalsfel, lågt bortfall, små svarsfel och god täckning av populationen.

TillgänglighetResultaten av en statistisk undersökning ska vara lätta att få tag på och lätta att förstå för dem som vill använda dem. Statistiken ska presenteras på ett sådant sätt att det är lätt för användarna att hitta och förstå den. På en webbplats betyder det att det ska vara lätt att hitta det man letar efter. Det ska också vara lätt att förstå det som man läser eller tittar på.

Del 2: FelmarginalerNär du gör en undersökning frågar du ofta ett urval personer. Om du gör urvalet på rätt sätt går undersökningens resultat att lita på. Ändå finns det alltid en liten osäkerhet kvar...

Här går vi igenom:n Urvalsfeln Felmarginal

UrvalsfelNär du använder urval uppstår en viss osäkerhet. Den osäkerheten kallas för urvalsfel. En bra sak med urvalsfelen är att du för det mesta kan få veta hur stora de är. Urvalsfelen beror på tillfälligheter i hur det urval du dragit ser ut, det vill säga hur slumpen spelar in. Med hjälp av sannolikhetskalkyler kan du beräkna hur stor osäkerheten är.

Konfidensintervallet anger felets storlekFrån en undersökning som baserats på ett sannolikhetsurval kan man beräkna det värde man vill skatta inte bara som ett enda värde utan också med ett intervall s.k. konfidensintervall.

Ofta väljer man att använda ett konfidensintervall på 95%. Det innebär att om man skulle upprepa undersökningen så skulle vi i 19 fall av 20 täcka in det sanna (men okända) värdet.

Intervallets storlek beror av antalet observationer i urvalet och hur stor spridning variabeln har.

Page 22: "Klassrummet" -Statistikguiden, SCB, pdf

22Kvalitet i statistiken

Felmarginal viktig att känna tillOsäkerheten, eller felmarginalen, kan ha betydelse för hur statistiken kan användas. Ibland vill man få en grov uppfattning om hur utbrett ett speciellt problem är i samhället. I andra fall vill man veta något på en mer detaljerad nivå. Då kan även små osäkerheter vara betydelsefulla. Det beror på att de skillnader man vill veta mer om kan vara mycket små. Innan man drar slutsatser om skillnader gäller det att jämföra skillnadens storlek med hur stor osäkerheten är. Är skillnaden något att bry sig om, eller är den så liten att den inte spelar någon roll? I det fall differensen ligger inom felmarginalen innebär det att den är så liten att den ryms inom osäkerheten och att någon säkerställd skillnad inte finns. Det finns också andra typer av osäkerhet i statistiska undersökningar. Om det kan du läsa mer i delen Fel i statistiken.

Del 3: Fel i statistikenI den bästa av världar skulle du i en frågeundersökning få in svar från alla personer i hela befolkningen. Frågorna skulle vara så bra utformade att alla skulle förstå dem utan problem. Alla skulle svara ärligt och noga genomtänkt. I verkligheten är det inte så.

Här går vi igenom:n Urvalsfeln Bortfallsfeln Mätfeln Slumpmässiga feln Systematiska fel

Ofta finns en skillnad mellan vad du vill kunna beräkna och vad du faktiskt kan beräkna. Genom att vara noggrann när du genomför en undersökning kan du undvika de grova felen.

Olika typer av felI vanliga frågeundersökningar som rör personer är de viktigaste typerna av fel urvalsfel, bortfallsfel och mätfel.

Urvalsfel kan du få om en undersökning bygger på svar från ett urval personer och inte från hela befolkningen. Resultatet av undersökningen påverkas av vilka personer man fick med när man slumpade fram urvalet.

Bortfallsfel beror på att du inte får svar från alla personerna i urvalet. Det finns alltid ett antal personer som är med i urvalet som man inte får svar från. Somliga får man inte tag i, och andra vägrar svara. Man kan inte veta hur de skulle ha svarat. Statistiska metoder för att skatta en företeelse i en population förutsätter

Page 23: "Klassrummet" -Statistikguiden, SCB, pdf

23Kvalitet i statistiken

att man har svar från samtliga individer i urvalet. Bortfallet resulterar därför i att skattningar får en skevhet (bias) och kan i vissa undersökningar vara en allvarlig felkälla.

Mätfel har att göra med att de svar man får på frågorna kan vara osäkra eller felaktiga. De som svarar kan ha missförstått en fråga eller ger av andra anledningar inte ett korrekt svar.

Slump eller systematik?Olika slags fel uppträder på olika sätt. Det finns slumpmässiga fel, som växlar efter tillfälligheterna, och det finns systematiska fel som snedvrider resultaten. Urvalsfelen är av typen slumpmässiga fel.

Exempel där urvalsfel ger osäkra resultatTänk dig att du ska mäta sysselsättningen i befolkningen. Genom urvalsfel kan det beräknade antalet sysselsatta hamna för högt lika väl som det kan hamna för lågt. Hur det blir avgörs av slumpen när urvalet dras.

Bortfallet däremot tenderar att ge ett systematiskt fel. Med det menas att bortfallet orsakar en genomgående tendens till snedvridning och att olika fel inte tar ut varandra.

Exempel där bortfallet får stor betydelse Socialt svaga personer kan vara svåra att nå. Därför uteblir svar troligen oftare från personer utan jobb. När man då beräknar sysselsättningen i befolkningen utifrån de svar man fått, så finns en risk att man överskattar den. Det går att försöka kompensera för detta fel när man räknar fram resultaten genom särskilda metoder, men ändå återstår en betydande osäkerhet.

Mätfelen har både en slumpmässig och en systematisk del. De slumpmässiga mätfelen speglar en allmän osäkerhet i svaren. Det finns alltid en viss risk att ett svar råkar bli ett annat än det som stämmer med verkligheten. Är oturen framme kan kanske ett ”ja” råkar bli ett ”nej” eller tvärtom.

Systematiska mätfel däremot uppstår om många feltolkar en fråga på ett visst sätt. Resultaten blir då snedvridna genom att de delvis bygger på den felaktiga tolkningen.

Page 24: "Klassrummet" -Statistikguiden, SCB, pdf

24Räkna rätt

RÄKNA RÄTTMedelvärde, median, olika spridningsmått och sannolikheter är centrala termer inom statistiken. I det här avsnittet får du lära dig vad de innebär. Genom enkla övningar visar vi också hur du kan använda dig av dem.

Del 1: Central- och spridningsmått

Medelvärde och medianMedelvärdet är summan av alla värden i materialet delat med antalet värden. Medelvärde används för att representera ett genomsnitt för en mängd värden, till exempel genomsnittlig årsinkomst eller genomsnittliga betyg. Det vanliga medelvärdet kallas också aritmetiskt medelvärde.

Här går vi igenom två centralmått:nMedelvärdenMedian

Räkna ut medelvärdetMedelvärde ger en bra översikt över en grupp. Det man behöver veta är hur många som är med i gruppen, och vilket värde var och en har.

Exempel med årsinkomstRäkna ut årsinkomsten för en grupp på tio personer. Deras årsinkomster finns i tabellen.Person A – 0 kronor Person B – 225 000 kronor Person C – 232 000 kronor Person D – 286 000 kronor Person E – 299 000 kronor Person F – 325 000 kronor Person G – 377 000 kronor Person H – 387 000 kronor Person I – 401 000 kronor Person J – 450 000 kronor

Page 25: "Klassrummet" -Statistikguiden, SCB, pdf

25Räkna rätt

Första frågan man ska ställa sig är om alla personer skall ingå i beräkningen av medelvärdet för årsinkomsten. Som vi ser finns det en person som har noll kronor i inkomst. Den personen är alltså inte inkomsttagare.

Matematiskt sett är det inget fel att ta med personen som saknar inkomst. Om du vill veta medelvärdet för hela gruppen ska den personen vara med när du räknar. Första steget är att räkna ihop totalsumman av personernas inkomster. Summan blir 2 982 000.

Andra steget är att dividera den summan med antalet personer i gruppen, alltså talet 10. Resultatet blir: 2 982 000/10 = 298 200. Hela gruppens medelinkomst är 298 200 kronor.

Man kan också enklare beskriva beräkningen som följer. Om vi kallar medelvärdet för M och de tio personernas inkomster för x1, x2 …..x10 så räknar vi ut medelvärdet

- -

som kan skrivas kortare

Alternativ där inte hela gruppen ingårOm du bara vill veta medelvärdet för dem med inkomst ska den personen inte vara med när du räknar. Du gör på samma sätt som när du räknar ut medelvärdet för hela gruppen, men ska nu dela den totala inkomsten med nio personer.

Första steget är att räkna ihop totalsumman av personernas inkomster. Summan blir 2 982 000. Andra steget är att dividera den summan med antalet personer i gruppen bortsett från personen utan inkomst, alltså talet 9. Resultatet blir: 2 982 000 / 9 ≈ 331 333. Inkomsttagarnas medelinkomst blir i detta fall 331 333 kronor.

Medianen – ett annat centralmått Medianen är ett det gränsvärde som delar gruppen i två lika stora halvor. Ena halvan av gruppen har ett värde som ligger över den gräns som medianen anger, och den andra halvan av gruppen har värden under. Medianen är enklast att räkna ut i en grupp med udda antal medlemmar, men det går också att räkna ut det för en grupp med jämnt antal medlemmar.

Vi börjar med det enklaste – att räkna ut medianen när gruppen har ett udda antal medlemmar.

Exempel där vi tar fram median utan person AI vårt exempel med årsinkomsterna gör vi det genom att ta bort person A som inte har någon inkomst.

Page 26: "Klassrummet" -Statistikguiden, SCB, pdf

26Räkna rätt

Första steget: I tabellen med årsinkomster ser vi att person F har 325 000 kr i inkomst. Om vi bortser från person A som saknar inkomst är det fyra inkomsttagare som ligger under F i inkomst. Det är lika många personer som ligger över F. Det betyder att F med sin inkomst ligger precis i mitten bland inkomsterna. De som har lägre och de som har högre inkomst än F är lika många. F:s inkomst som ligger i mitten är medianen för dem med inkomster i gruppen. Medianen = 325 000.

När inget värde ligger i mittenInte fullt lika enkelt blir det när man vill ha medianen för en grupp med jämnt antal medlemmar. Då finns det ingen person som ligger i mitten.

Exempel där vi räkna fram medianen med hjälp av medelvärdet av de två mittersta individerna Gränsen mellan den undre och den övre halvan behöver gå mitt emellan person E och person F som är nr fem och nr sex i gruppen. Medianen beräknas som medelvärdet av inkomsterna för E och F. Medianinkomsten för hela gruppen blir alltså 299 000+325 000 /2 = 312 000.

Hur ska man välja?Beroende på vad man vill undersöka kan aritmetiskt medelvärde eller median vara lämpligast. Man kan också presentera båda. Ett genomsnitt har fördelen genom att man tar hänsyn till alla mätvärdena i gruppen. Å andra sidan i det fall någon i gruppen har ett extremt värde som drar upp hela gruppens genomsnitt kan medianen vara mer relevant att visa. I detta fall är det ju endast mittenindividens värde som beaktas.

Hur man väljer inom gruppen som man räknar på spelar också in. I vårt exempel gäller det att välja mellan genomsnittet för enbart inkomsttagare eller för alla personer.

Skillnaderna mellan metodernas resultat märks tydligt även om de inte är så stora i vårt exempel. I statistik vill man ofta göra jämförelser mellan grupper över tiden. Då kan ganska små skillnader vara betydelsefulla.

Standardavvikelse och kvartilerStatistik omfattar inte endast centralmått. Ofta vill man också se hur spridningen för variabeln ser ut. Det räcker inte att veta hur stor den genomsnittliga inkomsten är, utan minst lika intressant är att se i vilken utsträckning den är ojämnt fördelad.

Page 27: "Klassrummet" -Statistikguiden, SCB, pdf

27Räkna rätt

Här går vi igenom två spridningsmått:nStandardavvikelsennKvartiler

Räkna ut standardavvikelsenStandardavvikelsen (σ) är den genomsnittliga avvikelsen från variabelns genomsnitt. Man bildar då differenserna för alla variabelvärde x1 – M, x2 –M, ….. x10 –M.I nästa steg kvadrerar man dessa avvikelser, summerar, dividerar med antal observationer och sist drar kvadratroten ur.

Detta kan enklare skrivas

och för beräkning används med fördel

Räkna ut kvartilerSom vi såg ovan räknar man ut medianen genom att sortera alla variabelvärden efter storlek. Det mittersta värdet är medianen.

För att beskriva spridningen i variabeln kan man använda andra värden än det mittersta. Ett exempel är att beräkna kvartiler som delar in populationen i fyra lika stora grupper med hjälp av tre värden.

Om populationen består av 11 observationer sorterade på den variabel vi är intresserade av med lägst värde först så är det 3:e värdet den första kvartilen, det 6:e värdet andra kvartilen och det 9:e värdet den 3:e kvartilen.

I exemplet är kvartilerna markerade med fet stil: 1 2 3 4 5 6 7 8 9 10 11Kvartiler brukar betecknas med Q1, Q2 och Q3. Den andra kvartilen Q2 är också medianen.

Ett vanligt mått på spridning är kvartilavståndet som är differensen Q3 – Q1.Som alternativ till kvartiler kan man använda deciler eller percentiler. Deciler innebär att man delar in populationen i 10 grupper medan percentiler omfattar hela 100 grupper.

Den allmänna benämningen på denna typ av spridningsmått är fraktiler.

Page 28: "Klassrummet" -Statistikguiden, SCB, pdf

28Räkna rätt

Del 2: Sannolikhet och slumpMed sannolikheter kan man få reda på saker som det är svårt att gissa sig till. Hur troligt är det att man någon gång har tur och vinner på ett lotteri? Sådant går att ta reda på genom att räkna ut sannolikheten.

Här går vi igenom:nSannolikhetnSannolikhetsberäkningarnSannolikhetslärans multiplikationssats

Sannolikheten för en händelse är alltid ett tal mellan noll och ett. Sannolikheten är noll (0) för en händelse som omöjligt kan inträffa. Till exempel kan man aldrig få en åtta när man kastar en vanlig tärning med sex sidor. Någon sida med åtta prickar finns ju inte på tärningen. På motsvarande sätt är sannolikheten lika med ett (1) för en händelse som absolut säkert kommer att inträffa.En tärning har sex sidor, som alla lika gärna kan hamna uppåt när man kastar tärningen. Hur stor är sannolikheten att det blir en sexa, alltså att sidan med sex prickar hamnar uppåt när man kastar tärningen? Det ger sig ganska naturligt. Av tärningens sex sidor är det en som har sex prickar. Det finns därför en möjlighet på sex att det blir en sexa. Sannolikheten att det blir en sexa blir då en på sex, alltså en sjättedel. Svaret blir 1/6, eller 0,17 avrundat.

Enkel matematisk uträkningDet enklaste sättet att räkna ut sannolikheten för en händelse är att dividera antalet gynnsamma utfall med antalet möjliga utfall. Vad betyder det?

Exempel: Sexa på tärningenTärningen har sex sidor som alla kan hamna uppåt. Därför finns det sex möjliga utfall. Av dessa möjliga utfall är det ett som är gynnsamt för sexa. Därför dividerar vi 1 med 6 och får 1/6. Sannolikheten för sexa = 1/6.

Exempel: Lägre än fyraHur stor är sannolikheten att en tärningssida med högst tre prickar hamnar uppåt när man kastar? Det finns sex möjliga utfall. Av dem är tre gynnsamma för händelsen att en sida med en, två eller tre prickar hamnar uppåt. Därför dividerar vi 3 med 6 och får 3/6. Sannolikheten för en tärningssida med högst tre prickar 3/6 = 1/2 = 0,5.

Två tärningskast – tar turen slut?Hur stor är sannolikheten att det blir en sexa i båda kasten om man gör två tärningskast efter varandra? I första kastet är sannolikheten för sexa lika med 1/6. I andra kastet är situationen densamma, och sannolikheten för sexa är då

Page 29: "Klassrummet" -Statistikguiden, SCB, pdf

29Räkna rätt

också densamma. När man kommer till andra kastet spelar det ingen roll hur det gick i första kastet. Sannolikheten för sexa i andra kastet är alltid lika med 1/6, oavsett om det blev en sexa i det första kastet eller inte.

Man skulle kunna tro att om det blev sexa i första kastet så skulle det minska chansen för sexa i andra kastet. Turen skulle så att säga bara räcka till första kastet om det blev sexa då. Eller om det inte blev en sexa då skulle man ha tur andra gången. Men så är det inte. Det andra kastet är en sak för sig oavsett hur det gick i det första kastet. De två kasten är nämligen oberoende händelser.

Sannolikhetslärans multiplikationssats – en hjälpsam räknelagNu ska vi ta reda på hur stor sannolikheten är att det blir två sexor på två kast efter varandra. Vi tar hjälp av en grundläggande räknelag för sannolikheter som kallas sannolikhetslärans multiplikationssats. Den handlar om hur man får reda på sannolikheten för att två olika händelser kommer att inträffa.

Räknelagen säger att vi ska multiplicera de båda händelsernas sannolikheter med varandra. Räknelagen gäller bara om de två händelserna oberoende av varandra och alltså inte kan påverka varandra.

Exempel: Två tärningskastTvå tärningskast är inte beroende av varandra och de påverkar inte varandra. Båda händelserna har sannolikheten 1/6. Sannolikheten för att båda tärningskasten ger sexor räknar vi ut med sannolikhetslärans multiplikationssats.Sannolikheten för sexa i båda kasten blir då (1/6) × (1/6) = 1/36 = 0,028. Det är knappt tre hundradelar, alltså ganska nära noll. Det innebär att det är ganska sällsynt med två sexor i följd.

Sannolikheten är ett mått på hur vanlig en händelse är i det långa loppet. Vi kan tänka oss att vi gång på gång är med om att tärningen kastas två gånger. Med tiden blir det många gånger. I det långa loppet kommer alltså denna händelse att inträffa mindre än tre gånger på hundra.

Exempel: Flera tärningskastHur stor är sannolikheten att det blir sexa i varje kast om man gör fem kast i följd? Även nu multiplicerar vi ihop händelsernas sannolikheter. Det ger (1/6) × (1/6) × (1/6) × (1/6) × (1/6) = (1/6)5 = 0,00013. Det är bara lite mer än ett på tio tusen. Det här kan man utveckla vidare.

Chansen att vinna På en skola har eleverna en bokklubb. Två gånger om året lottar man ut böcker till tolv av medlemmarna. Utlottningen görs slumpmässigt bland alla

Page 30: "Klassrummet" -Statistikguiden, SCB, pdf

30Räkna rätt

medlemmarna i klubben. Det spelar ingen roll om man vunnit tidigare eller inte. För enkelhetens skull tänker vi oss att det alltid är 400 elever i klubben. Hur stor är sannolikheten att en elev får åtminstone en vinst om hon eller han är med i klubben i tio år?

Bli utan vinst varje gångI varje utlottning är det 400–12=388 medlemmar som blir utan vinst. Sannolikheten att en elev blir utan vinst i en utlottning blir därför 388/400. Med sannolikhetslärans multiplikationssats multiplicerar vi de 20 sannolikheterna med varandra (388/400)20 = 0,54. Sannolikheten att personen aldrig vinner = 0,54.

Sannolikheten att vinna minst en gång är (1) minus talet 0,54 – alltså 0,46. Det är alltså ungefär lika stor chans för en elev att vinna minst en gång som att inte vinna någon gång.

Räknelagen gäller inte t.ex. vädretExempel på händelser som inte är oberoende av varandra är vädret i dag och vädret i morgon. Är det sol i dag påverkar det möjligheten att det blir sol i morgon. Om högtrycket som ger sol första dagen ligger kvar andra dagen så blir vädret ungefär detsamma de två dagarna. Räknelagen för sannolikheter går inte att använda eftersom värdet en dag påverkas av värdet en annan dag.

Page 31: "Klassrummet" -Statistikguiden, SCB, pdf

31Trender och analyser

TRENDER OCH ANALYSERI det här avsnittet går du igenom hur du gör tabeller, diagram och kartor. Det är verktyg som gör det enklare att sammanställa och analysera statistiken. Det är ofta intressant att följa hur saker utvecklas över tid. Lär dig vad trendanalys är, och hur man gör en trendlinje.

Del 1: TabellerTabeller möter du varje dag, till exempel skolschemat, buss- och tågtidtabeller, resultat för fotbollsmatcher och börslistor. I statistiken är en tabell en översiktlig sammanställning av sifferuppgifter.

Här går vi igenom:ntabellernfrekvenstabeller

TabellerI statistiken sorterar och visar du data som du samlat in i tabeller. Vanligtvis består en tabell av horisontella rader och vertikala kolumner. Raden och kolumnen möts i en cell, i vilken det står information, i regel ett tal. Du kan enkelt rita egna tabeller, och i de flesta ordbehandlingsprogram för datorer finns det möjlighet att lägga in egna tabeller. Kolumn 1 Kolumn 2 Kolumn 3

Rad 1 Cell Cell CellRad 2 Cell Cell CellRad 3 Cell Cell CellRad 4 Cell Cell Cell

Ett exempel på en tabell:En skolelev sommarjobbar som barnvakt. I tabellen ser du hur många barn hon har hand om per dag under fyra veckor.

Vecka mån tis ons tor fre lör sön

27 3 3 3 2 2 0 028 3 3 3 2 1 0 129 4 4 4 4 2 1 130 2 3 2 3 1 1 0

Page 32: "Klassrummet" -Statistikguiden, SCB, pdf

32Trender och analyser

För att se antalet barn en dag så väljer du vecka (rad) och veckodag (kolumn). I den cellen står hur många barn hon hade hand om den dagen. Hon hade till exempel hand om tre barn på onsdagen i vecka 28.

Fråga: Vilken vecka har hon flest barn?

FrekvenstabellIbland har du mer data som du vill visa eller sortera på olika sätt. Då kan du använda en frekvenstabell. I frekvenstabellen visar du hur många gånger något händer. Frekvens är antalet gånger som varje sak händer. Med relativ frekvens menar du frekvensen delat med det totala antalet händelser, det vill säga andelen eller procenten av helheten.

Exempel på en frekvenstabell: I sommarkenneln bor det sammanlagt 20 hundar. Hundarnas ålder kan vi sätta in i en frekvenstabell. Då får vi en bra överblick över hundarnas åldrar. Kanske vill vi veta vilka typer av aktiviteter som kan passa.

Fråga: Har sommarkenneln fler äldre eller fler yngre hundar?

Hundarnas ålder i år: 3, 4, 2, 2, 1, 9, 1, 7, 6, 7, 8, 1, 3, 1, 5, 3, 2, 4, 9, 4

Ålder (år) Frekvens Relativ frekvens

1 3 3/2 0=0,15=15%2 3 3/2 0=0,15=15%3 3 3/2 0=0,15=15%4 3 3/2 0=0,15=15%5 1 1/2 0=0,05=5%6 1 1/2 0=0,05=5%7 1 1/2 0=0,05=5%8 1 1/2 0=0,05=5%9 2 2/2 0=0,10=10%

Nästa steg Många gånger är man nöjd med att presentera informationen i tabellform. För att se när bussar eller tåg går är det fullt tillräckligt. Vill man däremot få en bra överblick kan man visa informationen från tabellen i ett diagram. Det kan du läsa mer om i nästa avsnitt.

Page 33: "Klassrummet" -Statistikguiden, SCB, pdf

33Trender och analyser

Del 2: DiagramInom statistiken används flera olika sorters diagram. De används för att visa resultat av en statistisk undersökning eller annan data som du har.

Här går vi igenom: nStapel- och stolpdiagramnLinjediagramnCirkeldiagram

Det finns några typer av diagram som används oftare än andra. Stapel- och stolpdiagram används för att visa frekvenser av olika grupper eller kategorier. Linjediagram används för att visa förändringar över tid. Cirkeldiagram används för att visa andelar av en helhet.

Alla diagram går att rita för hand. För det mesta är det en fördel om du använder olika färger för att visa olika saker. I många räkneprogram för persondatorer (som Excel) finns stöd för att konstruera diagram från data i tabeller.

Stolpdiagram – när antal visas på x-axelnBörja med att titta i frekvenstabellen «Antal katter» nedan. I tabellen presenteras det data vi fick när vi ställde frågan ”Hur många katter har du?” till 40 personer.

När du har din information i en frekvenstabell är stolpdiagrammet lämpligt att använda. Diagrammet har en horisontell axel som du använder för att ange det antal katter som de intervjuade personerna hade. I det här fallet varierade det mellan noll och fyra katter, alltså får vi fem staplar i diagrammet. Den vertikala axeln använder du för antalet observationer, det vill säga, hur många personer hade till exempel en katt? Det kallas också för frekvensen. Därefter ritar du in en stolpe (ett streck) ovanför nollan, ettan, tvåan, trean och fyran i diagrammet som anger hur många personer som valt det svarsalternativet.

Figur 1: Personer med antal katter

0

4

8

12

16

20

43210antal katter

antal personer

Page 34: "Klassrummet" -Statistikguiden, SCB, pdf

34Trender och analyser

Frekvenstabell «Antal katter» Innehållet i frekvenstabellen innebär att tre personer inte har någon katt, 19 personer har en katt, tio personer har två katter, sex personer har tre katter och två personer har fyra katter.

Antal katter Frekvens

0 31 192 103 6

4 2 

Stapeldiagram – när kategorier visas på x-axelnEn kategori är en grupp av något slag. Det kan till exempel vara en klass med elever. Om vi delar in en skolas alla elever i klasser har vi alltså gjort en kategorisering av eleverna.

I vårt stolpdiagram hade olika personer olika många katter. Tänk nu om vi vill visa hur många katter eleverna i olika klasser har. Då behöver vi ett stapeldiagram. I stapeldiagrammet visar staplarnas höjd hur många det är av varje sak eller observation. Staplarna ska vara lika breda.

Vi har tagit reda på hur många katter eleverna i olika klasser har. Svaren är inlagda i frekvenstabellen Namn på tabellen. Antal katter visas på y-axeln, och klassernas (de olika kategoriernas) namn visas på x-axeln.

Figur 2: Antal katter hos elever i olika klasser

0

1

2

3

4

5

6

7

Klass9bKlass 9aKlass 8bKlass 8aKlass 7bKlass 7a

antal katter

Page 35: "Klassrummet" -Statistikguiden, SCB, pdf

35Trender och analyser

Klass Antal katter

7a 37b 68a 28b 39a 5

9b 2 

Linjediagram – utveckling över tiden Linjediagram använder du då du vill visa data som är uppmätta vid olika tidpunkter. Precis som i de andra diagrammen utgår du från information som du har i tabeller. Linjediagrammet har en horisontell axel där du skriver tiden och en vertikal axel där du skriver dina mätvärden.

Det är viktigt att du har samma avstånd mellan varje markering på axlarna. Annars ser det ut som om det är större eller mindre skillnad mellan mätpunkterna än vad det faktiskt är.

För varje tidpunkt då du gjort en observation ritar du en punkt i diagrammet på den höjd som motsvarar observationens värde. Mellan punkter drar du räta linjer. Eftersom du drar räta linjer mellan observationerna kan du inte se temperaturen som ligger mellan två punkter. Vi har ju bara mätt temperaturen klockan 9 på morgonen.

Data från temperaturmätningar visad i ett linjediagramUnder en vecka mäts temperaturen utomhus klockan 9 på morgonen varje dag. Resultaten i linjediagrammet är hämtade från tabellen med temperaturmätningar som ligger nedanför.

Figur 3: Temperaturmätningar under en vecka

0

4

8

12

16

20

SöndagLördagFredagTorsdagOnsdagTisdagMåndag

Temperatur, grader Celsius

Page 36: "Klassrummet" -Statistikguiden, SCB, pdf

36Trender och analyser

Tabell: Temperaturmätningar under en vecka, mätt i CelsiusDag Mån Tis Ons Tor Fre Lör Sön

Vecka 1 16 17 12 16 16 18 17

Ibland kanske du inte vill börja graderingen på en axel från noll. Antag att det var högsommar under mätveckan. Då är det naturligare att hålla sig över 10°C. Den vertikala axeln ”veckas” då i början så att du hoppar över en bit av den linjen.

Cirkeldiagram – när du vill visa andelarDet är vanligt att vi vill visa procentandelar av en helhet. Då täcker hela cirkeldiagrammet 100 procent av det du mäter, och varje del i diagrammet täcker sin procentandel av den helheten.

Eftersom ett helt cirkelvarv är 360 grader ska medelpunktsvinkeln för varje sektor vara lika många procent av 360 grader som observationerna utgör. Även här utgår du från information som du har i tabeller.

Glassbetyg i ett cirkeldiagram:På en glassprovning sätter provsmakare betyg på glassen Blåhallon. Betygen sätts in i tabeller och presenteras sedan i ett cirkeldiagram.

Figur 4: Betyg från provsmakning av glass

Inte god18 %

God37 %

Mycket god45%

För att kunna rita cirkeldiagrammet beräknas först hur stor andel varje betyg utgör av alla satta betyg.

Totalt har det satts 42 + 86 + 105 = 233 betyg.

Page 37: "Klassrummet" -Statistikguiden, SCB, pdf

37Trender och analyser

Sedan räknar vi ut medelpunktsvinkeln för varje sektor i cirkeln. Om 18 % av betygen är Inte god så bör Inte gods del av cirkelsektor vara 18 procent av 360 grader (dvs. 18 % av ett helt varv). Likadant räknar vi för alla betygen.

Betyg Antal Andel Medelpunktsvinkel

Inte god 42 42 /233 ≈ 0,18=18% 0,18·360° ≈ 64°God 86 86 /233 ≈ 0,36=36% 0,36·360° ≈ 129,5°Mycket god 105 105 /233 ≈ 0,45=45% 0,45·360° ≈ 162°

Nu är det dags att rita cirkeln med hjälp av en passare och varje sektor med hjälp av en gradskiva.

Del 3: KartorVarje dag ser vi kartor, och ofta utan att tänka på dem. Hur en karta ser ut och vad som är med på den beror på vad den ska användas till. Vissa kartor används för att orientera sig, som exempelvis vägkartor eller orienteringskartor. Andra används för att grafiskt presentera statistik.

Inom statistik är två sorters kartor vanliga. Den ena är tematiska kartor som ibland kallas statistiskkartor och den andra är referenskartor som är geografiska kartor.

Här går vi igenom:nreferenskartorntematiska kartor

Referenskartor har med geografi att göraReferenskartan visar var saker finns i en geografisk omgivning. Det är ofta vägar, sjöar och tätorter. Det kan också vara gränser för kommuner eller områden av mark som används på olika sätt. Kartorna är beskrivande och visar hur platser ligger i förhållande till varandra.

Sjökort är kartor för navigering på hav, större sjöar och kanaler. De visar sådant som är viktigt att veta när man färdas på vatten, till exempel hur djupt det är, hur botten ser ut och var gränserna mellan vatten och land går. På sjökorten är också hjälpmedel som farleder, fyrar och sjömärken utsatta.

Referenskartor kan också användas till andra saker än beskriva geografi. De kan visa hur hjärnan ser ut, DNA- och genstrukturer eller stjärnbilder.

Page 38: "Klassrummet" -Statistikguiden, SCB, pdf

38Trender och analyser

Skalan översätter till verklighetenMånga kartar är ritade i skala, uttryckt i ett förhållande som exempelvis 1:10 000, 1:20 000, 1:150 000. Det innebär att 1 av en valfri mätenhet på kartan motsvarar antingen 10 000, 20 000 av samma enhet i verkligheten. Oftast är det centimeter som används.

Exempel:1 cm på kartan motsvaras av 20 000 cm i verkligheten. Det innebär 200 meter.

Stora skalor visar detaljerEn stor skala visar mycket detaljer och är bättre vad det gäller mer precisa uppskattningar. Därför använder du storskaliga kartor när du orienterar. Men det kräver en mycket stor karta för att visa ett stort område. För att kunna visa ett större område behöver man minska på graden av detaljer. Då kallas kartan för småskalig.

Referenskartor

Tematiska kartor

100%

Storskalig Småskalig

Andel kartor

Detaljeringsgrad

Små skalor ger överblickI den småskaliga kartan är ett område avbildat litet och med få detaljer. Det ger en bra överblick över ett stort landområde. Småskaliga kartor använder du till exempel när du cyklar långt eller när du vill ta reda på var olika städer ligger i förhållande till varandra. För att du ska veta hur hög upplösning kartan har står det angivet på kartan.

Två eller fler dimensionerKartan du använder vid skolorienteringen är en traditionell referenskarta i stor skala. Den är en noggrann avbildning av ett tredimensionellt område. Men själva kartan är tvådimensionell. Kartan är statisk, den förändras inte om du vrider på den. Men en karta kan lika gärna vara dynamisk eller interaktiv, till och med tredimensionell. Några exempel är pekskärmar du använder för att hitta rätt i en galleria, eller vägbeskrivningar i ett dataspel.

Page 39: "Klassrummet" -Statistikguiden, SCB, pdf

39Trender och analyser

Tematiska kartor visar statistikGenom att visa statistiken på en karta kan du upptäcka mönster som hör ihop med platser. Sådana mönster är lättare att se på en karta än i tabeller och diagram.

Väderkartan är en typisk tematisk karta. Temat för väderkartan är vädret med temperatur, sol/moln, nederbörd och vind. Platsen som visas kan vara allt från en liten ort till ett helt land eller delar av en världsdel. Andra vanliga teman är ekonomi, fastigheter och politik.

Platsen är grundenNär du gör en tematisk karta börjar du med den plats du vill visa. Det är för det mesta ett administrativt område, som ett land eller en kommun. Du kan också välja ett område som du själv sätter gränserna för, till exempel ditt kvarter.

Eftersom geografin inte är det viktigaste i den här kartan tonar du ner bakgrunden. På det sättet kommer statistiken som du ska visa på kartan att syns bättre. Men du behåller så mycket av bakgrunden så att man kan se det som är intressant på kartan, till exempel var en sjö ligger eller var vägarna går.

Statistiken är den information som du ska visa på kartan. Den placerar du in på kartan som färger, ringar, kvadrater eller andra symboler. På väderkartan används symboler för sol, moln, regn, snö, dimma och vind. När man använder färger istället för symboler för statistiken kallas det för att man delar in kartan i klasser.

Koropletkarta och prickkarta – två vanliga tematiska kartor Koropletkarta används när du har relativa tal. Om statistiken du har är redovisad i relativa tal som procent, densitet eller «per person» väljer du en koropletkarta. Det konstiga namnet kommer från grekiskans choros som betyder plats och pleth som betyder värde. Att göra en korpoletkarta är alltså att ge platsen ett värde.

Exempel på en koropletkartaHur stor andel av människorna i kommunen bor i tätorter, och hur stor andel som bor på andra platser? I vilka delar av kommunen bor inga människor alls? På koropletkartan markerar vi de områden där flest invånare bor som blå områden, områden där det bor ganska mycket folk men färre målar vi röda, områden med ännu färre människor målar vi orange och så vidare. Man kan använda vilka färger man vill, och man kan göra avgräsningarna mellan grupperna på det sätt som passar bäst i det egna arbetet.

Page 40: "Klassrummet" -Statistikguiden, SCB, pdf

40Trender och analyser

Befolkningstäthet – antal invånareper kvadratkilometer

5 000 och över150–5 00030–1505–301–50

Prickkarta används när du har statistik i absoluta tal. Om statistiken du har är redovisad i absoluta tal som hundra eller tusental väljer du en proportionerlig prickkarta.

Page 41: "Klassrummet" -Statistikguiden, SCB, pdf

41Trender och analyser

Exempel på en prickkarta I vårt exempel sätter vi stora ringar på de platser där det bor fler än 1 329 000 000 personer per land, mindre ringar på platser där det bor cirka 664 500 000 personer per land och prickar på de platser där det 132 900 000 personer per land. Områden där det bor färre lämnar vi vita.

Folkmängd per land i tusental WHO

1 329 000

664 500

132 900

Uppgifterna om hur befolkningen i kommunen fördelar sig får man från en statistikdatabas, till exempel hos Statistiska Centralbyrån.

Kom ihåg:Inom statistiken delas kartor främst in i referenskartor och tematiska kartor.

5 vanliga referenskartornOrienteringskartanSjökortnTerrängkartanVägkartanTätortskarta

5 vanliga tematiska kartornPolitisk kartanEkonomisk kartanVäderkartanBefolkningskartanGeologisk karta

Page 42: "Klassrummet" -Statistikguiden, SCB, pdf

42Trender och analyser

Del 4: TrenderStatistiska analysmetoder förklarar vad som ligger bakom statistiska resultat. En av de vanligaste metoderna är regressionsanalys. Regressionsanalysen använder du när du vill ta reda på vilka bakomliggande faktorer som styr ett visst resultat. De kan bidra till att förklara varför något är som det är.

Här går vi igenom:nAtt arbeta med trendernHur man tar fram en trendlinje

I statistiken är det ofta intressant att följa hur saker utvecklas över tid. Det kan handla om hur många personer som flyttar till en stad under tio år, hur betygen i en skola ändras genom åren eller hur aktiva folk är i politiska partier. En trendanalys passar för utveckling där talen över tiden kan anses variera kring en rät linje, nämligen trendlinjen.

Med hjälp av trendlinjen får man ett bra mått på hur snabbt en förändring har skett. Till exempel när man vill veta hur något utvecklats för olika grupper i samhället. Man får snabbt en uppfattning om var, eller när, utvecklingen gått snabbare och var den gått långsammare.

En tidsserie bildar grundenI diagrammet arbetar vi med tidsserier. Det är en serie värden uppmätta vid olika tidpunkter som kommer efter varandra. Ofta är tidpunkterna årtal, men de kan lika gärna vara decennier, månader, veckor eller en annan fast tidsrymd. Precis som i de andra diagrammen utgår man från information.

Exempel med hur antalet skolelever ändras över tidAntalet skolelever (avrundat till femtiotal) i ett samhälle ändras enligt följande tabell:

År 2002 2003 2004 2005 2006 2007 2008 2009

Antal invånare 800 850 850 900 950 950 1 000 1 100

Antal invånare

0

200

400

600

800

1 000

1 200

20092008200720062005200420032002

Page 43: "Klassrummet" -Statistikguiden, SCB, pdf

43Trender och analyser

En trendlinje visar utvecklingenTrendlinjen gör man så att den följer den tidsserie man arbetar med så gott det går. Linjen ligger hela tiden i närheten av punkterna. Även om linjen ibland ligger lite över och ibland lite under punkterna, löper den hela tiden mitt ibland punkterna.

Varje procenttal motsvaras av en punkt i kurvdiagrammet. Sedan har vi ritat in en rät linje som följer punkterna. En sådan linje kallas trendlinje.

Exempel med hur antalet skolelever ändras över tidVi ritar in en trendlinje i vårt diagram.

Antal invånare

0

200

400

600

800

1 000

1 200

20092008200720062005200420032002

 

Man ser att linjen lutar ganska starkt uppåt över tiden och. Linjens lutning uppåt ger en bild av hur andelen skolelever har ökat under perioden. Om trenden fortsätter på samma sätt under kommande år går det fler och fler barn i det här samhällets skolor.

Trendlinje – med linjal eller matematiska beräkningarMan kan använda en vanlig linjal och måtta in linjen med ögonmått i diagrammet så att den följer punkterna. En mer exakt linje får man om man använder en matematisk beräkning. Beräkningen som används för att göra en trendlinje heter regressionsanalys.

Page 44: "Klassrummet" -Statistikguiden, SCB, pdf

44Trender och analyser

Del 5: AnalysmetoderStatistiska analysmetoder förklarar vad som ligger bakom statistiska resultat. En av de vanligaste metoderna är regressionsanalys. Regressionsanalysen använder du när du vill ta reda på vilka bakomliggande faktorer som styr ett visst resultat. De förklarar varför något är som det är.

Här går vi igenom:nRegressionsanalysnFörklarande faktorernFörklaringsgrad

Ett konkret exempel på en regressionsanalysChefer har olika hög lön. Chefernas löner är det resultat som vi vill analysera. Vilka faktorer påverkar lönen mest: ålder, bransch, kön, utbildning eller något annat? När du undersöker de faktorerna och tar reda på hur de påverkar chefernas löner gör du en regressionsanalys.

Välja förklaringsfaktorerFör att de förklarande faktorerna som du väljer ska vara användbara i din analys måste de vara konsekventa. Det betyder att varje gång som faktorn är med så blir resultatet också detsamma. Men eftersom verkligheten inte följer matematiska regler så kommer inte samma förklarande faktor att påverka resultatet på samma sätt varje gång. Hur ofta, eller hur mycket, en faktor förklarar ett resultat kallas för förklaringsgrad. I slutet av det här avsnittet får du lära dig mer om förklaringsgrader.

Exempel med chefslönerVi fortsätter med chefslönerna. I en SCB-rapport om kvinnliga och manliga chefers löner gjorde man analyser för att ta reda på vad chefernas kön betyder för deras lön. I analysen jämförde man lönen mellan kvinnor och män som hade ganska lika förutsättningar i fråga om ålder, utbildning och bransch. Idén med analysmodellen är att bena ut hur starkt olika faktorer påverkar lönerna för cheferna.

Faktorerna som man hade med var:nKönnÅldernUtbildningnBransch (näringsgren/verksamhet)

Page 45: "Klassrummet" -Statistikguiden, SCB, pdf

45Trender och analyser

Modellen innebär att varje chefs lön beror på att effekterna av de olika faktorerna multipliceras ihop så här:

Grundnivå för lönenx Effekt av kön x Effekt av ålder x Effekt av utbildning x Effekt av bransch x Individuell effekt = Personens lön

Genom att analysera chefernas löner med den här regressionsmodellen kan vi beräkna vad chefernas kön betyder för deras löner. Några av resultaten kan du se i tabellen nedanför. Under resten av avsnittet kommer vi att komma tillbaks till tabellen flera gånger.

Så här många Utan Med procent av analys- analys- skillnaden modellen modellen förklarar modellen

Inomprivatsektor Verkställande direktörer m.fl. 70 73 27Drift- och verksamhetschefer 76 84 34Chefer för mindre företag/enheter 91 94 35

Inomstatligsektor Högre ämbetsmän och politiker 96 101 18Drift- och verksamhetschefer 83 83 37Chefer för mindre företag/enheter 104 97 51

I den vänstra sifferkolumnen ser du kvinnornas medellöner i procent av männens beräknade utan att man använt någon analysmodell. I sifferkolumn i mitten ser du kvinnornas medellöner i procent av männens beräknade med modellen för regressionsanalys. I tabellen kan du se att kvinnorna som är drift- och verksamhetschefer i privat sektor har 76 procent av männens medellön om man inte använder någon regressionsanalys. Då har man inte tagit med någon annan förklarande faktor än kön i analysen.

Om man tar hänsyn till de andra förklarande faktorerna som vi valde att ha med i vår regressionsanalys har kvinnorna 84 procent av männens medellön. Då har alltså kvinnorna och männen samma ålder och utbildning och arbetar inom samma bransch.

Page 46: "Klassrummet" -Statistikguiden, SCB, pdf

46Trender och analyser

Individer är speciellaMen i lönesättningen finns också viktiga personliga delar. Till exempel gör olika personer gör olika bra jobb, de kommer olika bra överens med kollegor och andra chefer. Sådana saker fångas inte in som effekter av de förklarande faktorer som vi tagit med i vår analys.

Därför har vår modell med en faktor som vi kallar för individuell effekt. Den individuella effekten skiljer sig åt mellan cheferna. Det är de olikheter som inte förklaras av kön, ålder, utbildning och bransch.

Bra analys förklarar skillnaderNu kan vi fråga oss hur bra analysmodellen lyckas förklara chefernas löner. Det ser vi genom att titta på hur stor del av löneskillnaderna som verkar bero på de individuella effekterna. Ju större betydelse de individuella faktorerna har i analysen desto sämre förklarar de andra faktorerna skillnaderna.

Förklaringsgraden är siffror på bra eller dålig analysHur bra eller dåligt våra faktorer förklarar skillnaderna kan vi mäta i siffror. Förklaringsgraden kallas det måttet, och det anges som en andel i procent.

Den matematiska konstruktionen av måttet förklaringsgrad är sådant att värdena ofta inte blir så höga. Dessutom är det mycket i samhället som inte helt kan förklaras med bestämda faktorer. En förklaringsgrad på till exempel 30 procent är ett ganska hyggligt värde.

Vill du höja förklaringsgraden hos en modell kan du ta in fler förklarande faktorer. Då ökar förklaringsgraden. Om faktorn du lägger till inte betyder något för lönerna så får du inte heller någon ökning i förklaringsgrad.

Kvinnliga och manliga chefers löner Ibland uppfattas förklaringsgraden som ett mått på modellens kvalitet så att en bra analysmodell borde ha en hög förklaringsgrad. Men då gör man det för enkelt. En analys med hög förklaringsgrad kan ändå vara fel tänkt. Och en noga vald analys kan berätta det vi vill veta även med en låg förklaringsgrad.

Om vi ville visa att det inte spelar någon roll för lönen hur många husdjur man har så kan vi ha med husdjur som vår förklarande faktor. Förklaringsgraden skulle bli låg eftersom husdjur inte påverkar vad cheferna får i lön. Och det var ju precis vad vi ville visa med vår analys.

Page 47: "Klassrummet" -Statistikguiden, SCB, pdf

47Övningsuppgifter

ÖVNINGSUPPGIFTERI fyra praktiska övningsuppgifter får du lära dig att använda statistiska metoder. Du gör egna urval och enkäter, arbetar med sannolikhet och sammanställer resultaten. Det finns övningar som passar att göra enskilt och övningar som hela klassen kan göra tillsammans.

Statistisk undersökning med enkätDen här övningsuppgiften bygger på avsnitten:

n Undersökning och urvaln Räkna rättn Trender och analyser

Här arbetar du med en statistisk undersökning. Den fungerar bra att arbeta med inom en temaperiod, eller under ett par lektionstimmar utspridda över en termin.

Egen undersökningI arbetet ingår:n Problemformuleringn Enkätn Insamling av datan Sammanställning av datan Presentation och analys av resultatet

Steg för steg1. Fundera ut någonting du vill veta mer om och som går att undersöka. Det kan till exempel vara: hur stor andel av eleverna på din skola håller på med en bollsport?

2. Sakproblem och statistiskt problemSakproblemet består i att vi inte vet hur många som håller på med en bollsport på skolan.

Det statistiska problemet är att vi vill skatta andelen som håller på med en bollsport.

Vad menas med bollsport? Fotboll, basket och pingis är bollsporter, men räknas badminton och hockey som bollsporter? Fundera över vad ”håller på med” betyder. Måste man vara med i en klubb för att hålla på med en bollsport, eller kan man göra det ändå?

Page 48: "Klassrummet" -Statistikguiden, SCB, pdf

48Övningsuppgifter

3. Ställ frågan rätt – problemidentifieringVi funderar över, och definierar så exakt vi kan, vad vi menar med vår problemformulering. Skriv ner din fråga och hur du vill att den ska besvaras.

Se hjälpavsnitt för hjälp med formulering

4. Dela upp i undergrupperDet kan vara intressant att se om olika grupper av elever skiljer sig åt. Är det skillnad på flickor och pojkar vad gäller bollspel? Finns det något samband mellan vilken klass eller hur gammal man är och bollspel?

För att kunna få svar på de frågorna tar vi med dem i enkäten.

Se hjälpavsnitt för hjälp med gruppindelning

5. Mätinstrument – enkätVi bestämmer oss för att vårt mätinstrument är en enkät som ska fyllas i av respondenterna, det vill säga de som ska svara på vår enkät. Vi har också formulerat enkätfrågan med olika svarsalternativ. Nu behöver vi skriva ihop enkäten och kopiera upp den i tillräckligt många exemplar.

6. Urval – vilka som ska svara på din frågaVi funderar över om hela populationen (alla elever på skolan) eller ett urval av elever ska besvara vår enkät. Om vi bestämmer oss för att göra ett urval måste vi också bestämma oss för hur urvalet ska göras. Det allra bästa vore förstås om alla elever besvarade frågan, men oftast kan man få tillräckligt god information från en urvalsundersökning.

Urvalsmetoden bestämmer hur man skall göra beräkningar från ett urval till att gälla för hela populationen, i det här fallet skolan. I ett sannolikhetsurval har varje elev en känd sannolikhet att bli vald. Denna urvalssannolikhet ger uppräkningstalet (vikten) för varje elev i urvalet skall användas vid uppräkning till populationsnivå. Uppräkningstalet är det inverterade värdet av urvalssannolikheten.

I det allra enklaste fallet har alla elever exakt samma urvalssannolikhet och då blir det ett självvägt urval. Det innebär att man inte behöver använda vikterna i det fall man endast skall beräkna andelar av eleverna som har svarat på visst sätt.

Se hjälpavsnitt för hjälp med urval

7. Genomför enkätundersökningenNu har du funderat ut en fråga, gjort en enkät och bestämt vilka som ska svara på den. Det är dags att dela ut enkäten, och samla in svaren.

Page 49: "Klassrummet" -Statistikguiden, SCB, pdf

49Övningsuppgifter

8. Sammanställ resultatenDet enklaste sättet att sammanställa resultaten från enkäterna är att föra ihop dem i en tabell. Använd tabell 1 nedan som mall.nSkriv hur många elever som deltog i enkäten ovanför själva tabellen.nI kolumnen Antal skriver du hur många som valt respektive svar.nI kolumnen Andel i % skriver du hur många procent det var av alla som var med i enkäten som svarade så.

Tabell  1. Elever som håller på med någon bollsport på min skola. Svar Antal Andel i %

Ja, jag är med i en klubb. ( ) ( )Ja, men jag är inte med i någon klubb. ( ) ( )Nej, det gör jag inte. ( ) ( )Jag är osäker på vad jag ska svara. ( ) ( )Totalt antal svarande ( ) ( )

Se hjälpavsnitt för exempel på tabell.

Tabell 2. Flickor respektive pojkar som håller på med någon bollsport på min skola.De som fyllde i enkäten fick också ange vilket kön de har. Använd tabell 2 nedan som mall för att fylla i de resultaten. nSkriv hur många elever som deltog i enkäten ovanför själva tabellen.nFör över resultaten på hur många elever som valde respektive svar från tabell 1 och skriv in dem i kolumnen «Totalt».nI kolumnen «Flickor» skriver du hur många av flickorna som valt respektive svar och skriv in dem i kolumnen «Totalt».nI kolumnen «Pojkar» skriver du hur många av pojkarna som valt respektive svar.nI kolumnen Andel i % skriver du hur många procent det var av flickorna som var med i enkäten som svarade så och hur många procent av pojkarna som svarade så.

Svar Totalt Flickor Flickor % Pojkar Pojkar %

Ja, jag är med i en klubb. ( ) ( ) ( ) ( ) ( )

Ja, men jag är inte med i ( ) ( ) ( ) ( ) ( ) någon klubb.

Nej, det gör jag inte. ( ) ( ) ( ) ( ) ( )

Jag är osäker på vad jag ska svara. ( ) ( ) ( ) ( ) ( )

Antal svarande ( ) ( ) ( ) ( ) ( )

Se hjälpavsnitt för exempel på tabell

Page 50: "Klassrummet" -Statistikguiden, SCB, pdf

50Övningsuppgifter

Granska materialetNär vi samlat in data måste vi granska datamaterialet. Det gör vi genom att gå igenom enkäterna och kontrollera så att inga orimliga svar har lämnats. Det kan till exempel vara att någon har skrivit att han eller hon går i en klass som inte finns. Då måste vi lista ut vilken klass det borde vara. Kan vi inte det, så måste vi plocka bort den enkäten från datamaterialet och det räknas då som ett bortfall. Om det är så att någon svarat konstigt eller felaktigt på en fråga i en enkät, men det går att använda sig av de andra svaren, kallas det för partiellt bortfall. Bortfall eller partiellt bortfall måste vi ta hänsyn till när vi sedan analyserar resultatet av undersökningen. Det är viktigt att vi berättar om hur stort ett eventuellt bortfall är. Efter granskningen sammanställer vi datamaterialet i tabeller, eller vi gör en tabellframställning. Tabellerna kan vi redovisa som de är, eller så kan vi presentera materialet i diagram.

Hjälp till undersökning med enkätHär hittar du förslag på formuleringar till enkäten. Det finns också förklaringar till hur du gör urval, fyller i tabeller och räknar ut resulatet av din undersökning.

Hjälpavsnitt: Ställ frågan rätt – problemidentifieringHåller du på med någon bollsport? (Alla sporter där man använder en rund boll, en puck eller en badmintonboll räknas till bollsporter.)

oJa, jag är med i en klubb.oJa, men jag är inte med i någon klubb.oNej, det gör jag inte.oJag är osäker på vad jag ska svara. Det finns även ett svarsalternativ för den som är osäker. I det här fallet kanske någon höll på med rugby och blev osäker på om det skulle räknas som en bollsport eller inte.

Hjälpavsnitt: Frågeformulering gruppindelningÄr du flicka eller pojke?

oFlickaoPojke

Vilken årskurs går du i?oÅrskurs 6oÅrskurs 7oÅrskurs 8oÅrskurs 9

Page 51: "Klassrummet" -Statistikguiden, SCB, pdf

51Övningsuppgifter

Hjälpavsnitt: UrvalDet räcker om vi får in 30 svar. Men vilka ska svara på frågan? Om vi ställer frågan till alla elever «Är det någon som vill vara med i en undersökning som handlar om bollsport?» är det möjligt att de som gillar bollsporter räcker upp handen oftare än de som inte gör det, och då skulle resultatet inte gå att generalisera från de som deltog till hela skolan.

Så här gör vi:Alla elever skriver sina namn på lappar som sedan läggs i en stor hatt. Vi drarde 30 elever som ska vara med i undersökningen

Svaren kan samlas i en tabell:När eleverna har besvarat enkäten samlas svaren ihop i en tabell som kallas observationsregister. I det här fallet har tabellen fyra kolumner. Den första (id) innehåller en identitet, så att den som gjort undersökningen vet vilka eller hur många som har svarat. Den andra kolumnen (boll) visar hur eleverna svarat på frågan «Håller du på med någon bollsport?», den tredje kolumnen (ak) visar vilken årskurs eleverna tillhör och den fjärde (kon) om de är flickor eller pojkar.I tabellen används koder istället för text för att beskriva de olika svaren. I kolumnen «boll» är 1 = Ja, jag är med i en klubb, 2 = Ja, men jag är inte med i någon klubb, 3 = Nej, det gör jag inte och 4 = Jag är osäker på vad jag ska svara. I kolumnen «ak» står siffrorna för de olika årskurserna, och i kolumnen «kon» betyder siffran 1 flicka och siffran 2 pojke.

id boll ak kon1 1 7 12 3 6 13 1 6 24 2 9 15 4 9 26 1 8 27 1 8 28 1 7 29 2 6 110 2 7 111 3 7 212 1 9 113 1 8 114 2 6 215 2 7 116 2 7 117 1 6 218 4 6 219 1 8 220 1 9 2

21 1 8 122 3 8 223 3 7 124 3 6 125 3 8 126 2 9 127 1 5 228 3 9 129 3 7 130 2 8 1

Page 52: "Klassrummet" -Statistikguiden, SCB, pdf

52Övningsuppgifter

Hjälpavsnitt: Redovisa i tabell, Tabell  1Elever som håller på med någon bollsport på min skola

Antal Andel

Ja, jag är med i en klubb. 12 40 %Ja, men jag är inte med i någon klubb. 8 27 %Nej, det gör jag inte. 8 27 %Jag är osäker på vad jag ska svara. 2 7 %Antal svarande 30 100 %

Av de 30 som svarade var det 12 som var med i en klubb och 12/30 är lika med 40 procent. Eftersom alla elever hade samma sannolikhet att komma med i urvalet och svara på enkäten kan vi skatta andelen som är med i en bollklubb till just 40 procent. De som fyllde i enkäten fick också ange i vilken årskurs de går och vilket kön de har.

Hjälpavsnitt: Redovisa i tabell, Tabell  2Elever som håller på med någon bollsport på min skola indelat efter kön

Totalt Flickor Pojkar

Ja, jag är med i en klubb. 12 4 8Ja, men jag är inte med i någon klubb. 8 7 1Nej, det gör jag inte. 8 6 2Jag är osäker på vad jag ska svara. 2 0 2Antal svarande 30 17 13

Hjälpavsnitt: Redovisa i tabell, Tabell  3 Elever som håller på med någon bollsport på min skola indelat efter årskurs

Totalt åk6 åk7 åk8 åk9

Ja, jag är med i en klubb. 12 3 2 5 2Ja, men jag är inte med i någon klubb. 8 2 3 1 2Nej, det gör jag inte. 8 2 3 2 1Jag är osäker på vad jag ska svara. 2 1 0 0 1Antal svarande 30 8 8 8 6

Page 53: "Klassrummet" -Statistikguiden, SCB, pdf

53Övningsuppgifter

SannolikhetNär vi pratar om sannolikhet menar vi ofta «hur stor chans är det att någonting kommer att hända».

Singla slantEtt vanligt exempel är att vi singlar slant. Hur stor är chansen att det blir klave om vi singlar en slant en gång? Vi vet att sannolikheten för det är ½, eller 50 procent, eftersom det bara kan hända två saker – antingen blir det klave eller så blir det krona – och sannolikheten är densamma för båda händelserna.

Dra lott ur en hattPå samma sätt tänker vi om vi ska dra en lapp ur en hatt. Finns det en röd och en blå lapp i hatten är sannolikheten 50 procent att vi drar den blå lappen. Säg att en klass har 30 elever och en lärare. Vi skriver ned allas namn på varsin lapp och lägger i hatten. Sedan skakar vi om hatten så att lapparna blandas ordentligt. Om vi blundar och drar en lapp ur hatten, hur stor är då sannolikheten att det är lappen med lärarens namn som vi drar?

För att besvara frågan tänker vi så här: Det var 30 lappar med elevernas namn och en lapp med lärarens namn i hatten, alltså 30+1=31 lappar. Eftersom vi skakade om hatten och blundade när vi drog en lapp så är sannolikheten lika stor för varje lapp att bli dragen och därför blir sannolikheten för att vi drar lappen med lärarens namn lika med 1/31.Slår vi det på miniräknaren och avrundar till tre decimaler får vi 0,032. Hur många procent är det?

Gör nu om samma tankeexperiment med hatten, men beräkna denna gång hur stor sannolikheten är att vi drar en lapp med en elevs namn ur hatten. För att få sannolikheten för att vi antingen drar en lapp med en elevs namn eller en lapp med lärarens namn, kan vi lägga ihop sannolikheterna från de två tankeexperimenten. Vad får vi då?

Behöver du hjälp?Läs om sannolikhet i teoridelen innan du fortsätter

Diskutera!nVarför är sannolikheten för att en speciell händelse inträffar i ett experiment alltid mellan noll och 100 procent?nVarför är det viktigt att bestämma vad en «händelse» är innan vi gör experimentet?nVarför är det viktigt att före experimentet veta vad sannolikheten för varje händelse är?

Page 54: "Klassrummet" -Statistikguiden, SCB, pdf

54Övningsuppgifter

Kluriga frågor att diskutera: nVad betyder det att sannolikheten för en händelse är noll procent? nVad betyder det att sannolikheten är 100 procent?nKan sannolikheten för en händelse i ett experiment vara noll procent? Vad skulle det innebära?

(Det skulle innebära att vi definierat en händelse som vi vet inte kan inträffa, och det är något man aldrig gör eftersom det saknar mening. Samma resonemang kan man göra för en händelse som har 100 procents sannolikhet att inträffa, hur meningsfullt är ett sådant experiment?)

Alla åker inte skolskjuts – eller?I en klass med 30 elever är 16 av eleverna flickor och 14 pojkar. Av flickorna är det sex stycken som åker skolskjuts, och av pojkarna är det fyra.. Gör nu om tankeexperimentet med lapparna i hatten. Beräkna sannolikheten för att vi drar en lapp med namnet på en elev som åker skolskjuts till skolan. Kom ihåg att lärarens namnlapp också ligger i hatten!

Tänk på: Vi behöver namnge händelserna för att hålla ordning på dem. Vi kan kalla händelserna som vi är intresserade av för:1) Åker skolskjuts till skolan 2) Åker inte skolskjuts till skolan.

Steg för steg:1) 6+4=10 lappar med namn på elever som åker skolskjuts till skolan. 2) 10+10+1=21 lappar med namn på elever och lärare som inte åker skolskjuts till skolan

Händelserna 1) och 2) utgör tillsammans 100 procent. Sannolikheten för att händelse 1) ska inträffa är 10/31 det vill säga 32,3 procent.

Diskutera! Här gjorde vi ett antagande, nämligen att läraren inte åker skolskjuts till skolan. I många statistiska undersökningar gör man antaganden. Ett vanligt antagande är att det är lika stor sannolikhet att föda en flicka som en pojke. På scb.se, hittar vi information om att det år 2009 föddes 111 801 barn i Sverige, varav 54 237 var flickor. Antag att andelen flickor och pojkar är exakt densamma 2010 som den var 2009. Är sannolikheten störst att en slumpvist vald kvinna som är gravid och ska föda i november 2010, får en pojke eller en flicka?

Page 55: "Klassrummet" -Statistikguiden, SCB, pdf

55Övningsuppgifter

Några är sjuka – bortfallNu återgår vi till klassen med 30 elever. En dag är tre av eleverna sjuka och hemma från skolan. Två av dem som är sjuka är pojkar och en är flicka. Flickan och en av pojkarna brukar åka skolskjuts till skolan. Om vi nu gör experimentet att räkna ut sannolikheten för händelsen att vi drar en lapp med namnet på en flicka som åker skolskjuts till skolan, vad får vi för svar då? Glöm inte att ta med läraren och räkna bara med dem som är i skolan den här dagen!

DiagramNär du gjort en enkät och samlat in svaren vill du kunna presentera resultatet på ett bra sätt. Det är viktigt att de som läser om undersökningen förstår hur du har gjort och att de tabeller och diagram du visar är lätta att förstå.

I arbetet ingår:nStapeldiagramnTidsseriediagramnHistogram

I den här övningen arbetar du med flera sorters diagram. Övningsuppgiften fungerar bra att arbeta med som en fortsättning på övningen Statistisk undersökning med enkät eller som en fristående övning med diagram. Som första övningsuppgift använder vi oss av data från Övningsuppgift – Statistisk undersökning med enkät. Om du gjort den övningsuppgiften använder du dina data från den. Om du inte har gjort den kan du använda det avsnittets hjälpmaterial.

Vi arbetar vidare med undersökningen om hur många i skolan som sysslar med en bollsport. Tabellerna 1 och 2 skulle de flesta förstå, men det finns bättre sätt att berätta om resultatet.

Tänk på att: nSätta en tydlig rubrik till alla diagram.nAnvända andelar och inte faktiska antalet om du bara frågar en del (till exempel 10 klasskompisar).nNamnge kategorierna = de svar man kunde välja mellan i enkäten, till exempel «Ja, är med i en klubb», «Ja, är inte med i en klubb», «Nej», «Osäker».nGöra tydliga staplar.

Stapeldiagram – steg för steg Stapeldiagram använder du när du vill visa hur olika kategorier skiljer sig åt. Under ditt diagram skriver du en kort förklarande text. Den ska förklara vad diagrammet handlar om så att man förstår. I det här fallet skriver du hur många

Page 56: "Klassrummet" -Statistikguiden, SCB, pdf

56Övningsuppgifter

av alla elever som frågades och hur frågan löd. Hur du valde ut dem som skulle svara på enkäten kan du skriva i den löpande texten före diagrammet.

1. Stapeldiagram utan gruppindelningTabell 1 kan vi göra om till ett stapeldiagram. Använd andelar av elever som ägnar sig åt en bollsport och inte det faktiska antalet. Fundera på varför det är bättre att använda sig av andelar än av antal på y-axeln.

Diagram 1. Andel elever som håller på med någon bollsport på min skola

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

Jag är osäkerNejJa, inte med i klubbJa, med i klubb

Att svara på:nÄr det flest flickor eller pojkar som svarat «”Ja, är inte med i klubb”?

2: Stapeldiagram med indelning efter könTabell 2 kan vi också göra till ett stapeldiagram. Då får flickor och pojkar varsin del av staplarna i olika färg eller mönster. Använd andelar av flickorna och andelar av pojkarna som ägnar sig åt en bollsport och inte det faktiska antalet flickor respektive pojkar.

Diagram 2. Andel elever som håller på med någon bollsport på min skola indelat efter kön

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

Jag är osäkerNejJa, inte med i klubbJa, med i klubb

pojkar

flickor

Page 57: "Klassrummet" -Statistikguiden, SCB, pdf

57Övningsuppgifter

Att svara på:nÄr det flest flickor eller pojkar som svarat ”Ja, med i klubb”?

Tidsseriediagram I ett tidsseriediagram mäter man en egenskap hos observationsobjektet vid upprepade tillfällen över tid. Säg till exempel att Kalle har diabetes och att han regelbundet under ett års tid gör besök på vårdcentralen för att mäta insulinhalten i blodet. Kalle är observationsobjekt. Egenskapen vi mäter är insulinhalt. De upprepade tillfällena är varje gång Kalle går till vårdcentralen för att mäta sin insulinhalt.

Gör ett eget tidsseriediagramnRita ett diagram.nSkriv in veckonumren för de tio senaste veckorna på x-axeln. nSätt ut värden mellan noll och 20 timmar med en timme mellan varje punkt på Y-axeln.nFör in hur många timmar du läst läxor varje vecka de senaste tio veckorna i diagrammet. nLänka samman punkterna för dina data med en linje.

Diagram 3. Läxläsning för mig vecka (   ) till och med (   ), år (         )

0

5

10

15

20

v.10v.9v.8v.7v.6v.5v.4v.3v.2v.1

Histogram I ett histogram visar vi hur en egenskap varierar i en population eller i ett urval. Populationen kan till exempel vara alla elever i din skola, och urvalet kan vara 3 elever i varje klass i din skola.

För att vi ska kunna göra ett histogram måste egenskapen vi är intresserade av gå att mäta på decimalnivå eller vara kontinuerligt som det också kallas. Det betyder att den kan anta alla möjliga värden. Om vi till exempel är mycket noggranna när vi mäter en person kan vi ange längden inte bara i centimeter

Page 58: "Klassrummet" -Statistikguiden, SCB, pdf

58Övningsuppgifter

utan också i millimeter och tiondels millimeter (till exempel 159, 1287345 centimeter).

Om variabeln inte går att mäta på decimalnivå/är kontinuerlig, så är den diskret. Det betyder att den bara kan anta ett visst antal värden. Om vi till exempel frågar hur många som är barn och vuxna i en familj får vi inga decimaler i svaret. Då kan vi inte göra ett histogram.

I histogrammet sitter staplarna längs x-axeln ihop. Det gör de för att läsaren ska förstå att värdena längs x-axeln hänger ihop, eller är kontinuerliga. I stapeldiagram är staplarna uppdelade efter kategorier, men så är det alltså inte i histogram.

Gör ett eget histogramnRita ett diagram.nSkriv in längd i centimeter från 130 cm till 150 cm på x-axeln. Mellan varje markering på x-axeln ska det vara 2 cm.nSätt ut värden mellan 0 och 10 på y-axeln. Det är värdena för hur många elever som har en viss längd.nTa reda på hur långa dina klasskamrater är. För in hur många klasskamrater som har en viss längd i diagrammet tills alla klasskamraterna är inritade.

Diagram 4. Längden i centimeter på elever i din klass

0

2

4

6

8

148146144142140138136134132130

Att svara på:nKan du i histogrammet se hur många elever det är sammanlagt som går i din klass? nHur många är det som är 140 cm eller längre?nVilken längd är vanligast?

Beräkna ett medelvärde från histogrammetFör att beräkna medellängden av de elever som ingår i histogrammet ovan summerar vi först alla längder och dividerar sedan summan med antalet elever.

Page 59: "Klassrummet" -Statistikguiden, SCB, pdf

59Övningsuppgifter

Så här ser formeln ut:medellängd = total längd/antal elever

Nu kan du beräkna medelvärdet av de värden som ditt histogram består av.

PresentationI presentationen vill vi berätta om resultatet av vår undersökning. Vi behöver tala om vad vi ville veta, hur vi gjort, och vad vi fick reda på.

Övningsuppgiften fungerar bra att arbeta med som en fortsättning på övningarna Statistisk undersökning med enkät samt Diagram, eller som en fristående övning om presentation. Som första övningsuppgift använder vi oss av data från övningsuppgiften Statistik – övningsuppgift med enkät. Om du gjort den övningsuppgiften använder du dina data från den. Om du inte har gjort den kan du använda det avsnittets hjälpmaterial.

Att berätta om sin undersökning är viktigt och inte speciellt svårt. Det viktiga är att få med vad man har undersökt, varför man tog reda på det, hur man gjorde och vilka slutsatser man kommit fram till.

Steg 1: Rubrik och inledningRubriken ska med några korta ord berätta det viktigast om vår undersökning. I inledningen berättar vi om idén till undersökningen: varför vi gjorde den och vad vi ville ta reda på.

Steg 2: Metodbeskrivning och urvalI metodbeskrivningen berättar vi att vi valde en enkätundersökning. Vi förklarar också varför vi valde just en enkätundersökning – vi kunde ju valt att göra till exempel telefonintervjuer.Det är viktigt att tala om hur vi valde ut dem som skulle svara. Då kan läsaren själv bedöma om undersökningen har en bra kvalitet i urvalet.

Steg 3: Redovisa frågornaFör att läsaren ska veta precis vilken fakta som vi har samlat in till vår undersökning ska vi redovisa frågorna som var med i enkäten.

Steg 4: Visa tabeller och diagramGenom att visa tabeller och diagram över resultaten blir vår undersökning lätt att ta till sig. nGe varje tabell en kort rubrik. nFörklara tabellens eller diagrammets innehåll med en eller två meningar under tabellen/diagrammet.Ta inte med för många tabeller eller diagram för då blir det svårt att orka läsa dem, två eller tre brukar vara lagom.

Page 60: "Klassrummet" -Statistikguiden, SCB, pdf

60Övningsuppgifter

Steg 5: Resultat och analysVi avslutar presentationen med att berätta kort om resultatet. Fick vi reda på det vi ville veta? Vad fick vi veta? Se hjälpavsnitt för exempel presentation av undersökning

Hjälp till Övningsuppgift – Presentation

Hur populärt är det med bollsporter på Fannaskolan?

Av Lisa Andersson och Evert Wasa, klass 9B, vårterminen 2010Förra hösten föreslog elevrådet att det skulle byggas en ny bollplan bakom slöjdhuset. Elevrådet menade att det skulle vara bra för gymnastikundervisningen om det byggdes en ny plan eftersom den gamla är undermålig. Det skulle också vara bra för de elever och ungdomar som brukar träffas på skolområdet på kvällar och helger.

Metodval – enkätundersökningRektorn var emot idén eftersom hon trodde att underlaget av elever som är intresserade av bollsporter på Fannaskolan är för litet. Efter mötet med rektorn bestämde vi oss för att göra en undersökning och ta reda på hur det ligger till med den saken.

Urval – slumpmässigtPå skolan går 450 elever och vi hade inte resurser för att fråga alla. Därför valde vi med slumpens hjälp de 30 elever som fick svara på enkäten. Urvalsmetoden kallas obundet slumpmässigt urval (OSU).

Frågeställning om bollsportVi ställde följande fråga: Håller du på med någon bollsport? (Alla sporter där man använder en rund boll, en puck eller en badmintonboll räknas till bollsporter.) oJa, jag är med i en klubb.oJa, men jag är inte med i någon klubb.oNej, det gör jag inte.oJag är osäker på vad jag ska svara. Vi tog också med ett alternativ för de osäkra.

Page 61: "Klassrummet" -Statistikguiden, SCB, pdf

61Övningsuppgifter

Diagram med svar på frågan «hur många elever håller på med bollsport?»

Diagram 1. Andel elever som håller på med någon bollsport på Fannaskolan i Enköping indelat efter kön

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

Jag är osäkerNejJa, inte med i klubbJa, med i klubb

pojkar

flickor

Kommentartilldiagrammet:Frågan som ställdes till 30 av 450 elever var Håller du på med någon bollsport? (Alla sporter där man använder en rund boll, en puck eller en badmintonboll räknas till bollsporter.)

I diagrammet ser vi att 40 procent av eleverna på Fannakolan håller på med någon bollsport och är med i en klubb. Drygt 25 procent håller på med någon bollsport men är inte med i en klubb, och en lika stor andel håller inte på med någon bollsport alls. Ungefär 6 procent var osäkra på vad de skulle svara.

Slutsats – analysEnligt vår undersökning håller sammanlagt drygt 65 procent (eller ungefär 2/3) av eleverna på med någon bollsport och det tycker vi är en hög andel. Vår slutsats är att rektorn trodde fel om hur många som är intresserade av bollsporter på Fannaskolan. Den som vill titta på datamaterialet kan höra av sig till oss.