Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf ·...

17
Zbirka vaj iz STATISTIKE Blejec Andrej Ljubljana, 1997

Transcript of Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf ·...

Page 1: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

Zbirka vaj iz

STATISTIKE

Blejec Andrej

Ljubljana, 1997

Page 2: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

Za vzpodbudo Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge pokrivajo snov, ki jo obravnavamo kot osnove statističnih metod in razmišljanja. Naloge so po obsegu pripravljene tako, da jih študent lahko reši z uporabo enostavnega kalkulatorja, čeprav kak drug računalniški pripomoček ni odveč. Naloge so namenjene ilustraciji snovi, ki jo obravnavamo na predavanjih in kot priprava na pisni izpit iz Statistike, kjer morajo študentje samostojno rešiti naloge, ki se delno skladajo z nalogami v tej zbirki. Nekatere naloge so računsko enostavne, pa časovno zahtevne, zato je priporočljivo, da jih poskusite rešiti sami pred vajami. Na ta način lahko na vajah pregledamo rezultate in se pogovorimo o morebitnih težavah pri reševanju in posebnostih statističnega problema. Želim vam uspešno reševanje nalog!

Andrej Blejec

Page 3: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

UREJANJE PODATKOV

1. Za vsako od naštetih merskih lestvic določite možne vrednosti in jo opredelite glede na vsebino, značaj in zveznost. Poskusite določiti tudi značaj pojava, ki ga merimo.:

a) število otrok v družini b) čas od vsaditve semena do kalitve c) Reakcije živali, označene od 1 do 5: 1 zelo agresivna, 2 agresivna, 3 nevtralna, 4 prestrašena, 5

zelo prestrašena d) število rastlin v poskusnem kvadratu e) pH f) dolžina mišjega repa g) suha teža planktona iz litra vode h) temperatura zraka, merjena vsake pol ure na stopinjo natančno i) skupno število pik pri metu treh kock j) pozivna telefonska številka kraja k) vrsta domače živali: 1 pes, 2 mačka, 3 papiga, 9 drugo l) čas, ki ga potrebuje podgana da pride iz labirinta m) sprememba telesne teže v 6 mesecih n) razlika v temperaturi po in pred poskusom ( v stopinjah C) o) širina glave merjena kot: a ozka, b srednja c široka p) datum rojstva

2. Največja širina glave (mm) za 84 etruščanskih lobanj 141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 146 142 137 148 154 137 139 143 140 131 143 141 149 148 135 148 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142 140 137 152 145 in 70 sodobnih italijanskih lobanj 133 138 130 138 134 127 128 138 136 131 126 120 124 132 132 125 139 127 133 136 121 131 125 130 129 125 136 131 132 127 129 132 116 134 125 128 139 132 130 132 128 139 135 133 128 130 130 143 144 137 140 136 135 126 139 131 133 138 133 137 140 130 137 134 130 148 135 138 135 138 Poiščite: a) največjo širino b) najmanjšo širino, c) razpon vrednosti (variacijsko širino),

d) širine petih najširših lobanj, e) širine petih najožjih lobanj, f) vrednost, od katere je pol širin ožjih, g) koliko širin je večjih ali enakih 130, h) koliko širin je manjših od 140, i) koliko odstotkov širin je večjih od 130 pa manjših od 140. Ali se vam zdi, da so imeli Etruščani enako široke glave kot Italijani?

Nasvet: podatke razvrstite po velikosti v ranžirno vrsto. Pomagajte si s "stem-and-leaf" diagramom ali s štetjem posameznih vrednosti.

3. Na neki kmetiji so v zadnjih šestih letih imeli naslednje pridelke pšenice

200 185 225 250 240 195 centov

in naslednje pridelke koruze

75 90 100 85 160 100 centov Grafično prikažite pridelek pšenice in koruze. Uporabite linijski diagram, stolpce in sestavljene

stolpce. Izračunajte letne strukture pridelkov. V enakih tehnikah narišite letne strukture. Izračunajte in narišite indekse pridelka posameznih sort glede na prvo leto evidence.

Page 4: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

4. V nekem poskusu smo merili dolžino femurja. Izmerki, merjeni v mm so naslednji:

3.8 3.3 3.9 4.1 4.4 3.6 4.3 4.4 4.4 4.1 4.3 3.9 3.8 4.5 3.6 3.5 4.3 4.7 3.6 4.2 4.3 3.8 3.6 3.8 3.9

Razvrstite izmerke v razrede s širino 0.1in določite frekvence v posameznih razredih. Določite meje in sredine posameznih razredov. Narišite frekvenčne histograme in poligone za vsako razvrstitev.

Ponovite nalogo še za širine razredov 0.2 in 0.3 !

Page 5: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

MERE CENTRALNE TENDENCE 2.1 Za podatke

2 3 2 4 3 3 5 3 2 4 5 3 2 8 3 4 3 90 4 4 4 9 9 določite aritmetično sredino, geometrijsko sredino, harmonično sredino, moduse in mediano. Ali je aritmetična sredina dober kazalec centralne tendence? Izračunajte še modificirano aritmetično sredino in jo primerjajte s prejšnjimi ocenami centralne tendence. 2.2 Iz podatkov za 40 telesnih dolžin izračunajte aritmetično in geometrijsko sredino, mediano in modus negrupiranih (surovih) podatkov. Iz frekvenčne porazdelitve določite vse naštete mere centralne tendence za grupirane podatke: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144 168 126 138 176 163 119 154 165 147 173 142 147 135 153 140 135 161 145 135 142 150 156 145 128 Podatke razvrstite v razrede tako, da bo oznaka drugega razreda "125-131". Mediano določite iz frekvenčne in kumulativne frekvenčne porazdelitve. 2.3 Za podatke iz naloge 1.4 narišite relativne frekvenčne histograme in kumulativne relativne frekvenčne poligone. Določite: aritmetično sredino, mediano in modus negrupiranih (surovih) podatkov. Iz frekvenčnih porazdelitev določite iste mere centralne tendence za grupirane podatke.

3.8 3.3 3.9 4.1 4.4 3.6 4.3 4.4 4.4 4.1 4.3 3.9 3.8 4.5 3.6 3.5 4.3 4.7 3.6 4.2 4.3 3.8 3.6 3.8 3.9

2.4 Narišite kumulativni frekvenčni poligon za naslednje podatke:

12.2 12.9 11.8 11.9 11.6 11.1 12.3 12.2 11.8 11.8 10.7 11.5 11.3 11.2 11.6 11.9 13.3 11.2 10.5 11.1 12.1 11.9 10.4 10.7 10.8 11.0 11.9 10.2 10.9 11.6 10.8 11.6 10.4 10.7 12.0 12.4 11.7 11.8 11.3 11.1

Iz grupiranih podatkov določite aritmetično sredino, geometrijsko sredino, modus in mediano. 2.5 Za podatke 10 15 20 25 1000 izračunajte aritmetično, geometrijsko in harmonično sredino. Katera je ustreznejši kazalec za povprečje? 2.6 Pri raziskavi kvalitete voda smo zajeli štiri vzorce z gostotami 7 10 5 in 8 alg / ml. V vzorcih smo našli po 350 2000 750 in 800 alg Kolikšna je povprečna gostota alg v združenem vzorcu.

Page 6: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

MERE VARIACIJE in RANGI 3.1 Za ranžirni vrsti 3 5 6 7 8 10 12 14 16 20 in 6 10 12 16 20 28 29 30 35 poiščite R, Q, AD, varianco, standardno deviacijo in ustrezne relativne mere variacije. 3.2 Zgornji ranžirni vrsti ustrezata rezultatom meritev pri samicah oz. samcih. Kolikšna je skupna varianca? Kolikšen del variance odpade na vpliv spola, kolikšen pa na druge vplive? 3.3 Za frekvenčno porazdelitev

Dolžina f160-162 3163-165 15166-168 35169-175 20176-178 10179-181 5

izračunajte aritmetično sredino, varianco, standardno deviacijo, koeficient variacije ter relativne in Z odklone za zgornje meje razredov. Poiščite kvantilne range za sredini 3. in 4. razreda. Poiščite kvartile in pod frekvenčni histogram narišite vretenast diagram ("box-whiskers plot"). Določite kvantil za kvantilni rang P=0.30. 3.4 Iz frekvenčne porazdelitve iz naloge 2.2 izračunajte varianco, standardno deviacijo, koeficient variacije ter relativne in Z odklone za naslednje vrednosti: 119, 138, 150, 176, 100, 200. 3.5 Iz frekvenčne porazdelitve iz naloge 2.2 določite kvartilni odklon Q. Določite mediano in prvi ter deveti decil. Pod histogram narišite vretenast diagram ("box-whiskers plot"). Določite rang in kvantilni rang aritmetične sredine (glej nalogo 2.2 oz. 3.4)

Page 7: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

NORMALNA PORAZDELITEV

4.1 Naj bo Z ~ N(0,1). Poiščite

P(1.32 ≤ Z) P(-1.33 < Z ≤ 2.34) P(-2.03 <Z ≤ -1.27) P( 1.23 < Z ≤ 1.27) P(0.35 < Z ≤ 2.32) P(Z > 2.35) P(Z = 2.34)

4.2 Naj bo Z ~ N(0,1). Poiščite mejo b, da bo P( Z < b ) = c za naslednje vrednosti c: c : 0.01 0.02 0.05 0.1 0.45 0.5 0.6 0.88 0.9

4.3 Z ~ N(0,1). Poiščite mejo b, da bo P( |Z| > b) = P( Z < -b ali Z > b) = c za naslednje vrednosti c:

c : 0.01 0.02 0.05 0.1 0.45 0.5 0.6 0.88 0.9

4.4 Ocenite P(a < X ≤ b), če je X porazdeljen N( 20 , 102 ) za naslednje pare a in b: 20 , 30 25 , 30 25 , 50 10 , 20 15 , 25 6 , 15

4.5 Frekvenčni porazdelitvi

dolžina f 60-62 3 63-65 16 66-68 40 69-71 25 72-76 6

prilagodite normalno porazdelitev. (Poiščite z-vrednosti mej razredov in določite pričakovane frekvence v danih razredih pri predpostavi, da je porazdelitev normalna. Porazdelitev razširite navzdol in navzgor z odprtima razredoma in preverite, ali se skupna opažena in pričakovana frekvenca ujemata)

4.6 Porazdelitev iz naloge 4.5 vrišite v verjetnostni papir. Ali je porazdelitev približno normalna? Grafično ocenite povprečno vrednost in standardno deviacijo. Vrišite tudi prilagojeno porazdelitev iz naloge 4.5.

4.7 Frekvenčni porazdelitvi iz naloge 3.3

Dolžina f 160-162 3 163-165 15 166-168 35 169-175 20 176-178 10 179-181 5

prilagodite normalno porazdelitev. Porazdelitvi vrišite v verjetnostni papir. Ali je frekvenčna porazdelitev približno normalna. Grafično ocenite povprečno vrednost in standardno deviacijo, če predpostavljate, da je frekvenčna porazdelitev normalna.

4.8 Grafično preverite, ali so naslednje porazdelitve normalne:

frekvenca dolžina a b c d e f g 60-62 15 20 5 40 30 6 7 63-65 20 20 10 30 5 40 23 66-68 30 20 20 15 30 8 40 69-71 20 20 50 10 5 40 23 72-76 15 20 15 5 30 6 7

Page 8: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

INTERVALSKO OCENJEVANJE PARAMETROV

5.1 Pri proučevanju vpliva rastnih dodatkov A in B na rast smrečic smo izmerili naslednje velikosti (v cm):

A 10 12 10 8 10 13 10 B 13 15 15 18 14

a) Določite 95% (90%) intervala zaupanja za povprečno velikost. Narišite intervalazaupanja. b) V premislek: V drevesnici zatrjujejo,da ta vrsta smrečic brez rastnih dodatkovzraste v povprečju 12 cm. Kaj lahko poveste o dodatkih A in B?

5.2 Za neko vrsto sadik zagotavljajo, da v povprečju zrastejo 12 cm, ter da 75% sadik (v enem tednu) zraste do med 10 - 14 cm. Ali vzorec 10 sadik s povprečno velikostjo 13 cm potrjuje njihovo trditev ?

5.3 Pošiljka mandarin "NixPeska" je sprejemljiva, če je v pošiljki manj kot 10% mandarin s peškami. Po obilni malici (pojedli smo 50 mandarin) smo ugotovili, da so bile peške v 10 mandarinah. Ali je pošiljka ustrezno deklarirana? Stopnja zaupanja naj bo 95% (90%)?

5.4 Z vzorcem s 5 enotami skušamo določiti povprečno težo vrste laboratorijskih miši. Izračunali smo povprečno težo 15 g ter varianco (pristransko!) 2. Poiščite intervale zaupanja za povprečno težo miši. Za izračun uporabite nepristransko oceno variance. Določite tudi intervala zaupanja za povprečno težo miši, če za oceno variance vzamete spodnjo (zgornjo) mejo zaupanja za varianco. Primerjajte vse tri tako dobljene intervale zaupanja.

5.5 Ponovite nalogo 5.4 kot da je vzorec velik n=20 (n=50 enot).

5.6 Za določitev velikosti celic v pljučih bi radi oceno z napako, ki bo manjša od 10%. Iz prvih 5 izmerjenih vrednosti smo določili povprečje 17 mikrometrov in vsoto kvadratov izmerjenih vrednosti 1543. Kako velik naj bo vzorec, da bo napaka pri 95% (99%) zaupanju manjša od predpisane?

Page 9: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

TESTIRANJE HIPOTEZ

7.1 Z vzorcem 100 enot smo ocenili povprečje m = 67.45 in standardno deviacijo s=2.93. Ali je populacijska srednja vrednost:

a) različna od 66b )manjša od 68 c ) večja od 66

7.2 V nekem gozdu naj bi bilo 2/3 dreves obolelih za neko boleznijo. Pregledali smo 150 dreves in ugotovili, da je obolelih 110 dreves. Ali je delež obolelih dreves v tem gozdu 2/3? Več kot 2/3? Manj kot 2/3?

7.3 Z vzorcem 16 enot smo ocenili povprečje m=67.45 s=2.93. Ali je populacijska srenja vrednost:

a) različna od 66b ) manjša od 68 c) večja od 66

7.4 Z vzorcem 16 enot smo ocenili povprečje m1 = 60 in s21 = 4, z drugim vzorcem z

25 enotami pa m2=55 in s22=6.

a) Ali sta populacijski srednji vrednosti različni?b) Ali se populacijski srednji vrednosti razlikujeta za več kot 3?

7.5 Pri preizkušanju učinkovitosti zdravil A in B smo ugotovili, da je ozdravelo 5 bolnikov izmed 30, ki so se zdravili z zdravilom A in 10 bolnikov izmed 40, ki so se zdravili z zdravilom B. Katero zdravilo je učinkovitejše? Kakšen bi bil sklep, če bi bili učinkovitosti 50 od 300 in 100 od 400?

7.6 Ali sta varianci iz naloge 7.4 značilno različni?

7 . 7 V nekem dietnem poskusu smo dobili naslednje podatke o telesnih težah: pred: 10 12 8 15 12 13 po: 9 10 9 14 12 14

Ali je dieta shujševalna?

Page 10: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

ODVISNOST MED POJAVI 8.1. Proučujemo vplive treh rastnih dodatkov (A; B in C). V tabeli so zbrani prirastki velikosti rastlin (v cm):

A B C6 11 37 9 48 10 4

45

Ali imajo rastni dodatki različen vpliv na prirastek? Narišite diagram vpliva. 8.2 Nalogo 1 rešite še za podatke, zbrane v tabeli:

A B C6 7 87 9 68 8 6

65

Primerjajte rezultat z nalogo 8.1! 8.3 Pri proučevanju vliva rastnih dodatkov A, B in C smo razvrstili 36 enot glede na velikost prirastka (a – prirastek pod pričakovanim, b prirastek večji od pričakovanega). Proučite vpliv rsatni dodatkov na prirastek, za tabelo rastnih prirastkov

A B Ca 11 4 3b 3 5 10

8.4 Proučite vpliv tudi za prirastke zbrane v tabeli:

A B Ca 5 6 7b 9 5 4

Page 11: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

8.5 Preučiti želimo povezavo med dolžino in težo nekih živali (v primernih enotah) Podatke smo zbrali v spodnji tabeli

d t d*t d*d t*t2 3 6 4 94 3 12 16 98 7 56 64 494 6 24 16 365 7 35 25 49

Σ 23 26 133 125 152 Izračunajte korelacijo in določite regresijsko premico. Narišite korelacijski grafikon in vrišite regresijsko premico. 8.6 Ponovite nalogo 8.5 za podatke:

d t d*t d*d t*t2 6 12 4 364 3 12 16 98 7 56 64 494 6 24 16 365 7 35 25 49

Σ 23 29 139 125 179

Page 12: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

PRILOGE

1. Normalna porazdelitev 2. Studentova t-porazdelitev 3. Porazdelitev χ2

4. F porazdelitev 5. Mreža z verjetnostno skalo

Page 13: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge
Page 14: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge
Page 15: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge
Page 16: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge
Page 17: Zbirka vaj iz STATISTIKE - ablejec.nib.siablejec.nib.si/Statistika/Vaje-iz-Statistike-151215.pdf · Zbirka vaj je namenjena študentom Statistike na oddelku za Biologijo BF. Naloge

0.001

0.010

0.050

0.100

0.200

0.3000.4000.5000.6000.700

0.800

0.900

0.950

0.990

0.999

m−s

m

m+s