Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to...

78
Je statisticky dokázáno… Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Transcript of Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to...

Page 1: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Je statisticky dokázáno…

Martina Litschmannová

Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Page 2: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Co vypovídá statistika o jednotlivci?

Lukáš Pavlásek(jednotlivec) skaut podnikatel občan ČR

• Statistika nezkoumá jednotlivce jako individualitu, ale jako anonymního nositele některého znaku (činnosti, vlastnosti).

• Statistika je nauka o hromadných jevech.

2

Page 3: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Co je to statistika?

• teoretická disciplína, která se zabývá metodami sběru a analýzy dat

statistické znaky – údaje, které u statistických znaků sledujeme (např. váha, výška, IQ, …)

= ZÁKLADNÍ SOUBOR

úplné šetření

statistická jednotka

Jak provést statistické šetření?

3

Page 4: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Co je to statistika?

• teoretická disciplína, která se zabývá metodami sběru a analýzy dat

Jak provést statistické šetření?

úplné šetření výběrové šetření

REPREZENTATIVNÍvýběr

4

Page 5: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Co je to statistika?

• teoretická disciplína, která se zabývá metodami sběru a analýzy dat

Jak analyzovat data?

Exploratorní(popisná) statistika

Exploratorní(popisná) statistika

5

Page 6: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Základní pojmy ze statistické metodologie

výběrové šetření

Exploratorní(popisná) statistika

• Popisná statistika (angl. Exploratory Data Analysis, EDA) - uspořádání proměnných do názornější formy a jejich popis několika málo hodnotami, které by obsahovaly co největší množství informacíobsažených v původním souboru.

6

Page 7: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Základní pojmy ze statistické metodologie

výběrové šetření

Exploratorní(popisná) statistika

7

Page 8: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Několik nesouvislých poznámek

8

EDA pro kvantitativní (číselné) znaky• ošidný průměr• proč potřebujeme míry variability

Analýza závislosti dvou kvantitativních znaků• co nám říká korelační koeficient• co nám neříká korelační koeficient

Page 9: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Statistik, který má hlavu v sauně a nohy v ledničce,

hovoří o příjemné průměrné teplotě.

Autor neznámý

9

Ošidný průměr

Page 10: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

Zdroj: [1]

10

Page 11: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

Země K

Průměrná produkce kuřat (na osobu): 1,0 (denně)

11

Page 12: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

„Průměrná rodina má 2,2 dítěte.“Zdroj: [1]

12

Page 13: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

n

x

x

n

i

i 1

Na co si dát pozor?

Harmonický průměr• používá se, pokud potřebujeme hodnotu, která zastupuje ostatní, co se týče převrácených

hodnot, například při výpočtu průměrné rychlosti na úsecích stejné délky, k zjištění průměrné délky času nutné k provedení nějakého úkonu, kdy jsou dané úkoly prováděny současně několika osobami či stroji apod.

• Harmonický průměr je vždy menší nebo roven geometrickému průměru, což je snadný důsledek nerovnosti mezi aritmetickým a geometrickým průměrem.

13

Aritmetický průměr:

Page 14: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

n

x

x

n

i

i 1

Na co si dát pozor?

Harmonický průměr

𝑥𝐻 =𝑛

𝑖=1𝑛 1𝑥𝑖

14

Page 15: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

a) vzdálenost všech úseků je stejná – 5 km.

A B C D

AB BC CD

Dráha (km) 5 5 5

Rychlost (km/h) 40 50 60

15

Page 16: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

a) vzdálenost všech úseků je stejná – 5 km.

A B C D

AB BC CD

Dráha (km) 5 5 5

Rychlost (km/h) 40 50 60

Čas (h) 5/40 5/50 5/60

16

Page 17: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

a) vzdálenost všech úseků je stejná – 5 km.

A B C D

AB BC CD AD

Dráha (km) 5 5 5

Rychlost (km/h) 40 50 60

Čas (h) 5/40 5/50 5/60

17

Page 18: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

a) vzdálenost všech úseků je stejná – 5 km.

A B C D

AB BC CD AD

Dráha (km) 5 5 5 15

Rychlost (km/h) 40 50 60

Čas (h) 5/40 5/50 5/60 5/40 + 5/50 + 5/60

18

𝑣 =5 + 5 + 5

540+550+560

=3

140+150+160

= 48,7 𝑘𝑚 ℎ Harmonický průměr

Page 19: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy.

A B C D

AB BC CD

Dráha (km) 0,15AD 0,60AD

Rychlost (km/h) 40 50 60

19

Page 20: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy.

A B C D

AB BC CD

Dráha (km) 0,15AD 0,25AD 0,60AD

Rychlost (km/h) 40 50 60

20

Page 21: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy.

A B C D

AB BC CD

Dráha (km) 0,15AD 0,25AD 0,60AD

Rychlost (km/h) 40 50 60

Čas (h) 0,15AD/40 0,25AD/50 0,60AD/60

21

Page 22: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

1. Nákladní automobil jel z města A do města B rychlostí 40 km/h, z městaB do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celétrase, víte-li, že

b) Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy.

A B C D

AB BC CD AD

Dráha (km) 0,15AD 0,25AD 0,60AD AD

Rychlost (km/h) 40 50 60

Čas (h) 0,15AD/40 0,25AD/50 0,60AD/600,15AD/40

+ 0,25AD/50+ 0,60AD/60

Vážený harmonický

průměr22

𝑣 =0,15𝐴𝐷 + 0,25𝐴𝐷 + 0,60𝐴𝐷

0,15𝐴𝐷40 +

0,25𝐴𝐷50+0,60𝐴𝐷60

=1

0,1540 +0,2550+0,6060

= 53,3 𝑘𝑚 ℎ

Page 23: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

2. Jsou dva kopáči. Jeden kopáč kope jámu 48 hodin, druhý jí kope 2 krát rychleji.a) Za jak dlouho vykope jámu druhý kopáč?

24 hodin

23

Page 24: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

2. Jsou dva kopáči. Jeden kopáč kope jámu 48 hodin, druhý jí kope 2 krát rychleji.b) Za jak dlouho vykope jámu „průměrný“ kopáč?

𝑽ý𝒌𝒐𝒏 "průměrného" 𝑘𝑜𝑝áč𝑒 ="𝑐𝑒𝑙𝑘𝑜𝑣á 𝑑𝑜𝑏𝑎 𝑝𝑟á𝑐𝑒"

"𝑐𝑒𝑙𝑘𝑜𝑣ý 𝑟𝑜𝑧𝑠𝑎ℎ 𝑝𝑟á𝑐𝑒"=48 + 24

2?

Hledáme „průměrného“ kopáče – musíme použít vztah, v němž budeme uvažovatvýkon našich dvou kopáčů pracujících za stejných podmínek (po stejnou dobu).

1. kopáč … za 1h vykope1

48jámy

2. kopáč … za 1h vykope1

24jámy

Oba (celkem) … za 2h vykopali1

48+1

24jámy

𝑽ý𝒌𝒐𝒏 "průměrného" 𝑘𝑜𝑝áč𝑒 ="𝑐𝑒𝑙𝑘𝑜𝑣á 𝑑𝑜𝑏𝑎 𝑝𝑟á𝑐𝑒"

"𝑐𝑒𝑙𝑘𝑜𝑣ý 𝑟𝑜𝑧𝑠𝑎ℎ 𝑝𝑟á𝑐𝑒"=2

148 +124

(ℎ)

24

Harmonický průměr

Page 25: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

2. Jsou dva kopáči. Jeden kopáč kope jámu 48 hodin, druhý jí kope 2 krát rychleji.c) Za jak dlouho vykopou jámu společně?

1. kopáč … za 𝑡 h vykope𝑡

48jámy

2. kopáč … za 𝑡 h vykope𝑡

24jámy

Oba (celkem) … za 𝑡 h vykopali𝑡

48+𝑡

24jámy

1 =𝑡

48+𝑡

24

𝑡 =1

148

+124

(ℎ)

25

Page 26: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

2. Jsou dva kopáči. Jeden kopáč kope jámu 48 hodin, druhý jí kope 2 krát rychleji.c) Za jak dlouho vykopou jámu společně?

Jiný přístup: Dva kopáči vykopou jámu 2 krát rychleji než průměrný kopáč:

𝑽ý𝒌𝒐𝒏 "průměrného" 𝑘𝑜𝑝áč𝑒 =2

148

+124

(ℎ)

𝑡 =1

148

+124

(ℎ)

26

Page 27: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

n

x

x

n

i

i 1

Na co si dát pozor?

• Harmonický průměr (rychlosti, proměnné vyjadřující čas na jednotku výkonu)

• Geometrický průměr (tempa růstu)

𝑥𝐺 =𝑛 𝑥1 ∙ 𝑥2 ∙ ⋯ ∙ 𝑥𝑛 =

𝑛

𝑖=1

𝑛

𝑥𝑖

27

Page 28: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

3. Změny cen jedné akcie energetické společnosti na burze XY v období od 13. do 15. března jsou uvedeny v níže uvedené tabulce. Určete průměrné tempo růstu ceny této akcie v uvedeném období.

Cena akcie(Kč)

13. března 500

14. března 600

15. března 1 200

28

Page 29: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

3. Změny cen jedné akcie energetické společnosti na burze XY v období od 13. do 15. března jsou uvedeny v níže uvedené tabulce. Určete průměrné tempo růstu ceny této akcie v uvedeném období.

𝑦2 = 𝑘1𝑦1𝑦3 = 𝑘2𝑦2 = 𝑘2𝑘1𝑦1 = 𝑘

2𝑦1

𝑘2 = 𝑘2𝑘1 ⇒ 𝑘 = 𝑘2𝑘1

Cena akcie(Kč)

Tempo růstu

13. března 500

14. března 600 1,2

15. března 1 200 2,0

29

Geometrický průměr

Page 30: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

3. Změny cen jedné akcie energetické společnosti na burze XY v období od 13. do 15. března jsou uvedeny v níže uvedené tabulce. Určete průměrné tempo růstu ceny této akcie v uvedeném období.

𝑦2 = 𝑘1𝑦1𝑦3 = 𝑘2𝑦2 = 𝑘2𝑘1𝑦1 = 𝑘

2𝑦1

𝑘2 = 𝑘2𝑘1 ⇒ 𝑘 = 𝑘2𝑘1 = 2 ∙ 1,2 ≅ 𝟏, 𝟓𝟓

Cena akcie(Kč)

Tempo růstu

13. března 500

14. března 600 1,2

15. března 1 200 2,0

30

Page 31: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

4. Z 13. března na 14. března vzrostla cena jedné akcie energetickéspolečnosti na burze XY o 20%, z 14. března na 15. března vzrostla cena akcie o 100%. Určete průměrný denní procentuální růst ceny této akcie v daném období.

Cena akcie(Kč)

Tempo růstu

13. března ?

14. března ? ?

15. března ? ?

31

Page 32: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

4. Z 13. března na 14. března vzrostla cena jedné akcie energetickéspolečnosti na burze XY o 20%, z 14. března na 15. března vzrostla cena akcie o 100%. Určete průměrný denní procentuální růst ceny této akcie v daném období.

𝑘 = 𝑘2𝑘1 = 2 ∙ 1,2 ≅ 𝟏, 𝟓𝟓

Cena akcie vzrostla v daném období denně průměrně o 55%.

Cena akcie(Kč)

Tempo růstu

13. března ?

14. března ? 1,2

15. března ? 2,0

32

Page 33: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

5. Cena jedné akcie energetické společnosti vzrostla na burze XY v obdobíod 13. do 15. března téhož roku z 500 Kč na 1 200 Kč. Jaký byl průměrnýdenní procentuální přírůstek ceny této akcie v daném?

𝑘 = 𝑘2𝑘1 =𝑦3𝑦2∙𝑦2𝑦1=𝑦3𝑦1=1 200

500= 2,4 ≅ 𝟏, 𝟓𝟓

Cena akcie vzrostla v daném období denně průměrně o 55%.

Cena akcie(Kč)

Tempo růstu

13. března 500

14. března ? ?/500

15. března 1 200 1 200/?

33

Page 34: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

n

x

x

n

i

i 1

Na co si dát pozor?

• Harmonický průměr (rychlosti, proměnné vyjadřující čas na jednotku výkonu)

• Geometrický průměr (tempa růstu)

• Průměrování na cirkulární škále

34

Page 35: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

n

x

x

n

i

i 1

Na co si dát pozor?

• Harmonický průměr (rychlosti, proměnné vyjadřující čas na jednotku výkonu)

• Geometrický průměr (tempa růstu)

• Průměrování na cirkulární škále

• Průměr není rezistentní vůči odlehlým pozorováním!35

Page 36: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

V malé vesnici někde v Americe žije 6 lidí, jejichž roční plat je uveden níže.

$25 000 $27 000 $29 000

$35 000 $37 000 $38 000

Určete průměrný plat obyvatel této vesnice.

($31 830)

Do vesnice se přistěhoval Bill Gates, jehož roční příjem je $40 000 000.

$25 000 $27 000 $29 000

$35 000 $37 000 $38 000 $40 000 000

Určete průměrný plat obyvatel této vesnice.

($5 741 571)

36

Page 37: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

37

Page 38: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Ošidnost průměru

Zdroj: Blesk, 9.4.2013 38

Page 39: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Zdroj: http://www.czso.cz/csu/csu.nsf/informace/cpmz031114.docx 39

Page 40: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Zdroj: http://www.czso.cz/csu/csu.nsf/informace/cpmz031114.docx 40

Page 41: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Zdroj: http://www.czso.cz/csu/csu.nsf/informace/cpmz031114.docx 41

Page 42: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

K čemu potřebujeme míry variability?

42

Page 43: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Zásahy střelce A Zásahy střelce B4 15 56 9

Průměr ? ?

43

Page 44: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Zdroj: [1]

Zásahy střelce A Zásahy střelce B4 15 56 9

Průměr 5 5

44

Page 45: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Výběrový rozptyl

1

1

2

2

n

xx

s

n

ii

Na co si dát pozor?

Rozměr rozptylu charakteristiky je druhou mocninou rozměru proměnné.

45

Page 46: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Výběrová směrodatná odchylka

1

1

2

2

n

xx

ss

n

ii

46

Page 47: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Jakou představu o variabilitě dat nám dává sm. odchylka?

Pravidlo 3 sigma

k 𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎

1 0,682

2 0,954

3 0,998

Čebyševova nerovnost: ∀𝑘 > 0: 𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎 > 1 −1

𝑘2

k 𝑃 𝜇 − 𝑘𝜎 < 𝑋 < 𝜇 + 𝑘𝜎

1 >0

2 >0,75

3 >0,89

47

Page 48: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Variační koeficient

(Směrodatná odchylka v procentech aritmetického průměru)

𝑉𝑋 =𝑠

𝑥∙ 100 (%)

• Čím nižší var. koeficient, tím homogennější soubor.

• Vx > 50% značí silně rozptýlený soubor.

Proč potřebujeme bezrozměrnou míru variability?Umožňuje srovnání variability proměnných, které mají různé jednotky.

48

Page 49: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Analýza závislosti dvou kvantitativních proměnných

49

Page 50: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

• Pearsonův koeficient korelace

vyjadřuje míru závislosti dvou znaků.

lineární spojitých

𝑟𝑋,𝑌 = 𝑖=1𝑛 𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦

𝑖=1𝑛 𝑥𝑖 − 𝑥

2 𝑖=1𝑛 𝑦𝑖 − 𝑦

2

50

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,88

Page 51: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

• Hodnota korelačního koeficientu se pohybuje od -1 do 1.

• Hodnoty ±1 nabývá tehdy, pokud všechny body [xi, yi] leží napřímce.

• Nule je roven v případě, že veličiny jsou lineárně nezávislé.

• Při měření lineární závislosti je znaménko korelačníhokoeficientu kladné, když obě veličiny X a Y zároveň rostounebo obě zároveň klesají, a záporné, když jedna z veličin roste, zatímco druhá klesá.

• Při užití Pearsonova korelačního koeficientu je vždy třebaposoudit, zda je jeho aplikace vhodná.

51

Page 52: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

52

Page 53: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

53

Page 54: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

54

Page 55: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

55

Page 56: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

56

Page 57: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,10

57

Page 58: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,10

0

5

10

15

20

25

0 10 20

y

x

58

Page 59: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,10

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,88

59

Page 60: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,10

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,880

5

10

15

20

25

0 10 20

y

x

60

Page 61: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,10

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,880

5

10

15

20

25

0 10 20

y

x

𝑟=−0,86

61

Page 62: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,10

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,880

5

10

15

20

25

0 10 20

y

x

𝑟=−0,860

10

20

30

40

50

60

70

0 10 20

y

x

62

Page 63: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

5

10

15

20

25

0 10 20

y

x

𝑟=1

0

5

10

15

20

0 10 20

y

x

𝑟=−1

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,10

0

5

10

15

20

25

0 10 20

y

x

𝑟=0,880

5

10

15

20

25

0 10 20

y

x

𝑟=−0,860

10

20

30

40

50

60

70

0 10 20

y

x

𝑟=0,04

63

Page 64: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

0,5

1

1,5

2

2,5

3

3,5

0 10 20

y

x

64

Page 65: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

0,5

1

1,5

2

2,5

3

3,5

0 10 20

y

x

𝑟=0,93

65

Page 66: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

0,5

1

1,5

2

2,5

3

3,5

0 10 20

y

x

𝑟=0,930

20

40

60

80

100

0 10 20

y

x

66

Page 67: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

0,5

1

1,5

2

2,5

3

3,5

0 10 20

y

x

𝑟=0,930

20

40

60

80

100

0 10 20

y

x

𝑟=0

67

Page 68: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

0,5

1

1,5

2

2,5

3

3,5

0 10 20

y

x

𝑟=0,930

20

40

60

80

100

0 10 20

y

x

𝑟=0

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60

y

x 68

Page 69: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

0,5

1

1,5

2

2,5

3

3,5

0 10 20

y

x

𝑟=0,930

20

40

60

80

100

0 10 20

y

x

𝑟=0

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60

y

x 69

Page 70: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Korelační koeficient

0

0,5

1

1,5

2

2,5

3

3,5

0 10 20

y

x

𝑟=0,930

20

40

60

80

100

0 10 20

y

x

𝑟=0

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60

y

x

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60

y

x

𝑟=−0,85

70

Page 71: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.

Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem. To samotná korelovanost nedovoluje rozhodnout.

Silná korelace

Korelační koeficient

Page 72: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.

Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem. To samotná korelovanost nedovoluje rozhodnout.

Silná korelace

Korelační koeficient

Page 73: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Pokud jsou dvě náhodné veličiny korelované, znamená to pouze to, že jsou lineárně závislé.

Nelze z toho však ještě usoudit, že by jedna z nich musela být příčinou a druhá následkem. To samotná korelovanost nedovoluje rozhodnout.

Korelační koeficient

0

5

10

15

20

25

30

35

0

1

2

3

4

5

6

7

8

9

10

1998 2000 2002 2004 2006 2008 2010

Am

eric

ké v

ýdaj

e n

a vě

du

, ves

mír

výzk

um

a t

ech

no

logi

e (m

iliar

dy

do

larů

)

Seb

evra

ždy

ob

ěšen

ím a

ušk

rcen

ím

(po

čet

mer

tvýc

h v

USA

) tisí

ce

year

Sebevraždy oběšením a uškrcením (počet mertvých v USA)

Americké výdaje na vědu, vesmírná výzkum a technologie (miliardy dolarů)

𝑟=0,99

Page 74: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Zdroj: http://zpravy.aktualne.cz/zahranici/k-nobelove-cene-dopomaha-cokolada-naznacuje-studie/r~i:article:760147/

Page 75: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

V praxi se zpravidla hodnota koeficientu korelace interpretuje takto:

Korelační koeficient

Korelační koeficient Typ lineární závislosti

𝑟 = 0,0 neexistující

𝑟 ∈ (0,0; 0,3 velmi slabá

𝑟 ∈ (0,3; 0,7 středně silná

𝑟 ∈ (0,7; )1,0 těsná

𝑟 = 1,0 funkční

• Mezi proudem a napětím na odporu byl zjištěn korelační koeficient 0,6.• Mezi školním prospěchem a pocitem deprese u dětí byl zjištěn

korelační koeficient 0,6.

Výsledky interpretujte!

Page 76: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Něco ke čtení

1. SWOBODA, H. (1977): Moderní statistika, Praha.

76

Page 77: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

Závěrečný test

Body mass index (BMI) 18 letých dívek má střední hodnotu 21,3 𝑘𝑔 𝑚2 a směrodatnou odchylku 2,5 𝑘𝑔 𝑚2 . S využitím Čebyševovy nerovnosti odhadněte kolik procent 18 letých dívek má BMI v rozmezí 16,3 𝑘𝑔 𝑚2 až 26,3 𝑘𝑔 𝑚2?

a) nejméně 50%b) nejméně 75%c) nejméně 89%

77

Page 78: Je statisticky dokázáno… · jednotka Jak provést statistické šetření? 3. Co je to statistika? ... • Popisná statistika (angl. Exploratory Data Analysis, ... průměrné

A to už je opravdu konec!

Děkuji za pozornost

78