<信賴區間與信心水準的解讀>

58
信信信信信信信信信信信信信 <>

description

<信賴區間與信心水準的解讀>. 一、從常態分配談起. 為何成績單只要有個人成績加上 平均數 、 標準差 ,就足夠估計學生大約的名次? 例: A 生成績(全班 40 人) 由資料可知, A 生平均分數距離全班平均分數約 個標準差。 由 68 - 95 - 99.7 的法則可知, A 生的百分等級約為 68 + (100 - 68)/2=84 ,全班排名約為 40 (100 - 84)% ≒ 6 名. 為何可以如此估算?. - PowerPoint PPT Presentation

Transcript of <信賴區間與信心水準的解讀>

Page 1: <信賴區間與信心水準的解讀>

<信賴區間與信心水準的解讀>

Page 2: <信賴區間與信心水準的解讀>

一、從常態分配談起

國文 英文 數學 物理 化學 生物 平均

A 生 85 97 61 74 72 72 76.8班平均 63.4 74.0 63.0 61.9 71.7 70.8 67.5標準差 11.0 14.9 13.1 11.6 14.3 10.1 9.2

為何成績單只要有個人成績加上平均數、標準差,就足夠估計學生大約的名次?例: A 生成績(全班 40 人)

由資料可知, A 生平均分數距離全班平均分數約

個標準差。 由 689599.7 的法則可知, A 生的百分等級約為 68(10068)/2=84 ,全班排名約為 40(10084)% ≒ 6

0.12.9

5.678.76

68%

μ−σ μ μ+σ

16% 16%

Page 3: <信賴區間與信心水準的解讀>

為何可以如此估算?

我們假設全班成績分佈為一常態分佈

月考平均分數

0

5

10

15

20 30 35 45 55 65 75 85 95

組中點

人數

Page 4: <信賴區間與信心水準的解讀>

68%

95.4%

99.7%

μ−3σ μ−2σ μ−σ μ μ+σ μ+2σ μ+3σ

−3 −2 −1 0 1 2 3 X

Z

設常態分配的期望值為、變異數為 2 ,則常態分配的機率分配函數是

21

21( ) ,

2

x

f x e x R

Page 5: <信賴區間與信心水準的解讀>

標準常態分配 XZ

p 0.025 0.5 0.841 0.95 0.975 0.977 0.999

z p 1.96 0 1 1.65 1.96 2 3

標準常態分配累積機率表 0 zp

p

上面的標準常態累積機率表,是由平均值為 0 、標準差為 1 的標準常態分配機率密度函數(上圖中的 f (x) ),計算從∞到 zp 曲線下的面積而得,通常記作 (zp) ,因此上表可以寫成 (zp) = p 。

2

( )21

( )2

x

f x e

68%

1 0 1

16% 16%

Page 6: <信賴區間與信心水準的解讀>

以 z = 1.96 為例,

(1.96)≒0.975 ,所以在平均值前後 1.96 個標準差的機率為

0.975−0.025 = 0.95 。

p 0.025 0.5 0.841 0.95 0.975 0.977 0.999

z p 1.96 0 1 1.65 1.96 2 3

標準常態分配累積機率表

1.961.96 0

0.95

0 1.96

0.9750.025

Page 7: <信賴區間與信心水準的解讀>

大學聯考的統計資料

 已知  X≒54.63 ≒13.73

Page 8: <信賴區間與信心水準的解讀>

某生國文成績為 24.7 分 這個分數距離平均值 個

標準差。

利用常態分配表推知他的百分等級是 2.5% ,

但由大考中心資料得知他實際的百分等級是 4%

上述兩個例子是用常態分配去近似班級考試分配及大學指考分配,但只是近似,顯然不可能完全正確推算名次。

96.173.13

63.547.24

x

Page 9: <信賴區間與信心水準的解讀>

二、信賴區間的簡介某次民意調查發表之記者會特安排在十月四日「世界動物日」當天,以凸顯對解決流浪狗問題的迫切性,在 1111 份回收問卷中,其中的一個問題為:

您願不願意以實際行動來照顧住家附近的流浪狗 / 貓?

願意 140 (12.6%) 不願意 971 (87.3%)

以樣本比例 來代表母體的真正比例 p 合理嗎?

願意照顧流浪動物的民眾真的是 12.6% 嗎?

1111

140

Page 10: <信賴區間與信心水準的解讀>

區間估計92 年 7 月 19 日,某報就『成年人對公立大學學費是否太貴』的議題進行調查,於 20 日報導:『成功訪問了 871 位成年人。在百分之九十五的信心水準下,有 46% 民眾認為學費太貴,抽樣誤差在正負 3.3% 之內』,而該調查是以台灣地區住宅電話為母體作尾數兩位隨機抽樣。

這並不代表「認為公立大學學費太貴的民眾比例在(0.427,0.493) 這個區間範圍內」

我們每次做抽樣調查時都可以做出一個區間估計,而每次做出區間會涵蓋實際比例的機率為 95% 。

但是,這些區間與 95% 如何求出?

Page 11: <信賴區間與信心水準的解讀>

信賴區間的實驗

老師為全班每個同學各準備一籤筒,事先不讓學生知道籤筒裡放了幾支籤,內含若干有獎籤,然後做一次實驗:每個同學在籤筒內抽取一支籤,記錄是否為有獎籤後放回,連續抽取 20 次。記錄內容必為下列表格其中一列:

Page 12: <信賴區間與信心水準的解讀>

區間公式對照表( n =20 )區間半徑 =

中籤數

中籤比例

區間半徑

左端點

右端點 10 0.50 0.219 0.281 0.719

0 0.00 0.000 0.000 0.000 11 0.55 0.218 0.332 0.768

1 0.05 0.096 0.000 0.146 12 0.60 0.215 0.385 0.815

2 0.10 0.131 0.000 0.231 13 0.65 0.209 0.441 0.859

3 0.15 0.156 0.000 0.306 14 0.70 0.201 0.499 0.901

4 0.20 0.175 0.025 0.375 15 0.75 0.190 0.560 0.940

5 0.25 0.190 0.060 0.440 16 0.80 0.175 0.625 0.975

6 0.30 0.201 0.099 0.501 17 0.85 0.156 0.694 1.000

7 0.35 0.209 0.141 0.559 18 0.90 0.131 0.769 1.000

8 0.40 0.215 0.185 0.615 19 0.95 0.096 0.854 1.000

9 0.45 0.218 0.232 0.668 20 1.00 0.000 1.000 1.000

20

)ˆ1(ˆ96.1

pp

p

舉例:若一學生抽 20 次得到 9 次有獎籤,則中籤比例為 9/20 = 0.45 ,區間半徑為

區間為 [ 0.450.218, 0.450.218 ] ,即 [ 0.232, 0.668 ]

218.020

)45.01(45.096.1

Page 14: <信賴區間與信心水準的解讀>

信賴區間圖右圖中,全班 40 個學生每個人都得到一個區間,如果老師事先知道 p = 0.6 ,那麼從圖中可知,有 35 個區間包含真實的 p 值。

全班 40 個學生包含 p 值區間個數的期望值為

40 0.95 = 38 個

•0 •0.1 •0.2 •0.3 •0.4 •0.5 •0.6 •0.7 •0.8 •0.9 •1

•1 •2 •3 •4 •5 •6 •7 •8 •9 •10 •11 •12 •13 •14 •15 •16 •17 •18 •19 •20 •21 •22 •23 •24 •25 •26 •27 •28 •29 •30 •31 •32 •33 •34 •35 •36 •37 •38 •39 •40

Page 15: <信賴區間與信心水準的解讀>

的公式是如何得來的?

首先, 1.96 的由來是因為在平均值前後 1.96 個標準差所佔比例約為 95% 。

單獨一次抽籤的標準差是 ,

平均 n 次抽籤的標準差是 。

所以

是指「在 p 前後 1.96 個標準差的範圍」 。

20

)ˆ1(ˆ96.1

pp

)1( pp

n

pp )1(

])1(

96.1,)1(

96.1[n

ppp

n

ppp

Page 16: <信賴區間與信心水準的解讀>

以真實中獎機率 0.6 為例, 20 次抽籤抽中有獎籤的比率必為 0, 0.05, 0.1, …, 1.0 其中之一,舉例:抽中 9 次的中獎比率為 0.45 ,此事件發生機率為 ≒ 0.071 。(上圖左邊第二條綠色長條)上圖將每一種中獎比率與其發生機率作成直方圖,而綠色區域是 0.6 前後 1.96 個標準差的區域。

119209 )4.0()6.0(C

Page 17: <信賴區間與信心水準的解讀>

現在用常態分配去近似二項分配,每個同學 20 次抽籤的結果,抽中有獎籤的比率必為圖中 x 坐標之一,且此比率落在綠色區域的機率為 0.95 。每個同學 20 次抽籤抽中有獎籤比率的結果好比是在擲一枚出現正面機率是 0.95 的銅板,成功擲出正面(抽中有獎籤比率落在綠色區域)的機率是 0.95 。

Page 18: <信賴區間與信心水準的解讀>

樣本平均 落在 區間的樣本點,

也就是期望值 p 會落在

區間的樣本點。

p ]20

)1(96.1,

20

)1(96.1[

ppp

ppp

p

p20

)1(96.1

ppp

20

)1(96.1

ppp

20

)1(96.1ˆ

ppp

20

)1(96.1ˆ

ppp

]20

)1(96.1ˆ,

20

)1(96.1ˆ[

ppp

ppp

Page 19: <信賴區間與信心水準的解讀>

區間公式對照表( n =50 )區間半徑 =

中籤數

中籤比例

區間半徑

左端點

右端點

0 0.00 0.000 0.000 0.000 12 0.24 0.118 0.122 0.358

1 0.02 0.039 0.000 0.059 13 0.26 0.122 0.138 0.382

2 0.04 0.054 0.000 0.094 14 0.28 0.124 0.156 0.404

3 0.06 0.066 0.000 0.126 15 0.30 0.127 0.173 0.427

4 0.08 0.075 0.005 0.155 16 0.32 0.129 0.191 0.449

5 0.10 0.083 0.017 0.183 17 0.34 0.131 0.209 0.471

6 0.12 0.090 0.030 0.210 18 0.36 0.133 0.227 0.493

7 0.14 0.096 0.044 0.236 19 0.38 0.135 0.245 0.515

8 0.16 0.102 0.058 0.262 20 0.40 0.136 0.264 0.536

9 0.18 0.106 0.074 0.286 21 0.42 0.137 0.283 0.557

10 0.20 0.111 0.089 0.311 22 0.44 0.138 0.302 0.578

11 0.22 0.115 0.105 0.335 23 0.46 0.138 0.322 0.598

50

)ˆ1(ˆ96.1

pp

p

Page 20: <信賴區間與信心水準的解讀>

中籤數

中籤比例

區間半徑

左端點

右端點 37 0.74 0.122 0.618 0.862

24 0.48 0.138 0.342 0.618 38 0.76 0.118 0.642 0.878

25 0.50 0.139 0.361 0.639 39 0.78 0.115 0.665 0.895

26 0.52 0.138 0.382 0.658 40 0.80 0.111 0.689 0.911

27 0.54 0.138 0.402 0.678 41 0.82 0.106 0.714 0.926

28 0.56 0.138 0.422 0.698 42 0.84 0.102 0.738 0.942

29 0.58 0.137 0.443 0.717 43 0.86 0.096 0.764 0.956

30 0.60 0.136 0.464 0.736 44 0.88 0.090 0.790 0.970

31 0.62 0.135 0.485 0.755 45 0.90 0.083 0.817 0.983

32 0.64 0.133 0.507 0.773 46 0.92 0.075 0.845 0.995

33 0.66 0.131 0.529 0.791 47 0.94 0.066 0.874 1.000

34 0.68 0.129 0.551 0.809 48 0.96 0.054 0.906 1.000

35 0.70 0.127 0.573 0.827 49 0.98 0.039 0.941 1.000

36 0.72 0.124 0.596 0.844 50 1.00 0.000 1.000 1.000

p

Page 21: <信賴區間與信心水準的解讀>

信賴區間圖右圖中,全班 40 個學生每個人都得到一個區間,如果老師事先知道

p = 0.6 ,那麼從圖中可 知,有 37 個區間包含真實的 p 值。

全班 40 個學生包含 p 值

區間個數的期望值為 40 0.95 = 38 個

n = 50 時,區間半徑成為

因此區間長度變短了。

50

)ˆ1(ˆ96.1

pp

•0 •0.1 •0.2 •0.3 •0.4 •0.5 •0.6 •0.7 •0.8 •0.9 •1

•1 •2 •3 •4 •5 •6 •7 •8 •9 •10 •11 •12 •13 •14 •15 •16 •17 •18 •19 •20 •21 •22 •23 •24 •25 •26 •27 •28 •29 •30 •31 •32 •33 •34 •35 •36 •37 •38 •39 •40

Page 22: <信賴區間與信心水準的解讀>

區間比較圖

n =20 n = 50

•0 •0.1 •0.2 •0.3 •0.4 •0.5 •0.6 •0.7 •0.8 •0.9 •1

•1 •2 •3 •4 •5 •6 •7 •8 •9 •10 •11 •12 •13 •14 •15 •16 •17 •18 •19 •20 •21 •22 •23 •24 •25 •26 •27 •28 •29 •30 •31 •32 •33 •34 •35 •36 •37 •38 •39 •40

•0 •0.1 •0.2 •0.3 •0.4 •0.5 •0.6 •0.7 •0.8 •0.9 •1

•1 •2 •3 •4 •5 •6 •7 •8 •9 •10 •11 •12 •13 •14 •15 •16 •17 •18 •19 •20 •21 •22 •23 •24 •25 •26 •27 •28 •29 •30 •31 •32 •33 •34 •35 •36 •37 •38 •39 •40

Page 23: <信賴區間與信心水準的解讀>

信賴區間的解讀全班依照這樣的區間公式求出的 40 個區間,不論 n =20 或 n = 50 的模擬實驗結果,可以發現並非一定有 95% 的區間會涵蓋實際值 p 。

全班執行這個實驗,正如 40 個學生每人都在擲一枚出現正面機率為 0.95 的硬幣,我們只知道此實驗出現正面個數的期望值為 40 0.95 = 38 個,並不能保證一定出現 38 個正面。

每個學生做出的區間,只可能有兩種情形:包含真實 p 值,或不包含真實 p 值。因此一旦做出區間後,並不能說「真實 p 值在此區間的機率為 95% 」

Page 24: <信賴區間與信心水準的解讀>

n = 20 與 n = 50 的區間估計的差異

因區間半徑等於 ,

所以較大的 n 值具有較小的區間半徑,也意味著有較佳區間估計的效果。

較大的 n 值會導致此抽樣分配會較近似常態分配。

n

pp )ˆ1(ˆ96.1

Page 25: <信賴區間與信心水準的解讀>

休息一下

做個例題

Page 26: <信賴區間與信心水準的解讀>

某校 1000 人一起做實驗,每個人均從已知籤筒(內有 5 支籤,其中 2 支是有獎籤)抽籤 n 次,每次取出一支籤,取出後須放回。下面第一圖是 n =

50 時,每人抽中有獎籤比率與人數的分佈圖,第二圖則是 n =100 的分佈圖。試以此兩圖回答下面三題:

Page 27: <信賴區間與信心水準的解讀>

0 1 1 38

15

26

42

61

81

99

111115

109

96

78

58

40

26

15

84 2 1 0

0

20

40

60

80

100

120

140

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0.34

0.36

0.38

0.4

0.42

0.44

0.46

0.48

0.5

0.52

0.54

0.56

0.58

0.6

0.62

0.64

n=50

人數

抽中有獎籤比率

Page 28: <信賴區間與信心水準的解讀>

0 0 0 0 0 0 0 0 0 1 1 2 4 610

15

22

30

39

49

59

69

7780 81

79

74

67

58

48

38

29

21

1510

74 3

1 1 0 0 0 0 0 0 0 0 00

20

40

60

80

100

0.1

60

.17

0.1

80

.19

0.2

0.2

10

.22

0.2

30

.24

0.2

50

.26

0.2

70

.28

0.2

90

.30

.31

0.3

20

.33

0.3

40

.35

0.3

60

.37

0.3

80

.39

0.4

0.4

10

.42

0.4

30

.44

0.4

50

.46

0.4

70

.48

0.4

90

.50

.51

0.5

20

.53

0.5

40

.55

0.5

60

.57

0.5

80

.59

0.6

0.6

10

.62

0.6

30

.64

n=100

人數

抽中有獎籤比率

Page 29: <信賴區間與信心水準的解讀>

下列敘述何者正確:

(1) 在 n = 50 的實驗裡,一學生抽中有獎籤比率正好是 0.4 的機率為 。

答:(○)一學生抽中有獎籤比率正好是 0.4

是指他抽 50 次籤中得有獎籤 20 次,因此這個事件的機率為 。

30205020 )6.0()4.0(C

30205020 )6.0()4.0(C

Page 30: <信賴區間與信心水準的解讀>

(2) 比較 n = 50 與 n = 100 的實驗,發現抽中有獎籤比率在 0.28 ~ 0.52 (含此兩值)之間的學生人數,在 n = 100 的實驗裡學生人數較多。答:(○) n = 50 的實驗裡,抽中有獎籤比率小於 0.28 的學生數為 158311 = 28 ,大於 0.52 的學生數為 158421 = 30 ,因此在 0.28 ~0.52 之間的學生人數為1 = 948。同理, n = 100 的實驗裡,在 0.28 ~0.52 之間的學生人數為11111 = 991 。

Page 31: <信賴區間與信心水準的解讀>

(3) 在 n = 50 的實驗裡抽中有獎籤比率在 0.38 ~ 0.42 (含此兩值)之間的學生人數較 n = 100 的實驗裡抽中有獎籤比率在 0.38 ~ 0.42 (含此兩值)之間的人數多,也就是說 n = 50 的圖形較 n = 100 學生人數分佈更往 0.4 集中。答: ( × ) n = 50 的實驗裡,抽中有獎籤比率在 0.38 ~ 0.42 之間的學生人數為1111119 = 335 。同理, n = 100 的實驗裡,在 0.38 ~ 0.42 之間的學生人數為 7719 = 391 ,因此 n = 100 學生人數分佈更往 0.4 集中。

Page 32: <信賴區間與信心水準的解讀>

(4) 在 n = 100 的實驗裡,全校抽中有獎籤比率在 0.31 ~ 0.49 (含此兩值)之間的學生數為 950 人。答:(○) n = 100 的實驗裡,抽中有獎籤比率小於 0.31 的學生數為 10611 = 24 ,大於 0.49 的學生數為 11 1 = 26 ,因此在 0.31 ~ 0.49 之間的學生人數為16 = 950 。

Page 33: <信賴區間與信心水準的解讀>

(5) 當 n = 10000 時,我們可以預期抽中有獎籤比率在 0.31 ~ 0.49 (含此兩值)之間的學生數大於 950 的機率會很大。答:(○) n = 50 的實驗裡,抽中有獎籤比率在 0.31 ~ 0.49 之間的學生人數為19696 = 808 ,顯示 n 值越大時,可預期抽中有獎籤比率在 0.31 ~ 0.49 之間的學生數會越大。

提示:此實驗的標準差為n

pp )1(

Page 34: <信賴區間與信心水準的解讀>

若已知信心水準 90% 的區間半徑公式是

(其中 是每人抽中有獎籤的比率),我們將 n = 50

的區間半徑列表如下:(其中區間半徑值是四捨五入至小數點後第四位的近似值)

利用下表,每個學生均可做出一個信心水準為 90% 的信賴區間,試問下列敘述何者正確?

n

pp )ˆ1(ˆ65.1

p

Page 35: <信賴區間與信心水準的解讀>

中獎比率 區間半徑 中獎比率 區間半徑 中獎比率 區間半徑 中獎比率 區間半徑 中獎比率 區間半徑

0.02 0.0327 0.22 0.0967 0.42 0.1152 0.62 0.1133 0.82 0.0896 0.04 0.0457 0.24 0.0997 0.44 0.1158 0.64 0.1120 0.84 0.0855 0.06 0.0554 0.26 0.1024 0.46 0.1163 0.66 0.1105 0.86 0.0810 0.08 0.0633 0.28 0.1048 0.48 0.1166 0.68 0.1088 0.88 0.0758 0.10 0.0700 0.30 0.1069 0.50 0.1167 0.70 0.1069 0.90 0.0700 0.12 0.0758 0.32 0.1088 0.52 0.1166 0.72 0.1048 0.92 0.0633 0.14 0.0810 0.34 0.1105 0.54 0.1163 0.74 0.1024 0.94 0.0554 0.16 0.0855 0.36 0.1120 0.56 0.1158 0.76 0.0997 0.96 0.0457 0.18 0.0896 0.38 0.1133 0.58 0.1152 0.78 0.0967 0.98 0.0327 0.20 0.0933 0.40 0.1143 0.60 0.1143 0.80 0.0933 1.00 0.0000

(1) 在 n = 50 的實驗裡,抽中有獎籤比率是 0.5 的學生所做出的區間半徑一定大於其他抽中比率的學生做出的區間半徑。答:(○)從表中即可看出或由 可看出 4

1)1( pp

Page 36: <信賴區間與信心水準的解讀>

(2) 若有一學生抽取 50 次後抽中有獎籤比率是 0.3 ,那麼 90% 的信心水準的意義是指,真實中獎機率 0.4 落在此學生得到的信賴區間內的機率是 0.90 。答:( × )雖然該生所做出的區間為 [ 0.30.1069, 0.30.1069 ] ,即 [ 0.1931, 0.4069 ] ,已經知道此區間涵蓋真實的中獎機率 0.4 ,因此我們不能再說「 0.4 落在此學生得到的信賴區間內的機率是 0.90 」。

Page 37: <信賴區間與信心水準的解讀>

(3) 90% 的信心水準的意義是指全校 1000 人在 n = 50 的實驗裡,一定會有 900 人的信賴區間涵蓋真實中獎機率 0.4。答:( × ) 90% 的信心水準的意義是指全校 1000 人在 n = 50 的實驗裡,在 1000 個信賴區間中,涵蓋真實中獎機率 0.4 區間個數的期望值為 900 個。正如投擲一枚公正銅板 1000 次,得到正面次數的期望值為 500 次,但不是一定正好得到 500 次正面。

Page 38: <信賴區間與信心水準的解讀>

(4) 若在 n = 50 的實驗裡要求信心水準提高時,我們必須將區間半徑增大。

答:(○)要求信心水準提高是指,在期望值前後取更大的區間範圍,才能使抽中有獎籤比率落在此區間的機率變大,這也是說,我們必須將區間半徑增大。舉一例,若信心水準是 95% ,區間公式須變為

。50

)ˆ1(ˆ96.1

pp

Page 39: <信賴區間與信心水準的解讀>

(5) 在 n = 100 的實驗裡,因區間半徑

較 n = 50 實驗的區間半徑

小,所以信心水準隨著下降。

答:( × )這是錯誤的觀念,由於這兩個公式都是指期望值前後 1.65 個標準差的範圍,此區域占全部約 90% ,因此信心水準均為 90% 。

100

)ˆ1(ˆ65.1

pp

50

)ˆ1(ˆ65.1

pp

Page 40: <信賴區間與信心水準的解讀>

從 n = 50 實驗的結果(第一圖)及區間公式表可知,這次實驗每個學生所做的信賴區間可以涵蓋真實中獎機率 0.4 的人數有 個。

答:( 890 個)從區間公式表可知,抽中比率是 0.30 的區間為 [ 0.1931, 0.4069 ] ,抽中比率是 0.50 的區間為 [ 0.3833, 0.6167 ] 。再由第一圖知,抽中比率在 0.30~ 0.50 的人數為 16 = 890

Page 41: <信賴區間與信心水準的解讀>

三、簡介中央極限定理

首先介紹隨機變數 X :

定義 X 的期望值

變異數 (亦即 )

舉例:若 X 是一中獎機率為 p 的二項分配:

可得 E(X) = p1(1p)0 = p ,

Var(X) = p(1p)2(1p)(0p)2 = p(1p) 。

X x1 …… xn

p p1 …… pn

X 1 (成功) 0 (失敗)p p 1p

2)( XE i

ii xpXVar 2)()(

i

ii xpXE )(

Page 42: <信賴區間與信心水準的解讀>

中央極限定理:

設 X1, … , Xn 是獨立且具相同分配的隨機

變數,其中 E(X1) = , Var(X1) = 2 ,則

當 n → ∞ 時,隨機變數

的分配會趨近於標準常態分配 ,

也就是說隨機變數

的分配會趨近於標準常態分配

n

X n

n

nXX n )( 1

Page 43: <信賴區間與信心水準的解讀>

討論定理中的隨機變數 前,首先介紹兩個小引理:

nX

n

引理一:若 X 、 Y 是隨機變數且 a 、 b 為常數,

則 E(XY) = E(X) E(Y)且 E(aXb) = a E(X) b

引理二:若 X 、 Y 是獨立的隨機變數且 a 、 b

為常數,則 Var (XY) = Var (X) Var (Y)且

Var (aXb) = a 2 Var (X)

Page 44: <信賴區間與信心水準的解讀>

計算 n 次二項分配平均的期望值與標準差

p

XEXEXEn

XXXn

E

n

n

)()()(1

)(1

21

21

n

pp

XVarXVarXVarn

XXXn

Var

n

n

)1(

)()()(1

)(1

212

21

Page 45: <信賴區間與信心水準的解讀>

比較一般的情形是:已知抽籤的真實中獎機率為 p ,只要給定正數 z ,則當 n → ∞ 時, p

值落在實驗所得區間 的機率會趨近於 (z) (z)

此處 Φ 是指標準常態分配的累積機率函數:z 0.025 0.5 0.841 0.95 0.975 0.977 0.999z 1.96 0 1 1.65 1.96 2 3

])1(

ˆ,)1(

ˆ[n

ppzp

n

ppzp

Page 46: <信賴區間與信心水準的解讀>

此外 (z) (z) 的值可化簡成 2 (z) 1 :

若要求信心水準 2 (z) 1 = 0.95 ,則解出

(z) = 0.975 ,查下表知 z 值約為 1.96

若要求信心水準 2 (z) 1 = 0.90 ,則解出

(z) = 0.95 ,查上表知 z 值約為 1.65

z 0.025 0.05 0.841 0.95 0.975 0.977 0.999z 1.96 1.6 1 1.65 1.96 2 3

Page 47: <信賴區間與信心水準的解讀>

圖形說明由 95% 改成 90%

1.96

0.975 0.950

1.65

95 %

1.96 1.65

90 %

Page 48: <信賴區間與信心水準的解讀>

信心水準由 95% 改成 90%

95% 的信賴區間

90% 的信賴區間

])1(

96.1ˆ,)1(

96.1ˆ[n

ppp

n

ppp

])1(

65.1ˆ,)1(

65.1ˆ[n

ppp

n

ppp

Page 49: <信賴區間與信心水準的解讀>

現在要求信心水準 2 (z) 1 = 1 ,,, (z)

= 1 – /2 ,查表可得 z 值,用 表示

信賴區間為

其中 (通常我們會將 取成較小的數字)

此外,若 1 越大,則區間半徑就越大;

而若固定 1 的值,取樣數 n 越大則區間半徑越小。

信心水準為 1 的信賴區間

21 z

])1(

ˆ,)1(

ˆ[2121 n

ppzp

n

ppzp

Page 50: <信賴區間與信心水準的解讀>

實驗成功了嗎?

n = 20 的實驗中,每個同學所擁有的區間,我們只能知道它涵蓋 p 的機率是 0.928 ,也就是說,每個同學的區間涵蓋 p (成功)的機率是 0.928 ,不涵蓋 p (失敗)的機率是 0.072 。

當 40 個同學做此實驗時,計算涵蓋 p 的區間數正好是 38 個的機率為 ,經計算約為 0.236 !

2384038 )072.0()928.0(C

Page 51: <信賴區間與信心水準的解讀>

n = 50 的實驗中,每個同學所擁有的區間,每個同學的區間涵蓋 p (成功)的機率是 0.941 ,不涵蓋 p

(失敗)的機率是 0.059 。

當 40 個同學做此實驗時,計算涵蓋 p 的區間數正好是 38 個的機率機率為

, 經計算約為 0.269 !

就算信心水準是 0.95 ,要求涵蓋 p 的區間數正好是 38 個的機率機率為 ,

經計算約為 0.278 !

2384038 )059.0()941.0(C

2384038 )05.0()95.0(C

Page 52: <信賴區間與信心水準的解讀>

四、信賴區間與中央極限定理由中央極限定理可知,對獨立且有相同分佈的隨機變數,給定任意正數 z ,當 n → ∞ 時,

(其中 Φ 是標準常態分配累積機率函數)

上述式子中,事件 的涵義是樣本空間中

所有滿足樣本平均 落在 區間的樣本點所成事件。

1)(2)()(

zzzz

n

XP n

z

n

X n

],[n

zn

z

Page 53: <信賴區間與信心水準的解讀>

樣本平均 落在 區間的樣本點,也就是期望值 會落在

區間的樣本點。

],[n

zn

z

]ˆ,ˆ[n

zn

z

nz

ˆn

z ˆ

n

z

nz

Page 54: <信賴區間與信心水準的解讀>

民意調查的意義

常常在民意調查的報導中有如下的敘述:

本項調查是由 XX 民意調查中心在 XX 年 X 月

X 日進行,以隨機跳號抽樣及電腦輔助電話訪問方式,訪問台灣地區 1068 位 20 歲以上的民眾,在 95% 的信心水準下抽樣誤差為 ± 3%

。 

Page 55: <信賴區間與信心水準的解讀>

如果這項調查的結果對於候選人 A 的支持度為32% ,候選人 B 的支持度為 30% ,這代表候選人 A支持度的 95% 信賴區間為 [29%, 35%] ,候選人 B支持度的 95% 信賴區間為 [27%, 33%]

。這兩個區間有很大的重疊,因此選舉結果是有可能發生逆轉,這也是在相同的信心水準下,為何信賴區間的長度(即所謂抽樣誤差)要越小越好,而上面已提供了一個方法——

提高抽樣的樣本數 n 。

Page 56: <信賴區間與信心水準的解讀>

如何得到民意調查的抽樣數 n = 1068 ?

因 ,所以區間半徑

。若要求抽樣誤差不超過 d ,

則 即

以此例而言,若選擇抽樣誤差 d 等於

0.03 ,因 95% 的信心水準下, z0.975 ≒ 1.96 ,

n 1068 。

4

1)1( pp

nz

n

ppz

4

1)1(2121

dn

z 4

121 2

2

421

d

zn

Page 57: <信賴區間與信心水準的解讀>

但在相同的信心水準下,若選擇抽樣誤差 d

小於 0.01 ,則 n 9604 。以成本的角度來看,為了讓抽樣誤差從 3% 減少到 1% ,與其增加 9 倍的樣本,不如更謹慎的規劃及更好的抽樣方法來得有效。

Page 58: <信賴區間與信心水準的解讀>

Bye Bye