第十二章 單因子變異數分析

38
第第第第 第第第第第第第第

description

第十二章 單因子變異數分析. F 分配 FDIST(). FDIST(F, 分子的自由度 , 分母的自由度 ) FDIST(x,degrees_freedom1,degrees_freedom2) F 為用來求算此函數的 F 值。由於 F 值是兩個均方相除: 故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且因分子分母均為正值(均方),故其分配僅在 0 之右側而已。 本函數在求:於某兩個自由度下之 F 分配中,求自右尾累計到 F 值的總面積(機率)。即傳回 F 分配之右尾累計機率值(下圖之陰影部份):. - PowerPoint PPT Presentation

Transcript of 第十二章 單因子變異數分析

Page 1: 第十二章  單因子變異數分析

第十二章 單因子變異數分析

Page 2: 第十二章  單因子變異數分析

F 分配 FDIST()

FDIST(F, 分子的自由度 , 分母的自由度 )

FDIST(x,degrees_freedom1,degrees_freedom2) F 為用來求算此函數的 F 值。由於 F 值是兩個均方相除:

故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且因分子分母均為正值(均方),故其分配僅在 0 之右側而已。

本函數在求:於某兩個自由度下之 F 分配中,求自右尾累計到 F 值的總面積(機率)。即傳回 F 分配之右尾累計機率值(下圖之陰影部份):

誤差的均方處理的均方

MSE

MSAF

Page 3: 第十二章  單因子變異數分析

F 分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx 『 FDIST 』工作表,為自由度 (2,10) 與( 3,15 )之情況下,不同 F 值所求得之右尾累計機率:

Page 4: 第十二章  單因子變異數分析

F 分配反函數 FINV()

FINV( 左尾機率 , 分子的自由度 , 分母的自由度 )

FINV(probability,degrees_freedom1,degrees_freedom2) 本函數用以於已知自由度之 F 分配中,求某累計機率所對應之 F 值。 由於 F 分配之圖形及機率值,將隨自由度不同而略有不同。範例

Ch12.xlsx 『 FINV 』工作表,是以自由度為 (2,10) 之情況下,所求得之結果:有了此函數,即可省去查『附錄五 F 分配的臨界值』 F 分配表之麻煩。

Page 5: 第十二章  單因子變異數分析

馬上練習 查兩個自由度( d.f. )分別為 1~10 之情況下,單尾機率為 5% 之 F

值:(詳範例 Ch12.xlsx 『 F 分配的臨界值』工作表)

Page 6: 第十二章  單因子變異數分析

F 檢定 FTEST() 變異數分析 (Analysis-of-Variance 簡稱 ANOVA) ,為統計學家費雪

(Fisher , R.A.) 首創,最常被用來檢定兩常母體之變異數是否相等(即,變異數同質性的檢定)與檢定多組(大於兩組)母群平均數是否相等?(若為兩組則採用 t 檢定或 z 檢定)

要使用變異數分析的基本假設為: 各樣本之母群體為常態分配 (normality) 各樣本之母群體為獨立 (independence) 各組樣本之母群體變異數相同 (homogeneity-of-variance)

Page 7: 第十二章  單因子變異數分析

兩常態母體之變異數檢定FTEST( 範圍 1, 範圍 2)

FTEST(array1,array2) 可傳回兩組資料(樣本數允許不同),變異數是否存有顯著差異的 F

檢定之右尾機率值( P 值)。判斷檢定結果時很簡單,只須看此 P 值之二分之一是否小於所指定顯著水準之 α 值。(按理,係雙尾檢定,但通常會將數字大者當分子,故只須看右尾之臨界值即可)

本函數,可用來測試兩組樣本的變異數是否相同?即變異數同質性的檢定,其虛無假設與對立假設分別為:H0:σ1

2=σ22 (兩變異數相等)

H1:σ12≠σ2

2 (兩變異數不等)

Page 8: 第十二章  單因子變異數分析

假定,要檢定甲乙兩班之母體變異數是否相同( α=0.05 )?隨機抽得範例Ch12.xlsx 『 F-TEST1 』工作表之資料,以=FTEST(B2:B10,C2:C11)/2求得其右尾機率( P 值)並將其除以 2 ,其值為 0.043<α=0.05 ,故應棄卻兩變異數相等之虛無假設:

Page 9: 第十二章  單因子變異數分析

同樣之例子,若使用『資料分析』增益集。其處理步驟為:(詳範例Ch12.xlsx 『 F-TEST2 』工作表)

1. 切換到『資料』索引標籤 , 點選『分析』群組『資料分析』鈕( # 圖 Ch12- DataAnalysis ) , 於『分析工具』處選選「 F- 檢定:兩個常態母體變異數的檢定」

2. 續 鈕

Page 10: 第十二章  單因子變異數分析

3. 於『變數 1 的範圍』與『變數 2 的範圍』處,設定兩組資料之範圍( B1:B10 與 C1:C11 )

4. 點選「標記 (L) 」(因兩組資料均含『甲班』、『乙班』之字串標記)5. α 維持 0.05

6. 設定輸出範圍,本例安排於目前工作表之 E2 位置

Page 11: 第十二章  單因子變異數分析

7. 按 鈕結束,即可獲致檢定結果依此結果:自由度為 (8,9), F值 3.4192>臨界值3.2296( F10處之 P值 0.0426<α=0.05,同於B15之值; E15處以 FINV所算得之 F值為 3.419,同於 F9之值),故可知甲乙班之變異數有顯著差異。(應棄卻兩變異數相等之虛無假設)

Page 12: 第十二章  單因子變異數分析

FTEST() 函數實際上是以

計算求得 F 值,再代入 FDIS() 以 (n1-1,n2-1) 為自由度,求得其右尾機率。如以前面例子 n1=9 、 n2=10 、 、

此值恰等於詳範例 Ch12.xlsx 『 F-TEST3 』工作表中, B16 以 FINV() 函數所計算之結果。將其代入 FDIS() 以 (8,9) 為自由度,求得其右尾機率為0.0426 ,恰等於 B15 以 FTEST() 函數所計算之結果(該值係將雙尾機率除以 2 ):

22

21

S

SF

75.64821 S 73.1892

1 S

419.373.189

75.64822

21 S

SF

Page 13: 第十二章  單因子變異數分析

先檢定變異數再進行均數檢定 當以 t 檢定,進行兩獨立樣本(小樣本)均數檢定時,將視其變異數

相同或不同,而使用不同之計算方法。實務上,很多知名的統計套裝軟體(如: SPSS 、 SAS ),就先以 F 檢定,判斷其變異數是否相同?然後再進行適當之 t 檢定。

如,要對範例 Ch12.xlsx 『 F&T 』工作表之資料,進行兩班抽樣成績之均數檢定:

Page 14: 第十二章  單因子變異數分析

以前,我們是假設變異數相等(或不等)後,才來進行 t 檢定。但這種假設合理否?誰都不知道!所以,就先以 F 檢定,判斷其變異數是否相同:

由其 F10 處之 P 值為 0.27>α=0.05 ,故無法棄卻兩變異數相等之虛無假設。

Page 15: 第十二章  單因子變異數分析

由於, F 檢定之結果顯示甲乙兩班之變異數相等。故可使用『 t 檢定:兩個母體平均數差異檢定,假設變異數相等』之方法進行檢定。假定,要判斷在α=0.05 之顯著水準下,乙班之平均成績是否高過甲班?由於是變異數相同, t 檢定之類型為 2 。且虛無假設與對立假設分別為:H0:μ1≧μ2

H1:μ1<μ2

故此類檢定為單尾檢定。所以,以=TTEST(C2:C11,B2:B10,1,2)或以『資料分析』之「 t 檢定:兩個母體平均數差異檢定,假設變異數相等」增益集:

Page 16: 第十二章  單因子變異數分析

均可進行檢定:

無論由 B16 或 F27 之單尾 P 值來看,均顯示其值 0.1856>α=0.05 ,故仍無法棄卻兩班之均數相等的虛無假設,所以並無法證明乙班之平均成績會高過甲班。

Page 17: 第十二章  單因子變異數分析

馬上練習 以範例 Ch12.xlsx 『 F&T 馬上練習』工作表,利用 F 檢定,判斷北區與南區給予剛畢業之大學生的薪資變異數是否相等( α=0.05 )?續以適當之 t 檢定,判斷北區給剛畢業之大學生的平均薪資是否高過南區( α=0.05 )?

Page 18: 第十二章  單因子變異數分析

由其 G10處之 P值為 0.17>α=0.05,故無法棄卻兩變異數相等之虛無假設,故得使用兩個母體變異數相等之均數檢定:

由 G26之單尾 P值0.003<α=0.05,故得棄卻兩區均數相等之虛無假設,所以北區給剛畢業之大學生的平均薪資高過南區。

Page 19: 第十二章  單因子變異數分析

單因子變異數分析( ANOVA ) 變異數分析的另一種用途,是用來檢定多組( >2 )母群平均數是否

相等?亦即, Z 與 t 檢定是用於兩組資料比較平均數差異時;而比較二組以上的平均數是否相等時,就須使用到變異數分析。其虛無假設與對立假設為:H0:μ1=μ2=…=μk(每組之均數相等)H1: 至少有兩個平均數不相等

假定,範例 Ch12.xlsx 『 ANOVA 』工作表資料,為調查各地區對政府施政的整體滿意程度(滿分為 100 分),試以 α=0.01 之顯著水準,檢定各地區之滿意程度是否存有顯著差異?

Page 20: 第十二章  單因子變異數分析

本例,以使用『資料分析』進行處理最為便捷。其步驟為:1. 切換到『資料』索引標籤 , 點選『分析』群組『資料分析』鈕 , 於『分析工

具』處選「單因子變異數分析」

2. 續按 鈕

Page 21: 第十二章  單因子變異數分析

3. 於『輸入範圍』處,設定三組資料之範圍,選取可包括所有資料之最小範圍即可(本例為 B2:D12 ,別管其內可能仍含有空白儲存格)

4. 將『分組方式』安排為「逐欄 (C) 」5. 點選「類別軸標記在第一列上 (L) 」(因各組資料均含標題之字串標記)6. α 設定為 0.01

7. 設定輸出範圍,本例安排於目前工作表之 G2 位置

Page 22: 第十二章  單因子變異數分析

8. 按 鈕結束,即可獲致單因子變異數分析之 ANOVA 表

依此結果:自由度為 (2,24) , F 值 10.79886> 臨界值 5.61 ( L13 處之 P值 0.00045<α=0.01 ),故可知三個地區之整體滿意度存有顯著差異。南區的滿意度 86.5 要比其餘兩區( 66.30 與 79.89 )來得高。

Page 23: 第十二章  單因子變異數分析

馬上練習 某公司於報紙上進行廣告,範例 Ch12.xlsx 『廣告 ANOVA 』工作表,

為不同方式廣告當天所獲得之回應人數:試以 α=0.05 之顯著水準,檢定不同方式廣告之回應人數是否存有顯著差異?

Page 24: 第十二章  單因子變異數分析

答案: F=6.56 , d.f.=3,19 , P- 值 =0.00 ,不同方式廣告之回應人數間存有顯著差異。全版與半版廣告之回應人數( 1173.5 與 1083.2 )高於 1/4版與小廣告( 724.4 與 733.0 )。

Page 25: 第十二章  單因子變異數分析

馬上練習 依範例 Ch12.xlsx 『信用卡刷卡金額』工作表

試以 α=0.05 之顯著水準,檢定大學生每月刷卡金額是否隨零用金來源不同而存有顯著差異?

答案: F=0.46, d.f.=2,32, P-值 =0.64,大學生每月刷卡金額並不會因其零用金來源不同而存有顯著差異。

Page 26: 第十二章  單因子變異數分析

馬上練習 將範例 Ch12.xlsx 『手機平均月費』工作表之內容

將其整理成僅剩有手機者(刪除無手機者),並以居住狀況分組:

Page 27: 第十二章  單因子變異數分析

試以 α=0.05 之顯著水準,檢定大學生每月手機月費是否隨其居住狀況不同而存有顯著差異?

答案: F=6.887, d.f.=2,116, P-值 =0.001<α=0.05,故大學生每月手機月費將隨其居住狀況不同而存有顯著差異,住家裡最高( 572.36)、其次為住校外( 447.59),最後為住學校宿舍( 319.43)。這可能與住學校者較為節儉有關。

Page 28: 第十二章  單因子變異數分析

量表的檢定—多組 對於如:

等之評價量表,我們也經常得進行分組檢定。看對某一屬性之注重程度,是否會因組別不同而有顯著差異?

Page 29: 第十二章  單因子變異數分析

若僅分兩組,係以『資料分析』之「 Z 檢定:兩個母體平均數差異檢定」來進行檢定。若組數為兩組以上,則以『資料分析』之「單因子變異數分析」來進行檢定。

以範例 Ch12.xlsx 『擁有手機時間長短 X 附屬功能多屬性』工作表,其內僅安排一個『附屬功能多』評價項目(非常重要 -5 、……、非常不重要 -1 )及擁有手機之時間長短資料( 1.未滿六個月、 2.六個月至一年、 3. 一年 ~ 一年半、 4. 一年半以上):

Page 30: 第十二章  單因子變異數分析

由於分組結果超過兩組,故得以『附屬功能多』之「單因子變異數分析」來進行檢定。先將其資料整理成:

Page 31: 第十二章  單因子變異數分析

然後,以『資料分析』之「單因子變異數分析」來進行檢定

Page 32: 第十二章  單因子變異數分析

其檢定結果為:

Page 33: 第十二章  單因子變異數分析

由於本例之虛無假設及對立假設為:H0:μ1=μ2=…=μk(每組之均數相等)H1: 至少有兩個平均數不相等α=0.05

依此結果: F=2.9767 , d.f.=3,115 , P- 值 =0.0345 < α=0.05 ,故大學生對『附屬功能多』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年~一年半者的注重程度( 2.79 ),低於其他各組( 3.45 以上)。

Page 34: 第十二章  單因子變異數分析

馬上練習 依範例 Ch12.xlsx 『擁有手機時間長短 X 雙頻手機屬性』工作表內容

將其資料整理成:

Page 35: 第十二章  單因子變異數分析

然後,以『資料分析』之「單因子變異數分析」來進行檢定大學生對『雙頻手機』評價項目的注重程度,是否隨其擁有手機時間長短而存有顯著差異?

依此結果: F=2.747, d.f.=3,115, P-值 =0.046< α=0.05,故大學生對『雙頻手機』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年半以上者的注重程度( 4.2),高於其他各組。

Page 36: 第十二章  單因子變異數分析

於報告上量表檢定的寫法 -多組 通常,我們問卷上的評價量表,絕不會是少數的幾個評價項目而已。

以『資料分析』之「單因子變異數分析」來進行檢定,也是得一個一個進行檢定,其過程相當辛苦。這也是沒辦法的事,主要是 Excel 並不是專門的統計軟體,能做到這樣也算是不錯的了。

最後,將其彙總成下表:(詳範例 Ch12.xlsx 『手機屬性 -ANOVA 』工作表)

Page 37: 第十二章  單因子變異數分析

檢定結果顯著者,於其 P 值後加註 "*" (表其< α=0.05 ),並於報告中對其詳將解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如:

根據調查解果,受訪者較注重之手機屬性,依序為:『收訊狀況佳』、『電磁波的傷害』、『待機時間長』、『大小適中』與『重量輕巧』。

經逐一以 F 檢定,以擁有手機時間長短分組,對其注重程度進行檢定,發現有『附屬功能多』與『雙頻手機』等屬性之注重程度會隨擁有手機時間長短不同,而有顯著差異( P<α=0.05)。這些項目,均是『一年 ~ 一年半』組的著重程度較低,可能是剛開始有手機者,會較注重這些項目,隨時間增長,慢慢地發現其實這些項目也沒多大重要性;至於,『一年半以上』者,可能或真正發現沒這些功能的不便性,或許也開始考慮要換手機,故其注重程度又明顯的高於其他各組。

Page 38: 第十二章  單因子變異數分析

第十二章 結束謝謝!