1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2,...

34
1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007
  • date post

    20-Dec-2015
  • Category

    Documents

  • view

    218
  • download

    1

Transcript of 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2,...

Page 1: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

1

Analysis of Quantitative Data

Social Research Methods2113 & 6501Spring, 2007

March 26~April 2, 2007

Page 2: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

2

Quantitative Analysis: convert data to a numerical form and

statistical analyses

• quantification ( 量化 ): the process of converting data to a numerical format ( 將資料轉換成數字形式 )

Page 3: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

3

Part I. Dealing With Data

• ( 過錄 ) 編碼簿製作、原始資料編碼 (a codebook & coding data)• 資料輸入 (entering data)• 清理資料 (cleaning data)

Page 4: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

4

Coding Data ( 資料編碼 )

• Data Coding: systematically reorganizing raw data into a format that is machine readable ( 將原始資料有系統地轉化成電腦程式可閱讀的形式 )

• Need a coding procedure & a codebook– Coding procedure( 編碼程序 ): a set of rules st

ating that certain numbers are assigned to variable attributes ( 一些設定的規則,以確定變數屬性的編號為何 )

Page 5: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

5

Coding Data ( 資料編碼 )

• A codebook( 編碼簿 ): a document describing the coding procedure and the location of data for variables in a format that computers can use ( 一份描述編碼程序及變數位置的文件 )– Should be well-organized, detailed ( 有條理、詳細 )– Make multiple copies! ( 多影印幾份,妥善保存 )– Precoding ( 事前編碼 ) done– Code each questionnaire ( 每份問卷都需編碼 )

Page 6: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

6

A codebook example

Page 7: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

7

1. 您認為系上提供了您哪些協助?(可複選)

help_d 1 □ 選課 2 □ 生活 3 □ 獎學金 4 □ 就業資訊

5 □ 其它,請說明: _________help_do______

8: Skip

9: Missing

Codebook Example

Page 8: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

8

• 請問影響您繼續升學的主要原因: ( 可複選 )

1_a1 □ 目前所就讀的科系有很大的發展前途1_a2 □ 為了滿足父母的期待1_a3 □ 家庭經濟足以支持您繼續升學1_a4 □ 個人成績優異1_a5 □ 對從事學術研究有興趣 1 = yes, 0 = no1_a6 □ 目前就業率不高 8 = skip, 9 = missing1_a7 □ 目前就業市場不需所就讀科系之人才1_a8 □ 為了延後兵役1_a9 □ 繼續升學可獲得較佳的升遷機會1_a10 □ 繼續升學可獲得較高的薪水1_a11 □ 個人認為取得碩士文憑以上是重要的1_a12 □ 社會普遍升學風氣興盛1_a13 □ 因為同學都升學1_a14 □ 老師的建議

• 勾選完後請將您認為最重要的三個原因圈選出來 1mi_1, 1mi_2, 1mi_3 88 = skip, 99 = missing

Page 9: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

9

編碼注意事項 :

• 製作編碼簿 (a codebook)– 記得加上兩個變數 : 編碼者號碼及受訪者 ID– Ex: 變數名稱— coder & ID

• 製作 SPSS 資料檔– 輸入變數名、 變數註解、 數值及註解、遺漏值

等• 請用紅筆編碼,綠筆用來訂正• 編碼者請在問卷左上方或右上方簽名• 資料輸入者也請在問卷封面上簽名

Page 10: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

10

Entering data ( 資料輸入 )

• Data records: – each row ( 列 ) represents a respondent (case)– each column ( 行 ): a specific variable

• Four ways to enter data:– Code sheet– Direct-entry method– Optical scan– Bar code

• Recommend: double entry ( 重複輸入 )

Page 11: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

11

Cleaning Data ( 清理資料 )

• Why clean your data? Need accuracy ( 準確度 )!• Double data entry to ensure data accuracy.• Procedures to “clean” data ( 清理資料的步驟 ):

– Use frequency tables to do code cleaning ( 利用次數分配表檢查變數屬性數值、遺漏值等 )

– Contingency cleaning (consistency checking) ( 一致性檢查 )

• EX: cross-classifying two variables• Check contingency questions ( 檢查條件式問項答案 )

• Will discussed in more details later

Page 12: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

12

Part II. Data Analysis

Page 13: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

13

Review: Quantitative Data Analyses

• Univariate analyses (單變量分析 ): a single variable– Distributions, central tendency, variation

• Bivariate analyses (雙變量分析 ): the analysis of two variables– The scattergram, percentaging a table, contingency ta

bles

• Multivariate analyses (多變量分析 ): analyzing more than two variables simultaneously

Page 14: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

14

Please note: some calculations are not suitable to all variables

• Continuous variables (ratio variables) ( 連續變數 ): a variable whose attributes form a steady progression– Ex: age

• Discrete variables ( 間斷變數 ): a variable whose attributes are separate from one another, or discontinuous – Ex: gender– Nominal or ordinal variables– Can use raw numbers, percentages, or modes (but no

t very interesting)

Page 15: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

15

Need a research plan for quantitative data analysis:

• Think about your research question(s) & research purposes ( 先想想你的研究問題及目的 ) [ 記得 : 分析資料不能偏離主題 !]

• Think about your hypotheses ( 想想你的假設 )• Main variables: dependent variables & independ

ent variables ( 依變數及自變數是什麼 ?)• Propose a plan for data analysis, timeline, hours

of work, etc. ( 擬定計劃,如何進行及分工… )

Page 16: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

16

A doable process for data analysis

• Data Cleaning (will discussed in detail later)• Understand your data

– Look at frequency tables of key variables again ( 再看一次重要變數的次數分配表 )

– Find any potential problems for further data analysis (ex: missing data percentage?) ( 尋找問題 : 遺漏值太多 ?其他 ?

– Produce some tables for descriptive analysis ( 製作表格,注意表格格式 )

– Have some sense for data recording ( 想想變數如何重新編碼 )

Page 17: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

17

Data Analysis: data recoding and create new variables

• Why data recoding and crate new variables?– For more meaningful analyses– Ex: dummy variables, collapse response categories

• Data recoding and editing: Think about your hypotheses, have purposes

• Remember to check consistency after recording (use frequency tables) (新舊變數次數分配要一致 )

• Add variable and value labels (新變數要有變數及數值註解 )

Page 18: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

18

Bivariate analyses (雙變量分析 )

• 確定你的研究性質• 建議 : 想想你的依變數,如果是名義或次

序量數,只能用 cross-tabulation與卡方來分析相關性。

• 依變數如果是等距或等比量數,可採用複迴歸。自變數要先分析變數之間的共線性。

Page 19: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

19

Bivariate Tables

• Contingency tables: values of the dependent variable are contingent on (depend on) values of the independent variables

• How to percentage a table?– Note: the direction of percentaging in tables is arbitrar

y– In general, we follow this “tip”: “row” by “column” (dep. var by indep. var)– Usually done by SPSS of other computer programs

• How to read a table of percentages?

Page 20: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

20

Page 21: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

21

Reading a percentage table:

• A rule of thumb (the tip):– if the table is percentaged down, read across ( 表格

是直行百分比,依橫列來解讀 )– If the table is percentaged across, read down

Page 22: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

22

Bivariate Tables without Percentages

• Use the mean in a bivariate table (i.e., subgroup comparison)

Page 23: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

23

An example of contingency table analysis:

Q: 性別與大學主修之關係

Page 24: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

24

卡方值 (Χ2) 是 17.825 ,自由度是 1 ,由表得知此卡方值大於 10.827 (p = 0.001) ,所以得到此卡方值的機率應低於 0.001 ,觀察到的性別與大學主修之間的關係不可能只是因抽樣誤差而產生。由列聯表中可看出,約半數的男性選擇念人文社會或自然科學,但女性僅有略多於四分之一的比率 (26.6%) 在大學時選擇主修自然科學,性別與大學主修之差異在統計上是顯著的。

major of college-based on v13bm * 1 Crosstabulation性別

79 105 184

42.9% 57.1% 100.0%

49.7% 73.4% 60.9%26.2% 34.8% 60.9%

80 38 118

67.8% 32.2% 100.0%

50.3% 26.6% 39.1%26.5% 12.6% 39.1%

159 143 302

52.6% 47.4% 100.0%

100.0% 100.0% 100.0%52.6% 47.4% 100.0%

Count% within major ofcollege-based on v13bm% within 1 性別% of TotalCount% within major ofcollege-based on v13bm% within 1 性別% of TotalCount% within major ofcollege-based on v13bm% within 1 性別% of Total

人文社會商科

自然工程

major of college-basedon v13bm

Total

男 女1 性別

Total

Page 25: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

25

An example of data analysis: 教育成就的世代差異

Q: 什麼因素可以解釋孩子的教育程度 ?

資料 :第四期第三次的「台灣社會變遷基本調查」 (於 2002年完成 )

[ 注意 : 此範例大幅簡化了因果模型 ]

Page 26: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

26

Data Analysis ExampleV13A 13a 受訪者教育程度

171 8.6 8.6 8.612 .6 .6 9.2

439 22.0 22.1 31.3236 11.8 11.9 43.113 .7 .7 43.879 4.0 4.0 47.878 3.9 3.9 51.7

363 18.2 18.3 69.95 .3 .3 70.2

85 4.3 4.3 74.5158 7.9 7.9 82.420 1.0 1.0 83.414 .7 .7 84.112 .6 .6 84.753 2.7 2.7 87.4

197 9.9 9.9 97.349 2.5 2.5 99.75 .3 .3 100.0

1989 99.8 100.03 .2

1992 100.0

1 無2 自修3 小學4 國(初)中5 初職6 高中普通科7 高中職業科8 高職9 士官學校10 五專11 二專12 三專13 軍警校專修班14 軍警官學校15 技術學院、科技大學16 大學17 碩士18 博士總和

有效的

19 其他遺漏值總和

次數 百分比 有效百分比 累積百分比

Page 27: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

27

Data Analysis Example

• 重新編碼 [ 受訪者的教育程度 ] 、 [ 受訪者父親的教育程度 ] 、 [ 受訪者母親的教育程度 ]這三個變數 :

(無 ) → 0( 自修 ) → 3(小學 ) → 6(國、初中、初職 ) → 9( 高中普通及職業科、高職、士官學校 ) → 12(五專、二專、三專、軍警校專修班 ) → 14(軍警官學校、技術學院、科技大學、大學 ) →16( 碩士 ) →18(博士 ) →20

Page 28: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

28

Data Analysis Example

EDUC_R education of respondents

171 8.6 8.6 8.612 .6 .6 9.2

439 22.0 22.1 31.3249 12.5 12.5 43.8525 26.4 26.4 70.2277 13.9 13.9 84.1262 13.2 13.2 97.349 2.5 2.5 99.75 .3 .3 100.0

1989 99.8 100.03 .2

1992 100.0

03691214161820總和

有效的

系統界定的遺漏遺漏值總和

次數 百分比 有效百分比 累積百分比

Page 29: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

29

重編受訪者母親教育程度統計表

888 44.6 45.6 45.637 1.9 1.9 47.5

734 36.8 37.7 85.2132 6.6 6.8 91.9

110 5.5 5.6 97.6

23 1.2 1.2 98.8

22 1.1 1.1 99.9

2 .1 .1 100.01948 97.8 100.0

6 .337 1.91 .1

44 2.21992 100.0

無自修小學國、初中、初職高中普通及職業科、高職、士官學校五專、二專、三專、軍警校專修班軍警官學校、技術學院、科技大學、大學碩士總和

有效的

其他9798總和

遺漏值

總和

次數 百分比 有效百分比 累積百分比

重編受訪者父親教育程度統計表

584 29.3 30.5 30.568 3.4 3.5 34.0

701 35.2 36.6 70.6212 10.6 11.1 81.6

201 10.1 10.5 92.1

62 3.1 3.2 95.4

83 4.2 4.3 99.7

3 .2 .2 99.83 .2 .2 100.0

1917 96.2 100.016 .857 2.92 .1

75 3.81992 100.0

無自修小學國、初中、初職高中普通及職業科、高職、士官學校五專、二專、三專、軍警校專修班軍警官學校、技術學院、科技大學、大學碩士博士總和

有效的

其他9798總和

遺漏值

總和

次數 百分比 有效百分比 累積百分比

Page 30: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

30

相關

1.000 .751**. .000

1917 1906.751** 1.000.000 .1906 1948

Pearson 相關 ( )顯著性 雙尾

個數Pearson 相關

( )顯著性 雙尾個數

重編受訪者父親教育程度

重編受訪者母親教育程度

重編受訪者父親教育程度

重編受訪者母親教育程度

0.01 ( )在顯著水準為 時 雙尾 ,相關顯著。**.

Page 31: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

31

Data Analysis Example

• 由於受訪者父親與受訪者母親的教育程度有相當高的相關性,因此兩者可以互相解釋,將此兩變項同時引入複迴歸的方程式中,將導致違反迴歸方程式的基本假設 : 兩自變項 Xi 、 Xj 無共線性。

• 在選用上以遺漏值較少的受訪者母親教育程度為其變數。在迴歸方程式處理遺漏值時,無論是取消此一數值,或者以平均值代替遺漏值,或其他的處理方式,都會以人為方式影響到迴歸方程式的計算,因此,在避免人為甘預的原則下,我們會採用遺漏值越少的變數。

Page 32: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

32

建立性別的虛擬變數 (dummy variable): female = 1, male = 0.( 記得用次數分配檢查編碼結果是否正確 .)

V1 1 性別

971 48.7 48.7 48.71021 51.3 51.3 100.01992 100.0 100.0

1 男2 女總和

有效的

次數 百分比 有效百分比 累積百分比

TE4 虛擬變項:性別

971 48.7 48.7 48.71021 51.3 51.3 100.01992 100.0 100.0

0 男1 女總和

有效的

次數 百分比 有效百分比 累積百分比

Page 33: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

33

模式摘要

.604a .364 .364 3.770 .364 556.439 2 1942 .000模式1

R R 平方調過後的R 平方 估計的標準誤 R 平方改變量 F 改變 分子自由度 分母自由度 F 顯著性 改變

變更統計量

( ), EDUC_M education level of respondent's mother, GENDER2 second variable of gender預測變數: 常數a.

變異數分析b

15814.921 2 7907.461 556.439 .000a

27597.431 1942 14.21143412.352 1944

迴歸殘差總和

模式1

平方和 自由度 平均平方和 F 檢定 顯著性

( ), , 預測變數: 常數 重編受訪者母親教育程度 虛擬變項:性別a. 依變數:重編受訪者教育程度b.

係數a

8.170 .149 54.708 .000 7.877 8.463-1.149 .171 -.122 -6.714 .000 -1.485 -.813

.669 .021 .586 32.373 .000 .628 .709

( )常數虛擬變項:性別重編受訪者母親教育程度

模式1

B 之估計值 標準誤未標準化係數

Beta 分配

標準化係數

t 顯著性 下限 上限

B 迴歸係數 的95% 信賴區間

依變數:重編受訪者教育程度a.

Page 34: 1 Analysis of Quantitative Data Social Research Methods 2113 & 6501 Spring, 2007 March 26~April 2, 2007.

34

此迴歸方程式的解釋 :

• 迴歸方程式通過 F 與 t 檢定,因此本迴歸方程式具有其解釋力。此一複迴歸方程式為:(受訪者教育程度) = 8.170 –1.149(性別) + 0.

669(受訪者母親教育程度)

• 由此迴歸方程式可以得知,當我們固定母親的教育程度時,比起男性,女性平均少接受一年的學校教育;而不論性別,母親的教育程度則對受訪者的教育程度有正面的影響。而比較標準化的係數之後,可以得知母親的教育程度比性別對受訪者的教育程度影響來得大。