2018 教育部 高等深耕計畫 - 國立臺灣大學計畫能帶領全國大學急起 直追。 謝謝委員的建議。 本校在邁頂計畫經費挹注之下,校務 推動已累積許多競爭優勢(詳見計畫
演講 問卷設計與SPSS分析-三星統計謝章升-20140926
-
Upload
beckett-hsieh -
Category
Education
-
view
460 -
download
16
description
Transcript of 演講 問卷設計與SPSS分析-三星統計謝章升-20140926
三星統計諮詢顧問 謝章升[email protected]版次:20140926三星課程網www.tutortristar.com
問卷設計與SPSS分析Questionnaire Design for
Social Surveys
About me
2
103演講
7年領域經驗
2核心領域(量化研究&數位行銷)
How to teach ?
母體
普查
抽樣
樣本大小
樣本
1.統計學的故事
2.社會科學的問卷設計
3.不同代統計的問卷設計
4.SPSS分析整合觀念
演講大綱
4
1.統計學的故事
5
1. 數學家
2. 大學教授
3. 統計學家
※美國職場調查網站CareerCast.com 2014年度調查報告
※該報告以工作環境、收入、職業遠景和壓力為評比標準
美2014年度CP值(性價比)最棒工作:數學家
預測分析
消費-哪些人會買
生活-交友網站
選舉-影響選民的方法
疾病-成因與解決方案
為什麼美國數學家最賺,臺灣?
霍亂的真相
1.十九世紀英國
2.第一次流行(掛了2萬人)
3.加強排水系統
4.第二次流行(掛了7萬人)
流行病學之父-John Snow
1.詢問與觀察
2.比較感染與未感染的差異
3.做出架設收集資料驗證
戶數 死亡 每1萬戶死亡
A自來水 40046 1263 315
B自來水 26107 98 37
回到1920年代末期的英國…
世界上首次的隨機對照實驗
回到1920年代末期的英國…
顯著性P value
<0.05 *
<0.01 **
<0.001 ***
英國皇家化學學會,2003
隨機對照實驗…
想研究肥料影響收穫量
但每塊地的排水,肥沃度,
日照等因素都不同
SPSS常見的分析-線性模型
SPSS常見的分析報表…
他們的貢獻與情仇…
Karl Pearson
1857-1936
Sir Ronald Aylmer Fisher
1890-1962
1. 社會調查法
2. 流行病學與生物統計學
3. 心理統計學
4. 資料採礦
5. 文字探勘
6. 計量經濟學
統計學的6大領域
本應可以取得,但實際上卻沒能測得的資料
1.抽樣端-找不到人
2.問卷端-找不到答案
社會調查專家的挑戰-遺漏值
18
1.羅森斯德農業試驗
所的隨機對照實驗
2.Gosset的迴歸模型
3.找出「原因」
流行病學與生物統計學家
19
1.斯皮爾曼(Charles Edward Spearman) vs. IQ
vs. 探索式因素分析(Factor Analysis)
2.相關性
3.心靈及精神
4.工作價值vs. 工作動機 vs. 金錢
心理統計學
20
探索性因素分析(Exploratory factor analysis ;EFA)
如果有一堆積木:X甲1乙丙2YZ3
英文字母:XYZ
數字:123
中國字:甲乙丙
探索性因素分析(Exploratory factor analysis ;EFA)
1. 樣本數建議200以上(Comrey,1973)
2. 數學原理是共變(covariance)
3. 針對變數(連續)分類 vs.集群分析(通常針對人)
4. 主要目的是將一組變數縮減成少數幾個因素
5. 因素一定要重新命名
探索性因素分析(Exploratory factor analysis ;EFA)
1.抽象概念
2.訪問引導出詞彙
3.結合理論與類似研究
4.設計出第一版問卷
心理統計學-發明問卷
24
5.前測
6.項目分析
7.探索式因素分析
8.受訪者忘記後再測
9.科學量表
心理統計學-發明問卷
25
1.抽象概念-忠誠
2.訪問引導出詞彙-不離不棄
3.結合理論與類似研究
4.設計出第一版問卷
心理統計學-發明問卷-範例
26
5.前測(目的在找出拒答或不適合的題目)
6.項目分析(目的在找出沒有鑑別力的題目)
7.探索式因素分析
(目的在分類,態度忠誠,行為忠誠)
8.受訪者忘記後再測
9.科學量表
心理統計學-發明問卷-範例
27
1.以因素結構為基礎算出得分代表抽象概念
2.最後用這個分數進行統計分析
心理統計學-驗證導向
28
1.科學量表
2.意見調查表
3.直接問句與情境式問句
4.請問您平常會不會打另一半
5.請問您平常會不會一天不見對方,就會心浮氣燥
心理統計學
29
1.依照模型反覆嘗試與修正問項
2.生物統計學-NO
3.心理統計學-Yes
生物統計學 vs. 心理統計學
30
1.利用迴歸分析驗證每條路徑
2.不能證實所選模型是否最佳模型
其他領域對路徑分析的批評
31
1.日本常用的田中比奈式測驗
2.原本目的是為找出學習能力落後的同齡小孩
3.卻誤用為得高分便是天才兒童
4.原始定義與量表用途須一致
對IQ的批評
32
1.資料採礦(炫)
2.Big Data(炫)
3.巨量資料(炫)
4.神經網路(炫)
5.統計學(不炫)
商業色彩的資料採礦 (Data mining)
33
1.購物籃分析
2.相關分析比
購物籃分析佳
(Sergey Brin)
商業色彩的資料採礦 (Data mining)
34
1.分析彙總表採用卡方分析
2. Amazon網站的商品推薦
商業色彩的資料採礦 (Data mining)
35
1.目標是以預測為主
2.預測顧客會購買的商品
3.預測哪些顧客會被搶走
4.與迴歸分析相比,準確度多出幾個百分點
5.營業額高時適合用
商業色彩的資料採礦 (Data mining)
36
1.運用統計分析自然語言的文章
2.自然語言=英文,日文,中文….
3.莎士比亞真有其人?
4.型態分析
5.目前停留在單詞層次
6.文學,史學,社會學,商學
文字採礦
37
1. 型態分析(Morphological Analysis)
2.目前停留在單詞層次
3.文學,史學,社會學,商學
4.社群網路服務的新世界
5.網路口碑與選情走向分析
文字採礦
38
1. 對於交互作用的變數,選擇上更嚴謹
2.會先考慮X跟Y之間是否可能存在曲線關係
3.例如收入與滿足感
4.偏好使用概率回歸方法
計量經濟學
39
2.社會科學的問卷設計
40
1.是否有研究主題?
2.研究架構?
3.研究構念?
4.找不到相符的資料庫?
思考一下什麼情況需要問卷
41
又稱構面,為一個想像的抽象名詞,
目的是建立研究的基礎
例如:滿意度
研究的基本名詞-構念(construct)
42
變數是量化研究方法中的必要組成因素,
目的是讓構面可以操作
例如:滿意度有設計3個題目,則是3個變數
研究的基本名詞-變數(Variable)
43
為各變數之間的對應關係,
是研究問題的暫時性答案,
只有經過統計估計/檢定,
才能判定其為真實
例如:你假設滿意度會影響再購意願
研究的基本名詞-假設 (Hypotheses)
44
研究假設
檢定平均數相等-t檢定,ANOVA,時間序列,重複測量
檢定斜率為0
-相關,迴歸,路徑分析,獨立性檢定
檢定變異數箱等-同質性檢定,適合度檢定
研究的基本名詞-檢定與估計
46
將抽象的概念用相關,具體,
可觀察並可衡量的事物展現
組織承諾:離職率,請假次數
憂鬱程度:睡眠狀況,參與社交活動狀況
研究的基本名詞-操作型定義
47
研究架構
1. 單選題
2. 複選題
3. 同意度類型題
4. 文字輸入題型
問卷題型
49
1.引述前人研究相關題目
2.採用封閉式的題型
3.明確
4.簡短
5.不要反向題
6.建議7尺度
7.一個構念不要超過7題
問卷設計原則
51
1.具體且直覺
2.避免受訪者不熟悉的用詞
3.避免一個問題問兩件事
4.避免明示與暗示的建議
5.不要侵犯隱私
措詞用字原則
52
1.為什麼不能用反向題?
2.可以一個構面合併兩個學者設計的問卷嗎?
3.知名學者的問卷題目,我真的統計分析後可以刪除嗎?
4.我過程都有照標準流程,為什麼分析的時候還是一團糟?
常見的問題排行榜
53
原始資料-Raw Data
原始資料-Covariance Matrix
次級資料
1. 政府,第三方機構統計資料
2. 學術期刊的Covariance Matrix(較適用SEM Paper,PLS不適用)
3. 其他學者合作資料
4. 常見問題-去哪找我的領域可用的資料庫?
3.不同代統計的問卷設計
57
形成型指標vs.反映型指標
反映型指標 (Reflective)
反映型指標
形成型指標 (Formative)
形成型指標vs.反映型指標
形成型指標vs.反映型指標
形成型指標vs.反映型指標
1. 因果關係必需是構面到觀察變數(Churchill,1979);
2. 測量誤差在觀察變數;
1. 觀察變數需具有內部一致性
(Fornell & Bookstein,1982);
3. 觀察變數需具有中高度相關
(Fornell & Bookstein,1982);
4. 一個構面至少需具有3個觀察變數
(Bollen, 1989);
反映型指標特性(Jarvis et al. 2003; MacKenzie et al. 2005)
反映型指標特性(Jarvis et al. 2003; MacKenzie et al. 2005)
6. 觀察變數具可交換性(Nunnally & Bernstein, 1994.);
7. 移除構面中的某特定觀察變數,不會影響構面的意義(Bollen & Lennox, 1991; Nunnally & Bernstein, 1994;
Jarvis et al. 2003) 。
8. 潛在構面要符合單一構面原則,即要有較低的交叉負荷量 (Kline, 2011)
9. 構面需具有數字的敏感性,高低需具有意義 (DeVellis, 2003)。
形成型指標特性
1. 因果方向由測量變數到潛在變數
2. 沒理由相信測量變數之間有中高度相關,
因此沒有內部一致性的問題
3. 拿掉一個變數會改變構面的意義
4. 測量誤差在構面層級
5. 觀察變數定義潛在變數的意義
形成型指標特性
6. 觀察變數不能互相取代
7. 觀察變數不一定要有相似的內容,相關可以為負
8. 一個觀察變數改變不一定會改變其它的變數
9. 觀察變數不一定要有相同的影響變數或結果
4.SPSS分析的整合觀念
69
量化研究的相關概念-四種測量尺度
名目尺度 類別尺度
順序尺度 次序尺度
區間尺度 等距尺度
等比尺度 比例尺度
量化研究的相關概念-四種測量尺度
• 人口統計變項中的性別、
職業別、宗教別……..名目尺度
• 冠軍、亞軍、季軍
第一、第二、第三順序尺度
量化研究的相關概念-四種測量尺度
• 溫度、滿意度、
態度區間尺度
• 年齡、身高、體重等比尺度
確認您的X與Y
前導觀念
口訣:
平均數有沒有
意義
Excemple:
姓別
Excemple:
學生成績
X不連續 X 連續Y連續
Y不連續
X不連續 X 連續
敘述統計 卡方分析
區別分析 Logistic迴歸
Y連續
Y不連續
多變量變異數分析MANOVA
單變量變異數分析ANOVA
T檢定
迴歸分析 偏最小平方迴歸 路徑分析 相關分析
掌握三關鍵-分析沒煩惱
樣本數問題
題目數問題
尺度與指標問題
是 否
尺度建議為
連續尺度 較彈性
SPSS,SEM,PLS皆可分析
分析較受限
目前只有SEM中的
MPlus軟體有演算法
反映型指標
(Reflective)
SPSS
SEM(CB-SEM)
PLS(VB-SEM)
N/A
形成型指標
(Formative) SPSS-主成分分析,典型相關
PLS(VB-SEM)N/A
掌握三關鍵-尺度與指標問題
樣本量 建議方案
100以下1.質性研究
2.PLS-可接受小樣本,但有限制條件
100-200 PLS
SPSS與SEM可能模型不佳
200-500 SPSS (樣本數影響顯著性)
SEM (樣本數不影響顯著性,但為基本要求)
500以上 SPSS
SEM(可隨機分組,驗證模型效度)
樣本數問題
樣本量 建議方案
2題以下 PLS-最低可接受1題(反映與形成指標皆可)
SPSS
3題以上 SEM的基本要求
5-7題 SEM學者的建議設計數量
7題以上 PLS
過多題目與構面在SEM分析中易形成型一錯誤
題目數問題
以產出為導向-碩士論文
前面的流程跑對,
模型幾乎會過關
1.建議盡量蒐集連續尺度2.反應與形成型指標皆可
研究架構
1.資料庫2.問卷對象3.網路問卷
第二代統計學題目數是關鍵
1.傳統的方法易受樣本影響2.樣本過少-PLS
以產出為導向-投期刊
PLS定位為探索,
SEM定位為驗證
從尺度與指標找題目
發展研究架構
1.資料庫2.問卷對象3.網路問卷
題目數
樣本數
補充說明-第四章怎麼寫才會快
完成第四章,依此變成習慣的良性循環
表格先轉Excel
發展研究架構
1.選擇圖形介面的軟體2.SPSS,Amos,PLS,
表格與Office相容
統計描述內容參考國外paper寫自己的一個版本
再轉Word與PPT
Thank you
1. 歡迎有問題時,利用mail或APP聯繫
2. 我們會在能力範圍內盡量回覆您
三星課程網
www.tutortristar.com
83