解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test)...

30
解釋名詞

Transcript of 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test)...

Page 1: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解釋名詞

Page 2: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-2 psychological test

心理計量學 心理計量學是一門研究心理測驗與評斷(Assessment)的科學包括量化心理

學、個別差異與心理測驗理論等研究範圍的學問。比奈-西蒙(Binet-Simon)的智力測驗即人類有史以來第一個心理測驗,而測驗理論便以此為架構發

展至今。 命題重要性:

測驗的意義 1. 狹義看法(Test)

測驗是測量的工具與材料。如智力測驗、性向測驗…等。 2. 廣義看法(Testing)

測驗即採用數字量尺或分類系統,來觀察和描述個人特質的一種系統程

序。測驗是指採用一套標準的刺激,對個人的特質做客觀測量的有系統

程序。 命題重要性:

智力測驗(Intelligence test) 傳統智力測驗是在測量個人普通的學習能力,故又稱普通能力測驗或學業

性向測驗,學業性向測驗所要測量的是學生的學習能力,又可分為團體與

個人智力測驗;智力測驗分為團體與個人智力測驗。對應普通能力測驗即

特殊學習能力,如美術性向與音樂性向能力。 命題重要性:

性向測驗(Aptitude Test) 性向測驗主要在測量學習的潛在能力,與測量個體未來發展的可能性。通

常包括普通性向(學習一般事務所共同需要的能力)與特殊性向(學習音

樂、美術、機械、科學等特殊才能所需的能力)兩種。性向測驗與智力測

驗皆為最大表現測驗。 命題重要性:

Page 3: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-3 psychological test

難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

制。多數成就測驗均屬於難度測驗,目的在評量學生獲得知識與技能的程

度而非反應的快慢。 命題重要性:

常模參照測驗(Norm-referenced Test) 指測驗結果分數並無意義,必須根據分數在團體中位置而加以解釋,採用

相對性標準比較,一般以平均水準為參照點,其目的在競爭區辨學生程度

高低。如大學聯考、國家高普考試、標準化成就測驗、智力測驗、性向測

驗等;文程基測得分占全國 PR 值 92、美美比小英更快完成清掃工作、高

明數學考全班第三名。 命題重要性:

標準參照測驗(Criterion-referenced Test) 必須根據教學目標事先設定絕對的通過標準加以解釋測驗,效標參照測驗

的「效標」要在考試前決定。一般均以學生所學習知識或技能,強調個人

所能與不能完成之項目,判定其「及格或不及格」、「精熟或不精熟」、

「通過或不通過」,不需參考他人表現來比較。如國小教師自編測驗(平

時考、小考、隨堂測驗);國家技師執照考試;Bloom 提倡「精熟學習法」;

中醫師檢定考試;汽車駕照考試;能力本位教育;學力鑑定考試;大華在

十五分鐘之內搭好帳篷。 命題重要性:

最大表現測驗(Maximum-performance Test) 1. 目的在測量受試者最佳反應,鼓勵受試者獲取最高分數或最大成就,確

定個人能力表現。如智力測驗、性向測驗與成就測驗均屬於最大表現測

驗。分數愈高能力愈佳。 2. 最大表現測驗分數中,包括先天能力、實際能力與動機三項決定因素。 命題重要性:

Page 4: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-4 psychological test

典型表現測驗(Typical-performance Test) 1. 在一正常情境中,受試者表現出的典型行為,此一測驗分數無好壞優劣

之分。如:人格測驗、興趣測驗、態度測驗與適應測驗均屬於典型表現

測驗。 2. 受試者實施測驗時,有時會有說謊或偽飾作答,實際上施行困難度較高。 命題重要性:

標準化測驗(Standardized Test) 1. 測驗在編製程序與實施均由專家擔任,在編製過程與實施程序有一致性規

範。測驗題目經由試題分析選擇而來,尚須建立常模、信度、效度、且實

施方式、計分均須依指導手冊進行。 2. 智力測驗、TASA、國中基測與性向測驗均屬於標準化測驗。 命題重要性:

認知測驗 認知測驗指測量個人思考、知識、解決問題等心理能力,包括智力測驗、

性向測驗、成就測驗等。 命題重要性:

測量量尺 將研究搜集到的數量資料,把數字分派於人、事件和物體的法則。心理與教

育研究中,有四種不同測量尺,即名義量尺、次序量尺、等距量尺、比率量

尺。根據上述量尺,可以測量到四種不同資料,應用統計分析方法也不同。 命題重要性:

信度 1. (1)信度是指相同受試者在不同時間,使用相同測驗測量(或複本測驗

測量多次)或在不同情境下測量,所得結果一致性。藉以反應真實量

數程度的一種指標。 (2)二次測量結果相當一致,就表示測量分數可靠性高、穩定性高或具

有可預測性。

Page 5: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-5 psychological test

2. 測量誤差 (1)信度是指測量或測驗分數,反映出真實分數的程度或無誤差程度。

即信度表估計測量的誤差有多少。 (2)測驗分數中由特質的真實差異與測差誤差所造成誤差比率多寡。如

誤差成份高則信度低;誤差成份低,則信度高。 命題重要性:

古典真實分數模式 古典測驗理論基本假設: 實得分數=真實分數+誤差分數(測驗誤差愈小,實得分數愈接近真正分數)

ETX += 1. 真實分數:同一批學生在標準測驗情境下,接受相同的測驗或複本測驗

多次所得分數的平均數。 2. 誤差分數:是指測驗誤差,誤差是由隨機造成,亦即個人實得分數與其

真實分數的差,它可能是真正的、負的或零。因為測量誤差是隨機的,

所以理論上正負值會相互抵消而得到平均誤差為零。 命題重要性:

非系統誤差(Unsystematic Error) 1. 非系統誤差影響因素如受試者身心狀況(動機、意願、情緒、態度等),

測驗情境(噪音、溫度、明亮、座位安排等)和測驗試題(如取樣、難

度、計分、解釋等)。 2. 它是在隨機的、沒有規則和不可預測的方式下,隨著情境不同而影響測

驗分數。又稱為隨機誤差、機會誤差、機誤。 命題重要性:

Page 6: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-6 psychological test

系統誤差(Systematic Error) 一個人接受同一測量工具測量多次、多次測量結果間差異,其原因是某些

規則性變異因素造成,它是在一種固定不變的,即在不同的情境中,對同一

位受試者的影響是一樣的,對所有的受試者在相同情境中的影響,也是一樣

的,此種誤差又稱為常誤(恆定誤差)(Constant Error)或偏誤(Biased)。系統

誤差影響因素主要原因有學生學習、訓練、疲勞、衰老、遺忘與成長等。 命題重要性:

再測信度(重測信度) 1. 指同一份測驗在不同時間針對相同學生前後重複測量二次,根據二次分

數所求得其相關係數,即稱再測信度係數,又稱穩定係數。 2. 再測信度基本假設測驗所測驗潛在特質,在短期間內不隨時間消逝而變

化。其誤差來源-來自不同時間下測量所造成誤差。適用動作技能測

驗、感官辨別測驗。 命題重要性:

複本信度 當同一種測驗有兩種以上的複本測驗時,可將此兩種複本分別實施於同一

群受試者,再根據此兩份測驗分數計算其相關係數,即得複本信度,又稱

等值係數(Coefficient of Equivalence)。一般複本信度依施測時間不同分成

複本同時信度與複本間隔信度,前者反應內容取樣誤差,後者反應內容取

樣誤差與時間誤差;其中複本間隔信度是估計信度中最嚴謹、最佳信度。 命題重要性:

內部一致性信度 一般測驗測量信度均需對受試者實施二次測驗,不僅增加編製的負擔,同

時受試者合作意願降低、動機減少、疲勞與厭煩增加,均會影響施測的品

質。因此學者嘗試一次施測產生正確估計信度結果,會較受歡迎;此方法

包括:(1)折半方法;(2)庫李方法;(3)α係數;(4)霍意特變異數分析法。 命題重要性:

Page 7: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-7 psychological test

折半信度(Split-half Reliability) 折半方法採用單獨一次測驗結果,利用隨機方式將試題分成二半,求二半

分數的相關,稱折半相關或內部一致性係數 (Coefficient of Internal Consistecny),反應測量試題取樣誤差,因為為半份測驗,必須進行斯布

校正公式。 命題重要性:

庫李方法(K-R 方法) 1. 係由庫德(G. F. Kuder)和李查遜(M. W. Richardson)於 1937 年在「心理計

量期刊」發表「測驗信度估計理論」,設計一種估計測驗項內部的一致

性信度的方法。僅適用答案將二分計分測驗。 2. 也只需實施一次測驗即可,不必將測驗試題區分成二半,依據受試者對

所有題目反應。分析題目之一致性,此題目間一致性量數的高低受到兩

種誤差變異量的影響。一為內容取樣,一為所取樣之行為領域的異質

性,異質性愈低,則題目間之一致性也就愈高。 命題重要性:

α係數方法 克朗巴賀(Cronbach)在 1951 年在「心理統計學報」發表「測驗的α和內在

結構」,當測驗採用多重記分方式,如態度量表李克特式量表(「非常同意」

5 分,「同意」4 分,「無意見」3 分,「不同意」2 分,「非常不同意」1 分)、

個別智力測驗的加權計分、行為評定量表,皆採用α係數方法。簡稱阿爾

發係數(Coefficient Alpha)。反應內容取樣誤差與內容異質性誤差,大多數

心理態度量表均使用 係數估計信度。

)S

S1(

1nn

2x

2i∑−

−=α n:題數

2iS :每一題目分數的變異量

2xS :測驗總分的變異量

命題重要性:

Page 8: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-8 psychological test

評分者信度

係指從測驗卷中隨機抽取一些樣本,由不同的評分者或同一個評分者在不

同的時間,對每一份試券評分,在測驗過程中觀察、記錄、評分、計分等

各方面相互間的一致性而言,然後根據每份測驗卷評分的兩個分數計算其

相關係數,即得評分者信度。評分者信度愈高,表示評分者間評分愈一致。

適用主觀測驗、申論題、投射測驗、舞蹈技巧評分等。

命題重要性:

測量標準誤(Standard Error of Measurement)

用以估計受試者測驗之真實分數所在範圍的誤差單位與分數穩定性的信

度。在標準情境下,使用相同測驗或複本測驗測量一個受試者許多次,其

所得分數的平均數即為個人的真實分數一般來說,會以受試者的真實分數

為中心形成常態分配。而每次測驗實得分數與真實分數的差,稱為測量誤

差,測量誤差分配之標準差即為測驗標準誤,又稱為分數的標準誤差。

XXXmeas r1SSE −=

命題重要性:

差異標準誤(Standard error of difference)

當同一人在前後二次測驗比較,同一人在同一測驗之不同分測驗比較或不

同的人在同一測驗比較,用以判斷上述情況測驗分數的差異,是否達統計

顯著水準,就需使用差異標準誤( diffSE )。

近代教育測驗領域中,多用多項分測驗分數表示測驗分數結果,如性向測

驗得到語文推理性向分數 60,數學性向分數 68 二者相差 8 分,是否可以

說明數學優於語文,就可以使用差異標準誤加以比較。

YYXX2

Ymeas2

Xmeasdiff rr2SSESESE −−=+= ..

命題重要性:

Page 9: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-9 psychological test

效度意義 1. 效度(Validity)測驗分數的正確性,指測驗分數能夠代表測量到想到測量

之潛在特質的程度。亦即效度為有多好的程度。使用目的有效性;測驗

能達到某種目的程度。 2. 從教育決定的角度,效度是指一個測驗能夠提供適切的資料以做決定的

程度。效度種類分內容效度、效標關聯效度與建構效度。

公式 2X

2e

2X

2SP

2X

20C

SS

SS1

SSVaL −−==

命題重要性:

內容關聯效度(Content-related Validity) 1. 抽樣測驗試題樣本內容是否具有與「教學目標」或「教材內容」的代表

性或適切性。因此教材內容與教學目標即是確定內容效度的二種重要因

素。最適合使用成就測驗。 2. 內容效度無數量表示方法(亦即無須進行統計分析),一般都聘請課程

專家或審題小組依據雙向細目表來進行,又稱為邏輯效度、專家效度、

取樣效度、課程效度。 命題重要性:

建構關聯效度(Construct-related Validity) 1. 指測驗能測量理論的概念或特質的程度,換言之指測驗分數能夠依據某

種心理學的理論構念加以解釋的程度,凡用心理學的概念來分析測驗分

數的意義皆為建構效度。(郭生玉,民 95) 2. 根據社會學與心理學所建構出來描述某種特質的理論,並對測驗分數所

做的分析與解釋,例如同理心、愛、焦慮、動機。(余民寧,民 95) 命題重要性:

Page 10: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-10 psychological test

雙向細目表 學者 Tyler 於 1950 年提出,將教學內容與教學目標分為橫縱二列,詳細列

出各單元教學內容比重及不同能力層次的重要順序。可提供教師在編製試

題藍本的參考依據,亦可供選擇現成測驗。運用上包含檢核功能、計劃功

能、教學輔導功能。 命題重要性:

基準比率 v.s.選擇比率 基準比率(Base Rate)指在應徵者母群體中,將來工作成功的百分比。基準

比率愈接近 0.5,測驗的預測愈正確。選擇比率指應徵者被選擇出來的百

分比,其值愈低表資料愈有價值;選擇比率越低則測驗決斷分數愈高。 命題重要性:

表面效度(Face Validity) 指測驗給人第一印象好像在測量何種特質指標,而不是指實際上能測量到

什麼特質。表面效度存在有時可以激發受試者認真作答與親切感,表現出

樂意接受測量意願。通常一份教育測驗,如有適切的內容效度,也會有良

好的表面效度;反之,光具有表面效度,並不一定有適切的內容效度。 命題重要性:

效標關聯效度(Criterion-related Validity) 1. 效標關聯效度是用經驗性(實證分析)方法,研究測驗分數與外在效標

關係,探討效度類推性(某個情境結論能夠推論或應用其他情境證據)

又稱實證效度、經驗效度或統計效度;測驗成績對目前或未來某一行為

表現預測力高低。效標關聯效度分為同時效度與預測效度二種,主要的

區別方式在測驗使用目的不同與外在效標取得時間的不同。(郭生玉,

民 95)外在效標,指測驗所要預測受試者某些行為或表現的標準,如學

業成就、評定成績、實際工作表現。

2. 測驗結果分數與外在效標相關愈高,表示效標效度愈高,亦即測驗分數能

有效預測外在效標,亦即選取效標時最重要考量為預測力。(郭生玉,民 95) 命題重要性:

Page 11: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-11 psychological test

預測效度 1. 指測驗分數與外在效標取得,在相隔一段時間,測驗分數取得在前,而

外在效標取得實施驗一段時間後,計算此一種資料的相關係數即為預測

效度。目的在使用測驗分數預測個人在效標方向未來表現。 2. 預測效度對於人員選擇與分數測驗最為合適。如性向測驗、智力測驗與

人格測驗都需採用預測效度,因為三者皆被用來預測未來學習的成就或

工作的成績。 預測效度與同時效度異同點:

同時效度 預測效度

同處

(1)皆為效標關聯效度。 (2)皆為研究測驗分數與外在效標的關係。 (3)同一測驗可一起使用同時效度與預測效度。

(1)時間:同時進行測驗與效標收集

同時進行。 (2)評估目前情形。

(1)測驗與效標收集不同時進行。在測驗

實施後一段時間,在收集效標。 (2)預測未來的行為。

命題重要性:

效標混淆(Criterion Contamination) 良好效標避免偏差與效標污染(Contamination)即教師在評定受試者時,會

受到其他因素影響,如主觀意識、種族、性別、偏見,以致降低效標效度;

避免偏差與效標污染最好使參予效標評定人員,都不知道受試者的測驗分

數。效標混淆發生在效標關聯效度如同時效度與預測效度。

命題重要性:

因素分析法(Factor Analysis) 1. 驗證建構效度最常用的統計分析方法。將為數眾多依變項濃縮為幾個精

簡變項,是一種化繁為簡、執簡御繁統計技術。 2. 目的在心理學與社會學存在某些潛在特質,藉由共同因素的發現,確定這

些潛在特質由那些有效的測量試題所構成,為一種多變項的統計分析。 命題重要性:

Page 12: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-12 psychological test

多項特質─多項方法分析 學者 Campbell 與 Fiske 在 1959 年提出一份良好的構念效度,須符合下列

二條件: 1. 聚斂效度(輻合性效度)(Convergent Validity)

一份測驗分數必須和相同概念或潛在特質與其他測驗的分數間存在高

相關。如美勞性向測驗的分數與在校美勞科目成績有高相關,即為聚斂

效度。 2. 區別效度(辨別效度)(Idscriminate Validity)

一份測驗分數必須和不同概念或潛在特質與其他測驗的分數間存在低

相關。如美勞性向測驗分數與在校閱讀理解測驗成績有低相關甚至零相

關,即為區別分析。 3. 採用多項特質─多項方法分析,基本條件需有二種以上測驗方法(很大

差異),去測量二種以上的特質,其所測驗特質均相同。 命題重要性:

發展性常模 將受試者的測驗分數,在不同發展階段中比較其他個體獲得發展水準,此

一分數稱之發展性常模;「發展」是指身心隨著時間而改變的歷程。用來

說明個體在正常發展歷程中成熟水準,對個人做臨床研究具有價值,但此

種常模較為粗略,不易正確統計處理。發展性常模分為年級常模與年齡常

模二種。 命題重要性:

百分等級(Percentile Ranks) 表示一個人的分數在某一團體中所占的地位,亦即團體中按某一屬性依序

排列且分成一百個等級情況下,某一個人分數能勝過多少個百分等級,以

PR 表示。例如:某一個人得分 70 分,在團體中 100 人勝過 80 人,則表

示 PR=80,P80=70(原始分數 70 分便相當於第 80 個百分位數)。百分等級

為次序變項。例如某入學測驗一年實施兩次,如要將兩次測驗的原始分數

加以等化(Equating),則有百分等級常模資料就可完成此項工作。 命題重要性:

Page 13: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-13 psychological test

安置性評量(Placement evaluation)

單元或課程教學前便先實施,以用來決定班級教學起點,瞭解學生程度是

否已達教學計畫中所欲達成的學習結果程度與具備基本條件,決定使用何

種教材與教法,確定學生精熟程度,評量功能在編班分組。依測驗時間區

分安置性評量為教學前進行評量。教育局推動地區性「國中小學課程銜接

專業對談計畫」,其目的在了解學生起點行為,以作為教學設計活動參考,

稱為安置診斷性評量。國民中小學為了編班的需要所實施的評量,是指前

置性評量。

命題重要性:

預備性評量(Preparative Evaluation)

瞭解學生是否有具備學習的基本知識與能力、背景,亦即瞭解學生的起點

行為(學生在學習某一新事物前以具有的行為),以做為教學具體依據。

通常指教師在本單元未進行前(教學前)之教學評量。依測驗時間區分預

備性評量為教學前進行評量。

命題重要性:

形成性評量(Formative Evaluation)

1. 教學進行過程每告一段落實施,用以評量學生某些章節學習結果精熟程

度與學習進步情形,用來提供教師和學生雙向訊息,以改進教學和學

習,確保學習朝教學目標前進。為了提供學生連續性的學習回饋與國小

低年級兒童體育成績以採用形成性評量為原則。

2. 測驗內容簡單獨特,評量重點在掌握學生在有限教材範圍內是否達「精

熟或非精熟」,以免累積學習困難,並作為教學修正或改進之處,屬於

「學習性測驗」。開放教育的課程是屬於過程模式,因此宜採用形成性

評量學習評量方式。

命題重要性:

Page 14: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-14 psychological test

診斷性評量(Diagnostic Evaluation) 教學過程中或教學後,評量學生學習困難之處,以作為補救教學依據。採

用分項分析或選題分析學生的反應,以確定學生學習困難地方。依測驗時

間區分診斷性評量為教學中進行評量。只適用少數學習成就低落或身心障

礙學生,日後進行補救教學。在教學過程中為診斷學生學習困難的原因,

以作為補救教學的參考,此時所做的評量為治療診斷性評量。 命題重要性:

總結性評量(Summative Evaluation) 教學若干單元或教學結束後實施,針對教學目標達成程度與學生學習成果

進行評量檢討,並用於評定等第、證明精熟教學目標或評鑑教學效果的課

堂測驗;實施測驗可使用標準化成就測驗或教師自編成就測驗皆可,作為

評鑑課程目標、教學方法、課程改革成效的參考資料。國民中學畢業考試、

高普考試、學校期末考均為總結性評量。

命題重要性:

常模(Norm) 1. 常模(norm)解釋測驗分數的依據,指特定參照團體在測驗上所得到的平

均數,因此有時常模會等於平均數。 2. 原始分數本身沒有意義,將原始分數轉換為衍生分數(Derived Score)參

照測驗常模表,以了解個人的測驗分數在團體中相對地位。主要功能有

二:(1)表示受試者測驗分數在常模團體中的相對位置,以表個別間比

較(Interindividual Comparison)。(2)提供相同量數比較,以直接比較個人

在不同測驗的分數,以顯示個人內比較(Intraindividual Comparison)。 命題重要性:

標準分數 1. 表示某一測驗分數在團體平均數以上或以下多少個標準差;將原始分數

加以轉換成可以互相比較分數。當二變數欲比較大小、同時考量到不同

單位、不同平均水準與不同變異(離散)程度時,就可採用標準分數。係

Page 15: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-15 psychological test

以平均數為參照點,以標準差為單位的相對地位量數。台灣實施多年的

國中基本學力測驗,各科測驗分數報告採量尺分數,此種量尺分數最接

近「標準分數」統計概 。 2. 轉換方式有直線轉換,稱直線標準分數;非直線轉換,稱為常態化標準

分數。

定義公式 σµ−

=XZ

命題重要性:

年級常模(Grade Norm) 年級常模屬於發展性常模一種,係依據不同年級的標準化樣本,在測驗得

分的平均數而建立的常模。年級常模適用隨年級而逐漸增加的特質,如小

學階段各種基本技能學習(教育成就測驗),最適合採用年級常模。 命題重要性:

常態化標準分數 不同分配型態的分數若須直接比較,就必須將原始分數轉換成符合常態分

配的標準分數,此種分數稱常態化標準分數。非直線轉換,稱為常態化標

準分數,常用的常態化標準分數包括標準九分數(Stanine)、T 量表、C 量

表等。 命題重要性:

標準九分數(Stanine) 屬於常態化標準分數,美國空軍於世界第二次大戰時所創造出來的標準分

數。標準九係以每半個標準差為單位,將常態分配曲線的底邊分割成九等

分,最右邊(高分)為 9 分,最左邊(低分)為 1 分。優點:①漸為學者

所使用,尤其是性向測驗與成就測驗;②只有一個位數表示分數,易於電

腦資料處理;③容易被學生、家長、教師接受瞭解;④標準九是常態化標

準分數,可以比較不同測驗分數,也可做算術運算定義公式 Stanine = 2Z + 5。 命題重要性:

Page 16: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-16 psychological test

多元評量(變通式評量) 多元評量除認知評量(傳統紙筆測驗)尚須考量情意與技能評量,不同評

量範圍與學習目標,其評量工具亦應不同,因此使用評量也應是多元的,

多元評量是手段而非目的;多元評量適合「過程知識」 (Procedural Knowledge)的檢驗,較重視思考歷程評量、學生學習精熟進步情形。多元

評量只是一種通稱,又稱變通式評量(Alternative Assessment)、另類評量、

替代評量;包含內容有─實作評量、卷宗評量、真實評量、動態評量。在

學習評量的作法中,強調在真實的情境中,採取多元的方法同時評鑑學習

的過程與結果,且納入學生同儕的相互評鑑與自我評鑑,以對學生的學習

作整體的評量,稱為變通性評量(Alternative Assessment)。 命題重要性:

動態評量(Dynamic Assesment) 動態評量主要以認知學派為理論基礎,目的在瞭解學生認知改變情況,找

出個別學生最大發展區域或可能發展區(Zone of Proximal Development,ZPD),並協助學生發揮其最大潛能。俄國學者維格特斯基(Les S. Vygotsky)指出最大發展區,指學生本身能力達到水平與經教師、同學、其他人協助

後達到的水平之間差距稱之,教學內容應比學生既有的發展 高層次;如

果有位學生在經過與同學討論後,作業的完成度可達 80 分,而若獨立完

成作業只有 70 分,依據維高斯基的想法,這位學生的真正能力應該是 80分。又稱鷹架理論、學習潛能評量、最大發展區評量、中介評量、協助性

評量。 命題重要性:

實作評量

實作評量是指一項工作被執行與完成,即評定學生在工作項目中實際行為

表現,介於紙筆測驗與真實情境評量間,在模擬各種不同真實程度與直接

性的測驗情境中,提供教師一套系統評量學生實作表現方式。可以是實際

表現過程或表現後作品,或二者組合皆可,視實際表現領域的性質而定,

Page 17: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-17 psychological test

又稱表現評量。在學科領域內屬於技能部分的學習,例如美術創作、音樂

表現、戲劇表演、詩歌朗誦、體能狀況、科學實驗、教學解題、寫作、口

頭報告等之活動等方面,較適合用實作評量方式來檢測學習成效。

命題重要性:

卷宗評量(Portfolio Assessment)

學者 Paulson and Meyer 在 1991 年提出,卷宗的意義指有目的、系統地蒐

集學生長時間表現在某一領域或數個領域學習、努力與成就的作品及其他

相關紀錄等資料的彙整,以顯示學生學習成就與進步情形的評量。整個卷

宗作品蒐集選擇標準、評量標準,都讓學生全程參與,同時內容更包含了

學生自我反省的證據(王文中、吳毓瑩,民 88)。又稱檔案評量、學習歷程

檔案;卷宗評量結合教學與評量,重視學生學習過程與學生對學習自我反

省,是一種適用學生個別差異的評量方法。

命題重要性:

真實評量(Authentic Assessment)

強調真實情境的評量方式,此一真實情境指在未來情況發生下,可以自我

應用的情況,如學習外語能力是否在未來能與外國人交談、學習 CPR 急

救術在遇到危機情況是否能應用、學校採取闖關活動來評量學生的學習成

就;可以消除課堂中過於理想化教學與日常生活情境脫離。真實評量方式

如檔案評量、實作評量、口頭晤談;評量學習者的學習成就係直接去測量

學生在某一課程的實際操作的表現。真實評量為確保學生學習成就所提出

的評量方式(能確定學生學習過程是否真的學會學習內容)。

命題重要性:

缺點本位評量

教育評量測驗中大部份評量均為「缺點本位」(Deficit Base)評量內容,均

以發掘學生負面、缺陷與障礙角度進行評量。評量結果均致力於尋找學生

缺點錯了幾題、那裏學不會;而非對了幾題,哪些已學會。現今國內標準

Page 18: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-18 psychological test

智力測驗成為特殊教育主要評量工具,造成不同類型缺陷孩子,如感覺統

合失調、學習障礙、自閉症、肢障……,這些名稱均來自學生在測驗與量

表呈現缺點總和。 命題重要性:

標準本位評量 傳統教學評量只關切「標準答案」。除了方便老師評分閱卷標準,同學亦

照本宣科背標準答案,不僅扼殺了學生自發學習的興趣,同時凡事只求唯

一標準答案。 命題重要性:

虛假評量 傳統測驗評量內容,均以虛假的資或事件為命題題材,如國文採用古文言

文評估學生國文能力,數學問題也假設一些虛假的條件或情境。由於題材

虛假不實,讓學生無法與真實世界中情境結合,降低學習興趣、更難判斷

是否有效應用知識。 命題重要性:

生態評量(Ecological Assessment) 生態評量透過觀察與其他蒐集資料方式,直接針對個體在所屬各項環境

(家庭、學校及社區)中所表現出各種能力進行評量分析,以利教學目標

及內容設計的過程。此評量最終目的是教導個體適當的社會性行為,協助

個體社會化,以達到教育機會均等理想。(張世彗、藍瑋琛,民 92)例如高明

老師想要瞭解某一情緒障礙學生的情況,進行家庭與社區訪查、同儕訪談

與教室互動觀察記錄等,以蒐集資料來決定教學介入參考,即可利用生態

評量進行。 命題重要性:

Page 19: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-19 psychological test

試題分析(Item Analysis) 信度與效度是測驗二項最重要的特徵,二項特徵均須視試題品質優劣而定

而試題品質則可藉由試題分析而提高。試題分析包括:1.依試題內容與形

式做品質分析;2.依試題統計特性做數量分析。 1. 品質分析(Qualitative Analysis) 可由試題的內容效度審查、有效命題原則評鑑、教學目標進行邏輯的分

析(亦即符合編製測驗程序品質要求),即可達到目的。品質分析包括

以主觀經驗與個人專業素養,主觀地判斷題目數是否合理、文字表達是

否清晰、錯誤選項安排是否合適。 2. 量化分析(Quantitative Andlysis) 量化目的主要在分析每題試題是所具備三大統計特徵-難度

(Difficulty)、鑑別度(Discrimination)、誘答力(Distraction)。所有心理測

驗中所有試題必須經質與量二方面分析,才能顯現其特性與有效程度高

低,據此修改或刪除試題,則試題才是一套可靠有效測驗。 命題重要性:

難度分析 計算全體受試者答對每個試題的人數佔全體總人數的百分比值,這個百分

比值稱為「難度指標(數)」(Item Difficulty Index);難度指數用來探討題

目難易程度,難度指數愈大表示答對人數愈多,題目愈簡單。

公式NRP = 或

2PPP LH +

=

命題重要性:

鑑別力分析 鑑別力分析的目的,主要在瞭解試題是否具備區別學生能力高低的作用。

某個試題鑑別度愈高,表示能明確分辨學生答對與答錯功能很強,亦即高

分組會傾向答對,低分組會傾向答錯,試題具備此種辨別作用,即為「試

題鑑別度」。一個優良的測驗試題,具有較高鑑別度。 公式 LH PPD −=

命題重要性:

Page 20: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-20 psychological test

學生問題表(Student-problem Score Table) 1. 簡稱 S-P 表,是一種將學生在試題上的作答反應情形予以「圖形化」分

析的方法,其目的在獲得每位學生的學習診斷資料,以提供教師教學後

實施有效的學習輔導之參考。

2. S-P 表關心主題,即是在分析每位學生及每個試題的作答反應組型的注

意係數,以及整份測驗的差異係數和同質性係數,這些指標都是用來協

助教師診斷學生表現、測驗品質、及教學效果的有效工具,以作為改進

教學、命題與輔導學生之參考。

命題重要性:

差異係數(Disparity Index) 在實際情境測量中完美量尺的反應組型,並不會出現,而不完美量尺反應

組型反而較常見,在 S 曲線與 P 曲線的分離程度,可以用一個量化指標,

即為差異係數。差異係數即指二曲線間分離面積,佔隨機情況下之 S-P 曲

線所圍成部份之面積期望值比值,用 *D 表示。

命題重要性:

創造力測驗 學者吉爾福德(Guilford)提倡智能結構論,區分為聚斂思考(Convergent

Thinking)與擴散思考(Divergent Thinking)二種論點。其中聚斂思考指思考

有方向性與範圍,可由已知知識或傳統方法獲致結果,問題只有一個最佳

答案,傳統智力測驗即為此種思考方法;而擴散思考無一定準則方向與範

圍,當事者對思考問題,可以天馬行空與標新立異,從已知去尋找未知結

果,問題並無最佳答案或有許多答案,創造思考測驗,即為此思考方式。

(郭生玉,民國 88) 命題重要性:

Page 21: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-21 psychological test

注意係數(Caution Index) 係用來判斷學生或試題的反應組型是否有異常現象的一種指標,其可分為

兩種:一為學生的注意係數(Caution Index of Student,簡稱學生注意係數

(C.S);二為試題注意係數(C.P.)。

試題注意係數(C.P)=差異完美反應組型」的最大「實際反應組型」與「

完美反應組型」間差異「實際反應組型」與「

命題重要性:

環境智力(Contextual Intelligence) 又稱肆應能力(Contextual intelligence)(實用性智力)指能針對環境變化而

能快速適應環境能力。肆應智力包括三種智能: 1. 適應環境能力:指個體能儘速適應新環境變化的能力。 2. 改變環境能力:指在必要情況改變環境以適合個人需求的能力。 3. 選擇能力:指個體在數個解決方案選擇最有利的方式之能力。 命題重要性:

多元智力(Multiple Intelligence) 美國心理學家葛敦納(Gardner)在西元 1983 年提倡「智力多元論」(Theory of Multiple Intelligence),強化個體認知的跨文化觀點對人類智慧概念提出革

新實用性定義,並放棄傳統以標準化測驗得分定義人類智力。語文智力、

數理智力、空間智力、音樂智力、體能智力、社交智力、自知智力、自然

觀察智力。 命題重要性:

魏氏兒童智力量表第三版(WISC-Ⅲ)

魏氏兒童智力量表第三版是國內現有重要的智力測驗的工具之一,其測驗

結果可做為 6 至 16 歲兒童智力鑑定與進一步診斷分析應用。WISC-Ⅲ優

點在原作者 Wechsler 完整智力理論架構,嚴謹試題編製過程,良好測驗信

度與效度,世界公認優良品質,惟 WISC-Ⅲ施測過程時間過長。 命題重要性:

Page 22: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-22 psychological test

電腦適性測驗

「電腦適性測驗」係結合項目反應理論、適性測驗、電腦科技而形成的智

慧型電腦測驗,其特點在針對不同能力考生能適時適地出現合適考生題

目,根據考生能力高低決定,每個試題對考生能力均有估計功能,不需大

量試題即可在短時間精確測得考生能力,達到「因才施測」理想境界,簡

稱「合身測驗」或「適性測驗」。

命題重要性:

反應心向(Response set)

依照某種習慣性的反應型態,對測驗試題作一致性傾向的反應行為,相同

題目以不同方式出現。例如:「社會期許」會依社會所期許或文化認同的

方向作答,而不是受試者實際情況評量的反應傾向,猜測,重速度、輕正

確,重正確、輕速度均為反應心向類型。反應心向類型包括:(周文欽,

民 88)(1)猶豫性(Indecisiveness)(2)隨機反應性(Random Responding)(3)默從

性(Acquiescence)(4)社會期許(Social Desirability)。

命題重要性:

評定量表(Rating Scale)

評定量表包括一組用來作為判斷依據的特徵或特質,以及能指出被觀察者

在每種屬性不同程度的量表,評定所觀察行為或特質的品質,而非如檢核

表記錄行為或特質是否出現;評定量表亦須依照所預期的學習結果編製,

而且使用範圍限制於能夠充分機會用來觀察的學科,包含二部分:評定行

為或特質、表示行為或特質程度量表。常用評定量表有三種:1.數字評定量

表 2.圖示評定量表 3.敘述的圖示量表。

命題重要性:

項目檢核表(Checklist)

欲評定學生的技能優劣,最直接的量化方法為檢核表;列出欲測量受試者

行為或特質,依據實際觀察的結果,記錄情況發生與否,最適合用於評定

Page 23: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-23 psychological test

那些能細分成一系列明確且具體的動作技能;教師在觀察學生行為表現

時,先針對各 學生行為特質進行文字描述,觀察時,針對學生此ㄧ特質

的表現情形,勾選「有」或「無」的方式。其功能可用於程序的評鑑、評

鑑作品好壞工具、可用來記錄學生成長狀況。

命題重要性:

社會計量法(Soaiometry)

社會計量法是研究團體結構的一種技術,亦即評估學生在班上被接受或排

斥關係的程度。測量程序十分簡易,要求學生選擇從事某項學習活動時同

伴。其方法有社會矩陣、社會關係圖、猜是誰技術三種。

命題重要性:

月暈效應

教師根據單一特徵對某位學生整體印象,教師與學生經常相處,對學生瞭

解會產生一般性印象,針對學生的實際表現進行評分即成系統性評分誤

差;很容易產生先入為主,以偏概全的評分偏見。如學生性別、容貌、身

份地位或族群意識的影響。

命題重要性:

明尼蘇答多項人格量表 (Minnesota Multiphase Personality Inventory; 簡寫 MMPI)

明尼蘇答大學學者 Hathaway 與 Mckinely 在 1943 年編製,用途在測量心

理變態精神疾病而設計,後來亦成為正常人使用量表;屬於自陳量表中經

驗效標記分法。其中 8 個量表題目的選擇係依據能區別精神病患與正常人

標準。此量表分為個別實施與團體實施二類;個別實施量表將題目印在卡

片上,學生依三種反應「是」、「否」、「不一定」回答;團體實施量表則將

題目印在試題本上,使用答案紙回答。

命題重要性:

Page 24: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-24 psychological test

自陳量表(Self-report Inventories) 自陳量表提供一組測驗問題與刺激,然後要求受試者依個人感受、思考、

行為反應作答,假設前提是個人自願且正確誠實回答自己感受。計分比較

客觀,且施行手續方便,在人格測驗中應用最廣。自陳量表方法有四種:

(1)內容效度法;(2)經驗效標記分法;(3)因素分析法;(4)人格理論法。 命題重要性:

Q 技術意義 學者史帝芬森(Stephenson)在西元 1953 年創用,評量者提供大量文字敘述

句卡片,需求受試者依自己喜好、重要同意程度,將卡片做若干等級分類,

卡片約在 60~90 張之間等級約 9~11 等級。每個等級可依常態分配次數或

標準九(分成九等份)比例安排,要求受試者依比率放置卡片。 命題重要性:

投射技術 郭生玉(民 95)認為「投射技術提供一些意義模糊不清的刺激,讓受試者

自由聯想反應。受試者常在無防備下,將其內心情感、態度、需要、價值、

情緒、動機或人格特質投影到反應之中。如果刺激愈模糊或毫無結構,受

試者愈能表達其真實的情感。」投射技術種類包括聯想技術、完成技術、

編造技術、表現技術。 命題重要性:

態度量表 態度(Attitude)個人對某人或某事物持有的一種具有持久性,而一致性的行

為傾向;換言之,指個人對某種事物、情境、機關、或其他人積極與消極

反應傾向。量表(Scales)乃在分派受試者、物體或行為數值,旨在測量素質、

量化,並非探討分數多寡優劣,如評量個人擁有興趣、特徵程度,如喜歡

或不喜歡。態度量表編製分成四種:(1)塞士通等距量表;(2)李克特總加量

表;(3)戈特曼累積量表;(4)語意區分量。 命題重要性:

Page 25: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-25 psychological test

主題統覺測驗(Thematic Apperception Test, TAT) 投射測驗中編造技術,美國哈佛大學診療中心心理專家 Murray 在 1938 年

創用,全套共 30 張內容曖昧圖片與一張空白卡片,內容多為人物與景物

畫。TAT 刺激比文字聯想結構性還低,但比羅夏墨漬測驗高,基本上需較

複雜、組織化有意義的語文反應。主試者要求受試者依圖片內容編造故

事,受試者常會不自覺融入個人內心衝突與慾望穿插在編造故事中,主試

者藉此分析故事中情節與主角扮演了解個人心理需要。 命題重要性:

猜是誰技術(Guess Who Techrique) 「猜是誰技術」屬於社會計量法之一,是提名技術運用,呈現一系列各種

行為特質的描述句,找出學生符合該項特質的同學,鼓勵同學可提名多

人。描述特質內容可以是正向或負向行為。 命題重要性:

李克式量表(Likert Scale) 學者 Likert 在西元 1932 年提出,是一種測量受試者態度,它的方式是讓

受試者接受一系列陳述句表現的內容,受試者只能依據 5 點量表作答,即

“非常贊成”、“贊成”、“普通”、“不贊成”、“非常不贊成”等五

類選項中,回答出最適合受試對陳述句同意程度。是一種普通簡單使用的

情意測量。 命題重要性:

興趣 興趣個人能全神投入某一活動的內在傾向,個體發自內心對其所喜歡對

象、目標、技術、知識或其他活動,投注更多心力與時間從事,從中獲得

滿足,即為個人興趣動力驅使。(郭生玉,民 95) 命題重要性:

Page 26: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-26 psychological test

等距量表法 學者塞士通(Thurstone)在 1929 年「態度測量」(The Measurement of Attitude)首先提出,此量表包含許多項目與句子,項目的數值或在量表中位置,事

先由一群評判者決定等級排列,評判者不需表達自己態度;以代表對團

體、制度、觀念或實際特殊問題喜愛或不喜愛程度題目,分配特定量表值

的方法。適用意見不太分歧或主題較明確清楚時使用,如愛國主義、宗教、

音樂、種族、科學等議題。 命題重要性:

項目反應理論(IRT) 項目反應理論(Item Response Theory),指受試者面對試題進行作答的反

應。受試者接受一組測驗施測後,項目反應理論即能反應隱藏在受試者內

真實能力,也即為當初測驗設計者所想要測量之特質與能力。因此 IRT 有

二個基本假設:1.受試者在測驗項目的表現可由一組能力作預測與解釋;

2.受試者在測驗項目的表現與隱藏在受試者內真實能力關係可以用一個單

調增函數描述(即項目特性函數 Item Characteristic Curve,簡稱 I.C.C);ICC 曲線表示,當能力水準θ 增加時,其反應出回答正確的機率也將增加。

又稱試題反應理論。 命題重要性:

測驗等化 測驗等化為 IRT 應用時用途,分為:(1)真分數等化;(2)判斷二測驗是否

等值。 1. 真分數等化 甲生進行 A 測驗後,甲生答對每題的機率相加即為甲生在 A 測驗的真

分數,如圖 A 測驗真分數 6 約等於 B 測驗真分數 5.5,如此作答不同測

驗之考生也可互相比較其能力。 2. 判斷二測驗是否等值 IRT 亦可比較二份測驗訊息是否等值的好方法,如果二份測驗的訊息曲

線相似或一致,又若題數一樣,即可說二測驗等值。 命題重要性:

Page 27: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-27 psychological test

文化公平測驗(Culture-fair Intelligence Test)

許多的文化差異因素,會影響智力測驗的結果,如語言、競爭、速度測驗

經驗、測驗態度、學習知識和技能的機會等因素。智力的文化公平測驗

(Culture-fair Test of Intelligence)其目的就在消除或降低這些差異因素造成

的影響,因此大都以圖形方式命題。 命題重要性:

上限年齡(Ceiling Age) 葛樹人(民 88)指出,上限年齡為受試者在該年齡層所有測驗題目中作答

完全錯誤,它代表受測者在量表上所可能得分的上限水準,若繼續施測此

上限水準之上的題目,對受測者而言題目會較難,進行施測則無意義,施

測之進行應於此停止。 命題重要性:

教育商數(Educational Quotient) 教育商數(EQ)與比率智商(IQ)性質相同,均為「比率商數」,即教育年齡(EA)除以實際生理年齡(CA),再乘以 100。教育商數可以因學校不同成就測驗而

加以應用,如「語文商數」、「數學商數」等。

公式:EQ =CAEA

×100%

命題重要性:

客觀性(Objectivity) 所謂客觀性指測驗過程中採用程序、評分與解釋,均不受個人主觀因素影

響,如觀察與測量的結果,多位施測者採用相同程序得到相同結果,則表

示測驗結果具有客觀性。唯有測驗過程具有客觀性,不同施測者在進行相

同測驗,才能得到相同結果,其測驗結果必較為可信。心理測驗可由難度

與鑑別度作客觀釐定。 命題重要性:

Page 28: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-28 psychological test

側面圖(Profile) 側面圖使用圖表方式來表示個人內(最大用途)或團體間的施測結果,亦

為分數常模一種;欲比較個人在各項分測驗分數高低也可使用。而側面圖

分析就是使用相同量表單位、相同常模樣本來同時建立數個分測驗常模,

以便個人在數個分測驗轉換分數比較。適用類型測驗:凡測驗中包含若干

分測驗都適合採用側面圖解釋分數。如多元性向測驗、綜合成就測驗、人

格測驗與興趣測驗。 命題重要性:

測驗偏差(Test Bias) 余民寧(民 95)指出測驗偏差(Test Bias)亦即試題偏差(Differential Item Functioning)來自測驗編製過程、實施、解釋造成不公平性的測驗。 1. 試題偏差包括

①測驗編製者僅以多數族群的團體為考慮施測對象,造成編題時偏向以

多數族群特有文化、生活經驗、文化特色、風俗習慣為預擬的假想對象,

造成不利其他族群的受試結果;②抽樣過程抽取不具代表性樣本,造成

某些不同族群的能力或潛在特質測量不利或不公平,間接使測驗產生偏

差的推論和預測結果;③不同族群對測驗本身即產生不同反應結果的差

異現象,因此測驗所產生差異便反應試題本身具有不同的測量功能。 2. 試題偏差種類包括:①文化、種族、語言測驗偏差;②社經地位測驗偏

差;③性別測驗偏差;④明星學校測驗偏差。 3. 克服測驗偏差運用策略包括:①針對不同族群使用不同測驗;②發展不

同的外在效標;③改進篩選管道;④改變社會環境。 【本文摘自:余民寧(民 95)。教育測驗與評量─成就測驗與教學評量

(三版)。臺北:心理。】 命題重要性:

Page 29: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-29 psychological test

案頭測驗(In-basket Test) 美國教育測驗服務社(ETS)在 1952 年接受美國空軍委託,研發案頭測驗作

為研究評估教育訓練成效方法,包括成員領導能力、人員甄選、處理教學

或行政問題能力。案頭測驗為情境演練一種方式,將實際工作情境的化為

問題,由參與人員實際操作,培養其實際與應用能力,著重學習執行過程

實作能力;案頭測驗包括說明資料、演練問題與回饋三部分。 命題重要性:

班達完形測驗(Bender-Gestalt Test) 班達完形測驗測驗目的旨在測量兒童知覺動作的發展水準,並推測知覺功

能的損傷程度,及供評量情緒困擾、態度反應之用。測驗來源本測驗係修

訂自 Lauretta Bender 所編製的知動完形測驗(Visual-motor Gestalt Test);測

驗內容包括九張圖片,測驗時依序每次提出一張圖片,令受試者抄畫在十

六開大的空白紙上;適用範圍五歲至十歲半兒童。 命題重要性:

概念構圖(Concept Mapping) J. Novak (1991)根據 Ausubel 的學習理論提出一套作為教學、學習、研究及

評量工具,該方法即概念構圖;概念構圖在單一概念與該概念在語意脈絡

的意義兩向度,使用命題形式概念圖,來表徵所學習與教學的概念與概念

間階層連結關係,並以此作為評量與研究學生概念結構的圖示技術。概念

構圖的內涵包括概念、階層、連結線、連結語、交叉連結線及兩個概念組

成意義命題。 【95 政治大學教研所】 命題重要性:

電子化檔案評量(E-portfolio Assessment) 段曉林(民 92)其主要是透過與現代資訊科技的整合,將傳統歷程檔案配

合數位工具的轉換與儲存,將學習檔案數位化(Lankes,1995)。如學生將

學習活動單或學習日誌建立於個人的網頁中,教師與學生藉此可以進行教

學的互動。電子化歷程檔案較傳統的學習檔案更具備了下列的應用特性

Page 30: 解釋名詞 - tingmao.com.t · Ö ) ß 解-3 psychological test 難度測驗(Power Test) 測量受試者解決問題的能力,題目難度排列由易至難,通常沒有時間限

解-30 psychological test

(Barrett,1994):①解決檔案儲存空間的困境;②整合多樣性的媒體與資

料;③結合電腦網路的特性 【本文摘自:段曉林(民 92)。國中自然與生活科技領域實施電子化歷程

檔案之合作行動研究。教育部九十二年行動研究成果報告】 【95 政治大學教研所】

命題重要性:

知後同意(Informed Consent) 葛樹人(民 88)由道德觀點心理測驗的內容與題目是否侵犯受測者隱私

權,是測驗學者關注議題,若受試者自願在測驗中陳述自己思想、感覺或

個人事實,則不構成侵犯隱私權。基於此一原則,一般有關專業團體在其

心理工作人員的道德守則中皆主張心理測驗之進行必須以受測者知後同

意為前提方能施測。知後同意應包含四要件:①測驗應主動事先說明測驗

目的;②事先說明測驗所欲蒐集資料性質;③事先說明測驗結果如何使

用,及何人接觸此資料;④事先說明受試者有權拒絕作答任一試題。 【本文參考:葛樹人(民 90)。心理測驗學。臺北:桂冠。】

【95 新竹教育大學心諮所】

命題重要性:

交叉效度考驗(Cross-Validation) 考驗交叉效度需要兩個不同的獨立樣本,及對考驗樣本所訂下的一些效標

的測量。這種考驗要回答的問題是,如果在 A 樣本中發現某一些測題得分

之組合與效標的相關最大,那麼,在 B 樣本中是否這種關係也同樣會出

現。同樣地,在 B 樣本中最有效度的測題組合,在 A 樣本中是否也會出

現。請注意這個考驗程序的關鍵在於,首先在 A 樣本中找出與效標相關最

大的測題組合,然後再獨立地用 B 樣本去考驗這個組合是否同樣地與效標

有高相關。 【本文摘自:陳淑娟、楊中芳譯校(J.P. Robinson、P.R. Shaver&L.S. Wrightsman 著)(民 95)。性格與社會心理測量總覽(上)。臺北:遠流出

版公司】 【95 中山大學教研所】

命題重要性: