以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除...

68
國立臺中教育大學教育測驗統計研究所理學碩士論文 指導教授:郭伯臣 博士 施淑娟 博士 TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除法測驗編製 及分析 研究生:張素珍

Transcript of 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除...

Page 1: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

國立臺中教育大學教育測驗統計研究所理學碩士論文

指導教授郭伯臣 博士

施淑娟 博士

以 TIMSS 2007 數學評量架構中認知領

域進行國小六年級小數的除法測驗編製

及分析

研究生張素珍 撰

中 華 民 國 一 年 六 月

I

謝辭 時光荏苒轉眼間兩年的碩士班生活即將劃下句點一路走來經歷不

斷的學習成長過程雖辛苦卻也充實了知識和增加了思考能力

首先感謝指導教授郭伯臣博士和施淑娟博士的不棄及教導在百忙之中

不厭其煩的給予鼓勵與指正本篇論文才能順利地完成此外也一併感謝兩

位口詴委員吳慧珉老師和黃孝雲老師不辭辛勞地審查論文並給予寶貴的意

見使本論文內容能更臻完善

在職進修期間特別要感謝授課老師們的諄諄教導與體諒讓我學有所成

也感謝研究所的同學-品潔長蓀佩瑾和培真我們是最優的團隊大家共

同學習互相切磋和彼此勉勵一起度過既愛又累的碩士生活還要感謝所上

學長姐的協助尤其是佳樺學姊和智為學長的鼎力相助

最後要感謝父母先生靜旻和宗寰您們的體諒與付出讓我無後顧

之憂專心致力於學業有您們的支持與關懷才能順利完成學位

謹以此論文獻給所有關心和愛護我的人衷心地感謝您們

張素珍

中華民國一 00 年六月

II

摘要

近幾年來大型測驗的編製皆逐漸朝向高階層詴題反應的評量架構期能

測得學生較高階的能力值若使用適當的模式進行分析不但可以得到欲求得

的高階能力之估計值還能獲得較多的訊息量本研究根據 TIMSS 四年級的數

學評量架構編製六年級數學小數的除法測驗利用實證資料比較 HO-IRT

MIRT 和 UIRT 三種模式對學生小數除法的能力值估計是否有差異影響又如

何做為日後研究數學評量模式之參考

本研究測驗的結果顯示此份小數的除法測驗具有良好的信度(Cronbach α

係數值為 079)效度和鑑別度透過實證資料之分析在模式適配度(model

fit)AICBIC 和 DIC 三種指標值都顯示 HO-IRT 模式較適配於高階層詴題反

應之評量架構在 HO-IRT 模式中整體量尺(overall ability)-小數的除法能

力和領域量尺(domain ability)-知道應用推理間的迴歸係數皆在 08 以上

尤其是小數的除法能力在解釋應用和推理的能力時影響力最大HO-IRT 之完

整估計模式可以提供較多訊息且和其他兩種分開估計之模式都有相當高的

一致性

關鍵字高階層詴題反應理論小數的除法TIMSS

III

Abstract

In resent years for estimating studentsrsquo higher abilities the framework of

assessment graduallly turns into higher order item response theory (HO-IRT)

assessment framework Suitable modle not only tells us the higher ability estimates

wanted and gets the better estimation result By means of empirical study the main

purpose of the study is to compare if there is difference in mathematical ability

estimation by HO-IRTMIRT and UIRT and what their influences are as the reference

of mathematical assessment model The assessment on Decimal division is desinged

for six-grade students based on the mathematical assessment framwork of TIMSS for

four-grade

The reliability of the Cronbach Alpha coefficient value on the assessment is

079 The result is analyzed and compared by HO-IRT MIRT and UIRT models

According to the model fit indexes (AIC BIC and DIC) it shows that HO-IRT

model is suitable to large-scale standardized assessment framework In HO-IRT

pattern the coefficients of overall ability - the ability of Decimal division and

domain ability - knowing applying reasoning inference regression are higher than

08 especially the ability of Decimal division influences applying and reasoning

Therefore the result of the empiricla study confirms HO-IRT model can provide

more information and has the quite high uniformity as the other models

Keywords higher order item response theory decimal division TIMSS

IV

目 次 第一章 緒論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第一節 研究動機與目的helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第二節 名詞解釋helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第三節 研究限制helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第二章 文獻探討helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第一節 TIMSS 2007 數學評量架構helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第二節 小數的除法概念helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 14

第三節 詴題反應理論模式 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 20

第三章 研究方法helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第一節 研究設計helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第二節 研究流程helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 32

第三節 研究對象helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

第四節 研究工具helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

第四章 研究結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第一節 小數的除法測驗分析 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第二節 模式適配度指標的分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 38

第三節 整體量尺與領域量尺間的關係helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

第四節 HO-IRT 完整估計與 MIRT_UMIRT_C及

UIRT 分開估計之模式分析結果 helliphelliphelliphelliphelliphelliphelliphelliphelliphellip

40

第五章 結論與建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第一節 研究結論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第二節 研究建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 51

參考文獻helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

中文部份helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

英文部分helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 55

附錄 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

國小六年級數學小數的除法詴卷helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

V

表 目 次

表 2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時

間百分比helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 9

表 2-1-2 TIMSS 2007 四年級數學知道選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 12

表 2-1-3 TIMSS 2007 四年級數學知道非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-4 TIMSS 2007 四年級數學應用選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-5 TIMSS 2007 四年級數學應用非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-6 TIMSS 2007 四年級數學推理選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-7 TIMSS 2007 四年級數學推理非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 14

表 2-2-1 九年一貫課程綱要數學領域中小數教材之分析helliphelliphelliphelliphelliphellip 16

表 3-3-1 樣本人數來源表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

表 4-1-1 詴題之難度和鑑別度helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

表 4-2-1 各模式指標的分析結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-3-1 HO-IRT 迴歸參數()比較表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-4-1 各模式詴題難度參數比較表 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 41

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數helliphelliphelliphelliphelliphellip 42

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)helliphellip 42

表 4-4-4 MIRT_UMIRT_C和 HO-IRT 在三個領域量尺之相關係數

比較 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 44

VI

表 4-4-5 MIRT_UMIRT_C和 HO-IRT 在領域量尺的估計參數表(部

分) 45

表 4-4-6 MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之

分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 46

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 2: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

I

謝辭 時光荏苒轉眼間兩年的碩士班生活即將劃下句點一路走來經歷不

斷的學習成長過程雖辛苦卻也充實了知識和增加了思考能力

首先感謝指導教授郭伯臣博士和施淑娟博士的不棄及教導在百忙之中

不厭其煩的給予鼓勵與指正本篇論文才能順利地完成此外也一併感謝兩

位口詴委員吳慧珉老師和黃孝雲老師不辭辛勞地審查論文並給予寶貴的意

見使本論文內容能更臻完善

在職進修期間特別要感謝授課老師們的諄諄教導與體諒讓我學有所成

也感謝研究所的同學-品潔長蓀佩瑾和培真我們是最優的團隊大家共

同學習互相切磋和彼此勉勵一起度過既愛又累的碩士生活還要感謝所上

學長姐的協助尤其是佳樺學姊和智為學長的鼎力相助

最後要感謝父母先生靜旻和宗寰您們的體諒與付出讓我無後顧

之憂專心致力於學業有您們的支持與關懷才能順利完成學位

謹以此論文獻給所有關心和愛護我的人衷心地感謝您們

張素珍

中華民國一 00 年六月

II

摘要

近幾年來大型測驗的編製皆逐漸朝向高階層詴題反應的評量架構期能

測得學生較高階的能力值若使用適當的模式進行分析不但可以得到欲求得

的高階能力之估計值還能獲得較多的訊息量本研究根據 TIMSS 四年級的數

學評量架構編製六年級數學小數的除法測驗利用實證資料比較 HO-IRT

MIRT 和 UIRT 三種模式對學生小數除法的能力值估計是否有差異影響又如

何做為日後研究數學評量模式之參考

本研究測驗的結果顯示此份小數的除法測驗具有良好的信度(Cronbach α

係數值為 079)效度和鑑別度透過實證資料之分析在模式適配度(model

fit)AICBIC 和 DIC 三種指標值都顯示 HO-IRT 模式較適配於高階層詴題反

應之評量架構在 HO-IRT 模式中整體量尺(overall ability)-小數的除法能

力和領域量尺(domain ability)-知道應用推理間的迴歸係數皆在 08 以上

尤其是小數的除法能力在解釋應用和推理的能力時影響力最大HO-IRT 之完

整估計模式可以提供較多訊息且和其他兩種分開估計之模式都有相當高的

一致性

關鍵字高階層詴題反應理論小數的除法TIMSS

III

Abstract

In resent years for estimating studentsrsquo higher abilities the framework of

assessment graduallly turns into higher order item response theory (HO-IRT)

assessment framework Suitable modle not only tells us the higher ability estimates

wanted and gets the better estimation result By means of empirical study the main

purpose of the study is to compare if there is difference in mathematical ability

estimation by HO-IRTMIRT and UIRT and what their influences are as the reference

of mathematical assessment model The assessment on Decimal division is desinged

for six-grade students based on the mathematical assessment framwork of TIMSS for

four-grade

The reliability of the Cronbach Alpha coefficient value on the assessment is

079 The result is analyzed and compared by HO-IRT MIRT and UIRT models

According to the model fit indexes (AIC BIC and DIC) it shows that HO-IRT

model is suitable to large-scale standardized assessment framework In HO-IRT

pattern the coefficients of overall ability - the ability of Decimal division and

domain ability - knowing applying reasoning inference regression are higher than

08 especially the ability of Decimal division influences applying and reasoning

Therefore the result of the empiricla study confirms HO-IRT model can provide

more information and has the quite high uniformity as the other models

Keywords higher order item response theory decimal division TIMSS

IV

目 次 第一章 緒論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第一節 研究動機與目的helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第二節 名詞解釋helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第三節 研究限制helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第二章 文獻探討helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第一節 TIMSS 2007 數學評量架構helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第二節 小數的除法概念helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 14

第三節 詴題反應理論模式 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 20

第三章 研究方法helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第一節 研究設計helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第二節 研究流程helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 32

第三節 研究對象helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

第四節 研究工具helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

第四章 研究結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第一節 小數的除法測驗分析 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第二節 模式適配度指標的分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 38

第三節 整體量尺與領域量尺間的關係helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

第四節 HO-IRT 完整估計與 MIRT_UMIRT_C及

UIRT 分開估計之模式分析結果 helliphelliphelliphelliphelliphelliphelliphelliphelliphellip

40

第五章 結論與建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第一節 研究結論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第二節 研究建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 51

參考文獻helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

中文部份helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

英文部分helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 55

附錄 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

國小六年級數學小數的除法詴卷helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

V

表 目 次

表 2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時

間百分比helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 9

表 2-1-2 TIMSS 2007 四年級數學知道選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 12

表 2-1-3 TIMSS 2007 四年級數學知道非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-4 TIMSS 2007 四年級數學應用選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-5 TIMSS 2007 四年級數學應用非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-6 TIMSS 2007 四年級數學推理選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-7 TIMSS 2007 四年級數學推理非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 14

表 2-2-1 九年一貫課程綱要數學領域中小數教材之分析helliphelliphelliphelliphelliphellip 16

表 3-3-1 樣本人數來源表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

表 4-1-1 詴題之難度和鑑別度helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

表 4-2-1 各模式指標的分析結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-3-1 HO-IRT 迴歸參數()比較表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-4-1 各模式詴題難度參數比較表 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 41

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數helliphelliphelliphelliphelliphellip 42

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)helliphellip 42

表 4-4-4 MIRT_UMIRT_C和 HO-IRT 在三個領域量尺之相關係數

比較 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 44

VI

表 4-4-5 MIRT_UMIRT_C和 HO-IRT 在領域量尺的估計參數表(部

分) 45

表 4-4-6 MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之

分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 46

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 3: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

II

摘要

近幾年來大型測驗的編製皆逐漸朝向高階層詴題反應的評量架構期能

測得學生較高階的能力值若使用適當的模式進行分析不但可以得到欲求得

的高階能力之估計值還能獲得較多的訊息量本研究根據 TIMSS 四年級的數

學評量架構編製六年級數學小數的除法測驗利用實證資料比較 HO-IRT

MIRT 和 UIRT 三種模式對學生小數除法的能力值估計是否有差異影響又如

何做為日後研究數學評量模式之參考

本研究測驗的結果顯示此份小數的除法測驗具有良好的信度(Cronbach α

係數值為 079)效度和鑑別度透過實證資料之分析在模式適配度(model

fit)AICBIC 和 DIC 三種指標值都顯示 HO-IRT 模式較適配於高階層詴題反

應之評量架構在 HO-IRT 模式中整體量尺(overall ability)-小數的除法能

力和領域量尺(domain ability)-知道應用推理間的迴歸係數皆在 08 以上

尤其是小數的除法能力在解釋應用和推理的能力時影響力最大HO-IRT 之完

整估計模式可以提供較多訊息且和其他兩種分開估計之模式都有相當高的

一致性

關鍵字高階層詴題反應理論小數的除法TIMSS

III

Abstract

In resent years for estimating studentsrsquo higher abilities the framework of

assessment graduallly turns into higher order item response theory (HO-IRT)

assessment framework Suitable modle not only tells us the higher ability estimates

wanted and gets the better estimation result By means of empirical study the main

purpose of the study is to compare if there is difference in mathematical ability

estimation by HO-IRTMIRT and UIRT and what their influences are as the reference

of mathematical assessment model The assessment on Decimal division is desinged

for six-grade students based on the mathematical assessment framwork of TIMSS for

four-grade

The reliability of the Cronbach Alpha coefficient value on the assessment is

079 The result is analyzed and compared by HO-IRT MIRT and UIRT models

According to the model fit indexes (AIC BIC and DIC) it shows that HO-IRT

model is suitable to large-scale standardized assessment framework In HO-IRT

pattern the coefficients of overall ability - the ability of Decimal division and

domain ability - knowing applying reasoning inference regression are higher than

08 especially the ability of Decimal division influences applying and reasoning

Therefore the result of the empiricla study confirms HO-IRT model can provide

more information and has the quite high uniformity as the other models

Keywords higher order item response theory decimal division TIMSS

IV

目 次 第一章 緒論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第一節 研究動機與目的helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第二節 名詞解釋helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第三節 研究限制helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第二章 文獻探討helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第一節 TIMSS 2007 數學評量架構helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第二節 小數的除法概念helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 14

第三節 詴題反應理論模式 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 20

第三章 研究方法helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第一節 研究設計helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第二節 研究流程helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 32

第三節 研究對象helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

第四節 研究工具helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

第四章 研究結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第一節 小數的除法測驗分析 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第二節 模式適配度指標的分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 38

第三節 整體量尺與領域量尺間的關係helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

第四節 HO-IRT 完整估計與 MIRT_UMIRT_C及

UIRT 分開估計之模式分析結果 helliphelliphelliphelliphelliphelliphelliphelliphelliphellip

40

第五章 結論與建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第一節 研究結論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第二節 研究建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 51

參考文獻helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

中文部份helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

英文部分helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 55

附錄 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

國小六年級數學小數的除法詴卷helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

V

表 目 次

表 2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時

間百分比helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 9

表 2-1-2 TIMSS 2007 四年級數學知道選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 12

表 2-1-3 TIMSS 2007 四年級數學知道非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-4 TIMSS 2007 四年級數學應用選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-5 TIMSS 2007 四年級數學應用非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-6 TIMSS 2007 四年級數學推理選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-7 TIMSS 2007 四年級數學推理非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 14

表 2-2-1 九年一貫課程綱要數學領域中小數教材之分析helliphelliphelliphelliphelliphellip 16

表 3-3-1 樣本人數來源表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

表 4-1-1 詴題之難度和鑑別度helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

表 4-2-1 各模式指標的分析結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-3-1 HO-IRT 迴歸參數()比較表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-4-1 各模式詴題難度參數比較表 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 41

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數helliphelliphelliphelliphelliphellip 42

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)helliphellip 42

表 4-4-4 MIRT_UMIRT_C和 HO-IRT 在三個領域量尺之相關係數

比較 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 44

VI

表 4-4-5 MIRT_UMIRT_C和 HO-IRT 在領域量尺的估計參數表(部

分) 45

表 4-4-6 MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之

分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 46

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 4: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

III

Abstract

In resent years for estimating studentsrsquo higher abilities the framework of

assessment graduallly turns into higher order item response theory (HO-IRT)

assessment framework Suitable modle not only tells us the higher ability estimates

wanted and gets the better estimation result By means of empirical study the main

purpose of the study is to compare if there is difference in mathematical ability

estimation by HO-IRTMIRT and UIRT and what their influences are as the reference

of mathematical assessment model The assessment on Decimal division is desinged

for six-grade students based on the mathematical assessment framwork of TIMSS for

four-grade

The reliability of the Cronbach Alpha coefficient value on the assessment is

079 The result is analyzed and compared by HO-IRT MIRT and UIRT models

According to the model fit indexes (AIC BIC and DIC) it shows that HO-IRT

model is suitable to large-scale standardized assessment framework In HO-IRT

pattern the coefficients of overall ability - the ability of Decimal division and

domain ability - knowing applying reasoning inference regression are higher than

08 especially the ability of Decimal division influences applying and reasoning

Therefore the result of the empiricla study confirms HO-IRT model can provide

more information and has the quite high uniformity as the other models

Keywords higher order item response theory decimal division TIMSS

IV

目 次 第一章 緒論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第一節 研究動機與目的helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第二節 名詞解釋helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第三節 研究限制helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第二章 文獻探討helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第一節 TIMSS 2007 數學評量架構helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第二節 小數的除法概念helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 14

第三節 詴題反應理論模式 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 20

第三章 研究方法helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第一節 研究設計helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第二節 研究流程helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 32

第三節 研究對象helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

第四節 研究工具helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

第四章 研究結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第一節 小數的除法測驗分析 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第二節 模式適配度指標的分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 38

第三節 整體量尺與領域量尺間的關係helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

第四節 HO-IRT 完整估計與 MIRT_UMIRT_C及

UIRT 分開估計之模式分析結果 helliphelliphelliphelliphelliphelliphelliphelliphelliphellip

40

第五章 結論與建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第一節 研究結論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第二節 研究建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 51

參考文獻helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

中文部份helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

英文部分helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 55

附錄 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

國小六年級數學小數的除法詴卷helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

V

表 目 次

表 2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時

間百分比helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 9

表 2-1-2 TIMSS 2007 四年級數學知道選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 12

表 2-1-3 TIMSS 2007 四年級數學知道非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-4 TIMSS 2007 四年級數學應用選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-5 TIMSS 2007 四年級數學應用非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-6 TIMSS 2007 四年級數學推理選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-7 TIMSS 2007 四年級數學推理非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 14

表 2-2-1 九年一貫課程綱要數學領域中小數教材之分析helliphelliphelliphelliphelliphellip 16

表 3-3-1 樣本人數來源表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

表 4-1-1 詴題之難度和鑑別度helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

表 4-2-1 各模式指標的分析結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-3-1 HO-IRT 迴歸參數()比較表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-4-1 各模式詴題難度參數比較表 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 41

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數helliphelliphelliphelliphelliphellip 42

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)helliphellip 42

表 4-4-4 MIRT_UMIRT_C和 HO-IRT 在三個領域量尺之相關係數

比較 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 44

VI

表 4-4-5 MIRT_UMIRT_C和 HO-IRT 在領域量尺的估計參數表(部

分) 45

表 4-4-6 MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之

分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 46

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 5: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

IV

目 次 第一章 緒論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第一節 研究動機與目的helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 1

第二節 名詞解釋helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第三節 研究限制helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 5

第二章 文獻探討helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第一節 TIMSS 2007 數學評量架構helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 7

第二節 小數的除法概念helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 14

第三節 詴題反應理論模式 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 20

第三章 研究方法helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第一節 研究設計helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 28

第二節 研究流程helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 32

第三節 研究對象helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

第四節 研究工具helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

第四章 研究結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第一節 小數的除法測驗分析 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

第二節 模式適配度指標的分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 38

第三節 整體量尺與領域量尺間的關係helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

第四節 HO-IRT 完整估計與 MIRT_UMIRT_C及

UIRT 分開估計之模式分析結果 helliphelliphelliphelliphelliphelliphelliphelliphelliphellip

40

第五章 結論與建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第一節 研究結論helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 50

第二節 研究建議helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 51

參考文獻helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

中文部份helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 52

英文部分helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 55

附錄 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

國小六年級數學小數的除法詴卷helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 58

V

表 目 次

表 2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時

間百分比helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 9

表 2-1-2 TIMSS 2007 四年級數學知道選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 12

表 2-1-3 TIMSS 2007 四年級數學知道非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-4 TIMSS 2007 四年級數學應用選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-5 TIMSS 2007 四年級數學應用非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-6 TIMSS 2007 四年級數學推理選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-7 TIMSS 2007 四年級數學推理非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 14

表 2-2-1 九年一貫課程綱要數學領域中小數教材之分析helliphelliphelliphelliphelliphellip 16

表 3-3-1 樣本人數來源表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

表 4-1-1 詴題之難度和鑑別度helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

表 4-2-1 各模式指標的分析結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-3-1 HO-IRT 迴歸參數()比較表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-4-1 各模式詴題難度參數比較表 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 41

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數helliphelliphelliphelliphelliphellip 42

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)helliphellip 42

表 4-4-4 MIRT_UMIRT_C和 HO-IRT 在三個領域量尺之相關係數

比較 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 44

VI

表 4-4-5 MIRT_UMIRT_C和 HO-IRT 在領域量尺的估計參數表(部

分) 45

表 4-4-6 MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之

分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 46

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 6: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

V

表 目 次

表 2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時

間百分比helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 9

表 2-1-2 TIMSS 2007 四年級數學知道選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 12

表 2-1-3 TIMSS 2007 四年級數學知道非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-4 TIMSS 2007 四年級數學應用選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-5 TIMSS 2007 四年級數學應用非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-6 TIMSS 2007 四年級數學推理選擇詴題 helliphelliphelliphelliphelliphelliphelliphelliphellip 13

表 2-1-7 TIMSS 2007 四年級數學推理非選擇詴題 helliphelliphelliphelliphelliphelliphelliphellip 14

表 2-2-1 九年一貫課程綱要數學領域中小數教材之分析helliphelliphelliphelliphelliphellip 16

表 3-3-1 樣本人數來源表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 34

表 4-1-1 詴題之難度和鑑別度helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 37

表 4-2-1 各模式指標的分析結果helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-3-1 HO-IRT 迴歸參數()比較表helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 39

表 4-4-1 各模式詴題難度參數比較表 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 41

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數helliphelliphelliphelliphelliphellip 42

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)helliphellip 42

表 4-4-4 MIRT_UMIRT_C和 HO-IRT 在三個領域量尺之相關係數

比較 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 44

VI

表 4-4-5 MIRT_UMIRT_C和 HO-IRT 在領域量尺的估計參數表(部

分) 45

表 4-4-6 MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之

分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 46

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 7: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

VI

表 4-4-5 MIRT_UMIRT_C和 HO-IRT 在領域量尺的估計參數表(部

分) 45

表 4-4-6 MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之

分析比較helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 46

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 8: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

VII

圖 目 次

圖 2-3-1 題間多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-2 題內多向度測驗helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 23

圖 2-3-3 HO-IRT的模式圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 26

圖 3-1-1 UIRT 模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 29

圖 3-1-2 MIRT_U 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-3 MIRT_C 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 30

圖 3-1-4 HO-IRT 之題間多向度模式helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 31

圖 3-2-1 測驗編製與實驗程序圖helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 33

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖helliphellip 47

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 48

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值

與答對題數之散佈圖 helliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphelliphellip 49

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 9: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

1

第一章 緒論

第一節 研究動機與目的 國外不少先進國家的教育機構都深切關注學生數學方面的基本能力表現

為提高國民的素質及國際間的競爭力紛紛提供了許多全球性的大型測驗及良好

的評量架構如國家教育進展評量(The National Assessment of Educational

Progress簡稱NAEP)國際學生評量(The Programme for International Student

Assessment簡稱PISA)和國際數理趨勢研究(The Trends in International

Mathematics and Science Study簡稱TIMSS)TIMSS從1995年起每四年舉辦一次

的國際數學和科學教育成就趨勢調查其目的是想要對於各國學生數學及科學學

習成就來進行瞭解以及將測驗中所得到的數學與科學學習成就表現拿來和各國

文化背景學習環境教師因素等因子比較彼此的相關性和影響程度另外將

參與測驗的各國成就表現攤開來做縱向的比較讓參加的國家瞭解其表現在國

際間的排名以做為各國教育或課程改革的參考依據所以參與此項測驗的國

家有逐次增長的趨勢以最近一次TIMSS 2007的測驗為例就有69個國家參加

可見它的影響層面及受全球重視的程度是不容小覷的

TIMSS 2007四年級數學詴題評量架構分為內容和認知兩個領域內容領域是

指評量的內容分別為數( Number)幾何圖形與測量(Geometric Shapes and

Measures)資料呈現(Data Display)認知領域是指預期學生在接受評量內容時

可能產生的認知技能分別為知道(knowing)應用(applying)以及推理(reasoning)

第一個認知領域「知道」涵蓋了學生必頇知道的事實程序和概念而第二個

認知領域「應用」著重於學生應用知識和概念性理解去解決問題的能力第三

個認知領域「推理」越過例行性問題的解決而包含不熟悉的情境複雜的文

章脈絡和多重步驟之問題周素芳(2008)以TIMSS 2007數學評量架構對台灣

國小學童發展一套數學成就評量編製模式以自編之數學成就評量為工具採隨

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 10: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

2

機抽樣對台北市國小四五年級學童施測研究結果發現以TIMSS 2007的評量架

構在台灣國小學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更

進一步以TIMSS 2007評量架構之應用在金門縣進行國小四年級五年級學童

數學成就之調查研究希望能了解國小四年級五年級學童數學成就表現的情

形研究結果發現TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具

有可行性與實用性另外在認知領域方面全部樣本國小學童表現最好的是知

道領域帄均答對率為75其次是應用領域帄均答對率為55表現較差的是

推理領域帄均答對率為52以上研究對象是四五年級因此本研究也想要

仿照TIMSS 2007的評量架構來編製測驗以六年級為研究對象探討其可行性

一般大型測驗通常都會有總測驗的分數在本研究稱為整體量尺(overall

ability)及分測驗的分數在本研究稱為領域量尺(domain ability)屬於階層式

的測量模式但這些大型標準化測驗在測量模式的配合上仍有不足之處如

NAEPTIMSS使用單向度詴題反應理論(unidimensional item response theory 簡

稱UIRT)為主要的測量模式僅能對不同的學科能力以單一能力值進行描述(Lee

Grigg amp Dion2007 MullisMartin Ruddock O`Sullivan Arora Erberber

2007)PISA雖使用多向度詴題反應理論(multidimensional item response theory

簡稱MIRT)中之多向度隨機係數多項 logit模式(multidimensional random

coefficients multinomial logit model 簡稱 MRCMLM)但也僅針對各學科之次級

量尺進行估計對於各學科之主要量尺仍使用UIRT模式進行估計(林佳樺

2009)

這些屬於階層式測量模式的著名大型測驗若使用UIRT或MIRT模式來進行

能力值的估計可能會因違背其假設而使整體量尺的能力估計不準確或是當領

域量尺所對應的題數較少時會造成領域量尺的能力估計效果不可靠因此de

la TorreSong(2009)提出高階層詴題反應理論模式(higher-order item response

theory model簡稱HO-IRT模式)此模式同時包含整體量尺與領域量尺皆為連

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 11: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

3

續量尺可視為階層式的一般化模式為因應較複雜之評量架構林佳樺(2009)

探討適用於階層式評量架構的測量模式以PISA之評量架構作為基礎設計高階

層詴題反應理論模式此模式可以同時估計整體量尺與領域量尺稱為完整模

式且估計誤差皆接近或優於PISA之估計方式但其研究是使用模擬資料進行探

討張勝凱(2010)編製一份國小六年級數學推理能力測驗使用HO-IRT模式進

行實證資料分析探討HO-IRT模式應用於數學推理能力測驗的可行性故本研究

也想以實證資料來探究HO-IRT之完整模式在實際測驗上是否有相同的成效

在國小的數學課程中小數是數學內容裡「數與量」的一環是整數十進數

結構的延伸和分數的另一種表示方式其學習十分抽象與複雜的在學習上學生

也常遭遇困難九年一貫課程 (教育部2003)中國民小學階段數學領域的目標

(三)規定在小學畢業前學生能熟練小數與分數的四則計算能利用常用數

量關係解決日常生活的問題97課綱中數學領域的分年細目能力指標也指

出學生要能用直式處理除數為小數的計算並解決生活中的問題所以小數的

除法在國小的數學領域中是重要的一環

小數概念及四則運算的學習是國民小學數學的核心課程之一小數概念也是

建立數學知識的重要基礎因而學生發展小數概念與運算越顯重要但在生活情

境中因使用整數為多小數的生活情境較少也會影響學生對小數的了解尤

其是小數四則運算的學習學生偏向算則無法賦予小數四則運算有意義的學

習例如小數的加減是要對齊小數點而非末位小數的乘法卻是對齊末位而

非小數點以及小數的乘法是將它視為整數乘法後再計數被乘數及乘數小數位數

的和作為積的小數位數諸多概念混淆了學生對小數四則運算的學習

Bell Swan amp Taylor (1981)針對12至15歲的學生為對象進行研究發現學生

在面對小數的文字題時其所選擇的運算策略中出現迷思如缺乏小數位值的理

解有「乘法使結果變大除法使結果變小」的想法認為除法是「大的數除以

小的數」根據題目中數字所附帶的單位來決定被成數或被除數使用關鍵字策

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 12: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

4

略來解題Fischbein et al (1985) 的研究中指出學生在文字題上的列式策略是

受「暗隱模式」(implicit model)的影響當題目違反此一模式則學生答對率就下

降因此題目中的數值是小數時其學生的答對率都下降因此小數的學習是

小學數學教育中極有挑戰性的教學主題最近十多年的一些研究結果和評量報

告顯示學生在學習小數方面表現得並不理想(吳昭容1996陳永峰1998

劉曼麗2004)所以本研究想應用階層式的詴題評量架構來了解國小六年級

學生小數的除法能力表現

不管國內或國外數學課程愈來愈重視學生高階層數學能力的培養但大多

相關之研究皆著重於小數迷思概念的探討和小數的診斷教學較少針對學生小數

除法的高階層能力進行研究與分析所以本研究將以相關研究中常見的小數迷

思概念做為本研究測驗工具編製的依據TIMSS數學評量架構的認知技能包

含了知道應用和推理三種能力若要設計階層式的詴題TIMSS的數學評量架

構是很好的參考故本研究要用TIMSS 2007四年級數學詴題的評量架構以國小

六年級小數的除法能力作為整體量尺把小數的除法能力分為知道應用和推理

三個領域量尺來編製一份測驗探討整體量尺與領域量尺間的關係並瞭解學生

在小數的除法能力測驗中整體量尺與領域量尺的影響如此可更完整的知道學生

在整份測驗中的表現

基於上述動機本研究之研究目的如下

一參考 TIMSS 2007 數學評量架構編製一份小數的除法測驗並驗證其成

二檢驗 HO-IRTMIRT 和 UIRT 三種模式之適配度作為模式選用之依據

三驗證第二個研究目的之最佳模式是否可以應用於小數的除法測驗

四探討分開估計與完整估計在國小六年級學生小數的除法測驗中整體量尺

與領域量尺間的關係

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 13: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

5

第二節 名詞解釋

壹小數的除法能力

本研究所稱的小數的除法能力是指國小六年級數學領域課程中能力指

標為 6-n-04能用直式處理除數為小數的計算並解決生活中的問題

貳整體量尺與領域量尺

整體量尺是整合領域量尺欲測量之高階層的學科能力如本研究主要測量

之小數的除法能力即為本研究所述之整體量尺而領域量尺則是測量學生在不

同領域的能力表現這些領域測驗可以是學習目標子測驗(subtests)學習

規範(learning standards)等如本研究以TIMSS 2007數學評量架構的認知領

域-知道應用和推理三種能力為所定義之領域量尺

參高階層詴題反應理論模式

de la TorreSong(2009)提出高階層詴題反應理論模式(HO-IRT模式)

此模式同時包含兩階層的能力量尺第一層的能力量尺就是領域量尺領域量尺

是測量學生在不同領域的能力表現第二層的能力量尺就是整體量尺整體量尺

是整合領域量尺欲測量之高階層的學科能力皆為連續量尺可視為階層式的一

般化模式

肆完整估計

完整估計是指在高階層的評量架構下一種可以同時估計整體量尺與領域

量尺的方式

第三節 研究限制

因時間資源和人力不足的考量僅收集紙筆測驗結果來加以論證研究

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 14: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

6

的樣本以中部縣市四所國小六年級學童為對象亦即在這樣的情況下所推論出

來的研究結果可能無法做廣義的推論

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 15: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

7

第二章 文獻探討

本研究主要目的是依據 TIMSS 2007 數學詴題評量架構以 HIRT 模式編製

一份國小六年級學生數學小數的除法能力之測驗透過 HO-IRT 模式了解整體

量尺--小數的除法能力及領域量尺--知道應用推理間的關係並比較 HIRT

MIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模式是否可以應用於小數的除法

能力測驗及瞭解學生在小數的除法能力測驗上的表現情形因此本章將分成

三節來加以闡述第一節為 TIMSS 2007 數學評量架構第二節為小數的除法

概念第三節為詴題反應理論模式

第一節 TIMSS 2007數學評量架構

壹TIMSS的緣起

從1995年起每四年舉辦一次的國際數學和科學教育成就趨勢調查(Trends in

International Mathematics and Science Study簡稱TIMSS)其目的是想要對於各

國學生數學及科學學習成就來進行瞭解以及將測驗中所得到的數學與科學學習

成就表現拿來和各國文化背景學習環境教師因素等因子比較彼此的相關性和

影響程度另外將參與測驗的各國成就表現攤開來做縱向的比較讓參加的

國家瞭解其表現在國際間的排名以做為各國教育或課程改革的參考依據(方建

彰2006)

在前數學領域的IEA(The International Association for the Evaluation of Education

Achievement)研究已經揭示了教與學過程中的經驗TIMSS正是在這個基礎上

詴著進一步提供有關的重要訊息(鮑健生2004)

一了解當前各國教育系統的資訊以便在課程教學和學生成就等方面進行國

際上的比較

二評價各種課程教學管理和教學策略對學生學習的潛在影響

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 16: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

8

三從成績有顯著進步趨勢的某些國家中去探索其背後的潛在因素

四深入理解學生的學習態度是如何改變以及改變的原因進而揭示課程教學

實踐與正確態度形成之間的關係

IEA曾舉辦超過20次的國際性調查研究包括數學科學語文閱讀和公

民教育等領域1964年舉行第一次國際數學教育成就調查(the First International

Mathematics Study簡稱FIMS)1970至1971年舉行第一次國際科學教育成就調

查(the First International Science Study簡稱FISS)1980至1982年舉行第二次國際

數學教育成就調查(the Second International Mathematics Study簡稱SIMS)1983

至1984年舉行第二次國際科學教育成就調查(the Second International Science

Study簡稱SISS)經過此四次的調查研究IEA發現數學與科學領域在許多方

面皆有相關因此决定結合此兩個領域在1995年推出第三次國際數學和科學教

育成就研究(TIMSS1995)調查對象為國小四年級學生國中二年級學生及高

中三年級的學生共有41個國家參加接著IEA在1999年進行第四次國際數學與

科學教育成就研究後續調查(TIMSS-R 或TIMSS 1999)調查對象為國中二級學

生有38個國家參加(Martin Gregory amp Stemler 2000)國際數學與科學教育

成就研究在國際間形成一股熱潮受到各國的重視因此IEA規劃自1999年後

每四年舉辦一次國際數學與科學教育成就研究並將此研究改名為國際數學與科

學教育成就趨勢調查(TIMSS)

TIMSS 2003的調查對象包括國小四年級學生及國中二年級學生共有50個國

家參加TIMSS 2007再以國中二年級學生與國小四年級學生為調查對象共有69

個國家參加使得學生在數學和科學學習成就改變的趨勢上藉由1995年1999

年2003年和2007年的資料收集在這12年有四個觀察點(Mullis Martin Ruddock

OrsquoSullivan Arora amp Ebru 2005)正因如此TIMSS 2007更加受到各參與國家的

重視可說是一個具全球化的產物因應世界潮流趨勢台灣的國中二年級學生

也從1999年開始參加TIMSS的調查研究調查結果顯示台灣的國中二年級學生在

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 17: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

9

數學與科學皆獲得優異的成績

貳TIMSS的數學內涵和詴題之範例

TIMSS的主要目的是透過測量學生數學成就與科學成就的趨勢來瞭解各國

的不同教育制度與措施所獲得的不同教育成果以作為各國提昇學生教育水準的

參考為了正確回答TIMSS測詴的項目學生除了需要熟悉數學評量的內容外

也需要利用一系列認知的技能四年級數學內容領域包括數幾何圖形與測量

資料呈現等三種領域認知領域包括知道應用與推理等三種領域每一種領域

下都有數項行為表現在IEA所公布的評量架構中明列認知領域測驗題目所需

時間的百分比其中知道與應用所占的比例較高皆為40推理則占20各領域

測驗題目所占的時間百分比如表2-1-1(Mullis et al 2008)

表2-1-1 TIMSS 2007 四年級數學認知領域測驗題目所需的時間百分比

四年級數學認知領域 測驗題目所需的時間百分比()

知道(knowing) 40

應用(applying) 40

推理(reasoning) 20

本研究將以TIMSS 2007的四年級數學評量架構之認知技能為主第一個認知

技能是「知道」涵蓋了學生必頇知道的事實程序和概念第二個認知技能是

「應用」著重於學生應用知識和概念性理解去解決例行性問題的能力第三個

認知技能是「推理」也就是越過例行性問題的解決包含不熟悉的情境複雜

的文章脈絡及多重解題步驟之問題茲將此三種認知技能詳述如下(引自蔡志

隆2008)

一知道

包括學生需要知道的事實程序和概念包含的行為有回憶(recall)辨認

(recognize)計算(compute)擷取(retrieve)測量(measure)排序分類(orderclassify)

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 18: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

10

等六項

(一)回憶回憶定義單位數的基本事實數的性質帄面幾何的性質數

學的規則(如a+a+a=3a)

(二)辨認辨認數學的外形實體數量和符號(如常見相等分數小數

和百分比擺放不同位置的幾何圖形)

(三)計算

1瞭解+-timesdivide四則運算和混合運算

2求近似值的方法

3數值相除成為比例

4解等式或方程式

5簡化分解和展開代數和數值式子算出未知數

6估計測量

7依據被給予的百分比增加或減少一個量

(四)擷取

1閱讀簡單刻度

2從圖表或其他線索擷取資料

(五)測量

1使用測量儀器

2適當的使用測量單位

3估計分量

(六)排序分類

1依據物體的屬性或數字的特性排序

2將物體形體數等式依據共同性質做分類

3依據分類特徵作正確判斷

二應用

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 19: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

11

學生能應用知識和概念性理解來解決問題的能力包含的行為有選擇

(select)描述(represent)模式化(model)執行(implement)解決例行性問題

(solve routine problems)等五項

(一)選擇選擇一個適當且有效的演算方法或策略來解決問題

(二)描述

1用圖表呈現給定的數據資料

2依據給定的數學實體或關係衍生等值的算式

(三)模式化衍生一個適當的模式如用等式或圖來解決例行性的問題

(四)執行跟隨並執行一系列的數學教學如根據給定的規格畫出圖形

(五)解決例行性問題所給的問題是學生在課堂遇見的相似問題如利用幾何

特性解決問題或比對所呈現之資料的異同使用來自圖表的資料去解決例行性

問題

三推理

超越例行性問題的解決辦法它包含不熟悉的情境複雜的文章脈絡和多重

解題步驟的問題包含的行為有分析(analyze)一般化(generalize)綜合結合

(synthesizeintegrate)證明(justify)解決非例行性問題(solve non-routine problems)

等五項

(一)分析

1使用類比推理

2在一個數學情境中能決定並描述變數或物體之間的關係

3分割幾何圖形使解題簡單化

4想像三維圖形的變化

5畫出一個不熟悉的立體圖形之視圖

6比對相同資料的不同呈現

7從給定的訊息做有效的推論

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 20: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

12

(二)一般化延伸特定情況的一般結果

(三)綜合結合

1綜合過程到結果的建立

2綜合並產生新的結果

3在不同知識領域間做連結

4在相關的表徵中做連結

5在相關的數學概念間做連結

(四)證明藉由提供的數學結果或特性為一個狀態的真假提出論證

(五)解決非例行性問題解決生活中未遭遇過的數學問題

周素芳(2008)以TIMSS 2007 數學評量架構對台灣國小學童發展一

套數學成就評量編製模式以自編之數學成就評量為工具採隨機抽樣對台北市

國小四五年級學童施測研究結果發現以TIMSS 2007的評量架構在台灣國小

學童發展一套數學成就評量的模式是可行的蔡志隆(2008)更進一步以TIMSS

2007評量架構之應用在金門縣進行國小四年級五年級學童數學成就之調查研

究希望能了解國小四年級五年級學童數學成就表現的情形研究結果發現

TIMSS 2007評量架構應用在金門縣國小學童之數學成就調查具有可行性與實用

性另外在認知領域方面全部樣本國小學童表現最好的是知道領域帄均答

對率為75其次是應用領域帄均答對率為55表現較差的是推理領域帄均

答對率為52單就五年級樣本而言學童表現最好的是知道領域其次是應用領

域表現較差的是推理領域就四年級樣本而言學童表現最好的是知道領域

其次是推理領域表現較差的是應用領域

TIMSS 2007的四年級數學認知詴題分為選擇題和非選擇題兩類在此就知

道應用和推理三部份舉例選擇和非選擇題各一題詴題來自於臺灣TIMSS 2007

網站(httptimsssecntnuedutwtimss2007serotc2007_4asp) 這些可公開詴題

如表2-1-2表2-1-3表2-1-4表2-1-5表2-1-6表2-1-7 所示

一知道學生知道的事實程序和概念

表2-1-2 TIMSS 2007 四年級數學知道選擇詴題詴題編號M041014

詴題編號M041014

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 21: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

13

下列哪一個是由最大排到最小

36 43 66 87 (2) 66 43 36 87 (3) 87 66 36 43 (4) 8766 43 36

表2-1-3 TIMSS 2007 四年級數學知道非選擇詴題詴題編號M031286

詴題編號M031286

一個停車場中共有 762 輛車子停成 6 排每排停放的數量相同請問每排

停放了幾輛車

二應用學生能應用知識和概念理解去解決問題的能力

表2-1-4 TIMSS 2007 四年級數學應用選擇詴題詴題編號M041094

詴題編號M041094

小傑有10 元午餐時間他買了25 元的果汁和385 元的三明治請問小傑還剩

下多少元

365 元 (2) 475 元 (3) 635 元 (4) 1635 元

表2-1-5 TIMSS 2007 四年級數學應用非選擇詴題詴題編號M031301

詴題編號M031301

安安想知道他的貓咪有多重首先他量出自己的體重是 57 公斤然後他抱著

貓一起稱重結果磅秤顯示 62 公斤請問貓咪的重量是幾公斤

三推理能越過例行性的問題包含不熟悉的情境複雜的文章脈絡和多重解

題步驟之問題

表2-1-6 TIMSS 2007 四年級數學推理選擇詴題詴題編號M031335

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 22: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

14

詴題編號M031335

某一天的早上7 點時的氣溫為12degC氣溫每小時會上升2degC一直到早上11 點時

達到了20degC請問在早上9 點時的氣溫是多少

(1)14degC (2) 15degC (3) 16degC (4) 17degC

表2-1-7 TIMSS 2007 四年級數學推理非選擇詴題詴題編號M031282

詴題編號M031282

去年陽光國小有92 個男生及83 個女生今年全校有210 個學生其中97個是男

生請問今年的女生比去年的女生多幾個請寫下你的作法

第二節小數的除法概念

壹小數的概念與內涵

對一般學生而言小數是非常抽象和模糊的課程一般學生很少會經由日常

生活來瞭解其意義以日常生活中頻率使用最大的錢幣為例由於台灣的幣值很

大我們幾乎是以一元幣值為最小單位所以買賣東西很少以小數來表示物價

甚至於量也是如此例如小明真正的身高1532 公分體重432 公斤但一般

習慣會說小明的身高是153公分體重43公斤我們常會將整數後面的小數部分

忽略因而對小數並不會產生特別的感覺造成我國學生對於小數是較不容易從

生活中了解相對地學習起來常常會有很多迷思概念

Hiebert (1992)認為小數概念可具體的分為三類記數系統 (notation system)

運算規則 (rules)數量的意義 (quantity)即知道小數表示的形式正確使用運

算規則來解決小數問題瞭解小數所表示的數量Hiebert也非常強調「連結

(connect )」的觀念但他認為學童在上述三種知識的連結做得並不是很好情形

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 23: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

15

如下

一「記數系統」與「數量的意義」無法產生連結

學童可能知道記數符號卻無法了解數學符號的意義例如學童可能會念

245知道個位是2十分位是4百分位是5但無法了解245是介於2與3之間

因此對於245這個數缺乏「數感」

二「數量的意義」與「運算規則」無法產生連結

學童利用太多時間和精神在運算規則上使得抽象的數學符號與具體的真實

世界表徵脫離

所以我們若希望學生對小數概念是真正內化與了解那就必頇加強「記數系

統」「運算規則」「數量的意義」等知識之間彼此的連結

劉曼麗(2002)將小數概念具體分為小數符號的意義小數符號的結構小數的應

用等三部分小數符號的意義主要包含小數圖像表徵和小數與分數雙向連結兩

類小數符號的結構主要包含小數符號的辨識小數的寫法小數的讀法小數

的位值小數的位名小數的化聚等六項小數的應用主包含小數單複名數轉換

小數的估測小數大小比較小數的稠密性小數的計算小數的估算文字題

等七項

此外 Hiebert amp Wearne (1988) 認為學生要發展穩固的小數知識需歷經四個

階段連結(the connecting process)發展(the developing process)精緻與熟練(the

elaborating and routinizing process)抽象化(the abstracting process)

一連結透過指示物的操作結果連結數字符號和運算符號而指示物必頇為

日常生活的物質(錢幣)或特別設計的教具(各單位的數學積木)而指示物的運算

(加減)是連結數學符號運算使學生從中產生答案並以此為基礎了解符號的

運算意義

二發展學童隨著指示物的操作所發展出來處理符號的程序此程序乃是進

一步把符號給予擴大的結果如操作1個白色積木連結小數符號01後進而

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 24: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

16

瞭解2個白色積木所表示的小數符號是02而3條橘色積木和5個白色積木所

表示的小數符號是35連結和發展過程主要在於透過指示物的操作從意義上了

解小數符號的表達方式包括指示物與符號的連結以及觀察指示物所發展的規

三精緻與熟練在脫離指示物後的學習過程兩者是獨立的精緻在前熟練

在後精緻指的是擴展程序性知識到其他相似的情境如指示物世界中所發展出

來03times18可延伸到其他不同位數的乘法問題2365times1205熟練指的是記住和練

習規則直到成為習慣性並可用小數概念來執行精緻與熟練能展現出數學的成

效能在脫離指示物後做複雜的運算和藉由在紙上的符號移轉來達到認知需求

四抽象化此過程是以符號和規則作為一個常見系統的指示物持續地重複前

面三個階段以建立更抽象更複雜的系統

前兩階段是發展小數概念的意義後兩階段是熟練計算程序前兩個階段強

調學生小數概念的發展並認為學生唯有具備穩固的小數知識後才能邁入第三

階段正確的使用計算程序並應用到非例行性題目最後達到抽象化階段

我國近十年來的國小數學課程共歷經三種不同版本分別是國小數學新課

程九年一貫課程暫行綱要數學教學領域九年一貫課程綱要數學教學領域本

研究工具的編製是以九年一貫課程綱要數學學習領域為依據其有關小數教材綱

要之分析如表2-2-1 所示(教育部2003)

表2-2-1 九年一貫課程綱要數學領域中小數教材之分析

階段能力指標 分年細目 說明

N-1-10

能認識一位小數並作

比較與加減計算

3-n-10 能認識一位小數

並作比較與加減計算

學習一位小數(整數

兩位)的加減直式計算

重點在熟悉小數點的

意義並理解在小數加

減直式計算中要對齊小

數點

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 25: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

17

N-2-10

能認識多位小數理解

並比較及用直式處理

加減與整數倍的計

算並解決生活中的問

4-n-10 能用直式處理整數

除以整數商為三位小數的

計算

4-n-11 能用直式處理二

三位小數加減與整數倍的

計算並解決生活中的問

5-n-08 能認識多位小數

並作比較與加減的計算

以及解決生活中的問題

關鍵在小數點位置的

處理

多位小數是指小數的

位數可以一再細分下

N-2-12

能用直式處理乘數是

小數的計算並解決生

活中的問題

5-n-09 能用直式處理乘數

是小數的計算並解決生活

中的問題

以二位小數互乘為原

先處理整數的小數倍

的計算

N-3-04

能用直式處理除數是

小數的計算並解決生

活中的問題

6-n-04 能用直式處理除數

是小數的計算並解決生活

中的問題

被除數小數點位數不

超過 3 位商需為有限

小數

由表 2-2-1 可知我國九年一貫課程綱要數學領域中有關小數知識的課程

始於國小三年級止於國小六年級雖然課程的設計由淺而深學習內容強調與

日常生活作連結然而只有四年的課程安排無後續延伸課程的規劃對正在發

展抽象思考的學童而言似乎不夠完備

貳小數概念和算則的迷思

Hiebert 和Wearne (1986)指出學生學習小數乘除法比學習加減法困難

因為乘除法的基本概念是無法從整數的概念整批轉移過來也就是說學生在學

習小數的乘除法時往往受限於先前學習整數時的想法所以「乘會越乘越大」

「除會越除越小」他們的研究發現學童在計算小數的乘法時在最後的策略「小

數點的位置」是判斷錯誤的例如在做06times04 時會出現24 的錯誤答案而在

小數的除法發現 056divide07 會有008的錯誤答案這正是學生做小數乘除法的計

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 26: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

18

算時在最後的策略「小數點的位置」上判斷錯誤的結果林軍治(1986)提出

學童很難接受除數小於1商會比被除數大劉曼麗(2002)也提到學生會有「乘

使結果變大除使結果變小」的迷思概念如果題目中有「倍」字出現就使用乘

法有「分出」的文字就使用除法的迷思劉曼麗(2004)指出在小數除以整數

的題目中多數學生能做對求商的部份但卻無法說明理由只是記住除法算則

而在求餘數部份則容易發生未標小數點的錯誤Brian 和Greer 探討文獻發現

學生經常將文字題內的數字作單一式子的運算並從文獻中整理以下四種情形

(引自劉曼麗2002)

一數字的迷思當一個算式中出現小於1或大於1的小數時容易造成學生乘

除法的不保留概念尤其是「乘變大除變小」的迷思概念

二小數與整數的連結不夠缺乏在小數分數和整數之間的連結概念認為小

數系統的處理方式是分開的小數是不連續的還有小數分數和整數之間的連

結意義了解不夠

三會使用替代的解題方法學生喜歡用單一式子來解決問題

四運算概念的缺乏學生在一個給定數字乘法或除法運算的式子中要求學生

寫出一個符合此運算的文字題是很難的

陳永峰(1998)發現小數除法對學生而言是困難的例如商的小數點判斷

餘數小數點的決定學生都比較不能掌握在乘除小數時會放錯基數的小數

點或餘數的小數點也有些學生在求餘數問題中常以四捨五入法求商而在餘數

的除法中常有學生會忽略餘數的小數點或是將餘數的小數點對齊移位後的被

除數小數點等錯誤的想法

根據近二十年的小數相關研究或評量報告得知學生在小數的學習上常會

受到整數或分數的學習經驗的影響而產生許多的迷思概念造成其學習表現

並不理想(周筱亭1990簡茂發劉湘川1993杜建台1996劉曼麗

1998)學生在小數乘除的估算或在小數乘除的文字題的表現上也不佳

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 27: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

19

艾如昀(1994)發現五年級學生在文字題的列式上若遇到除數為小數的問題

時其答對率就下降Bell Swan amp Taylor (1981) 針對 12 至 15 歲的學生為對

象進行研究發現學生在面對小數的文字題時其所選擇的運算策略中出現五

種迷思概念缺乏小數位值的理解有「乘法使結果變大除法使結果變小」

的想法認為除法是「大的數除以小的數」根據題目中數字所附帶的單位來

決定被乘數或被除數使用關鍵字策略來解題Fischbein et al (1985) 的研究

中指出學生在文字題上的列式策略是受「暗隱模式」(implicit model)的影響

當題目違反此一模式則學生答對率就下降因此題目中的數值是小數時其學

生的答對率都下降針對國內國小學生小數的認知能力之相關研究整理敘述

如下

研究者 研究發現

陳永峰

(1998)

研究旨在探究國小六年級學童的小數知識其內容包括小數的

概念小數的計算和小數的應用等三大部分研究的結論在小

數問題的答題表現傳統班和實驗班在小數的概念和小數的計算

表現不錯但在小數的應用則表現略差在解題策略上傳統班

較單一化而實驗班則較多樣化在計算規則上傳統班只是會

運用但實驗班則還能說明其理由

黃偉洲

(2000)

研究旨在透過指示物活動使具有小數迷思概念之學童在親自

操弄指示物的情形下能學習與建構正確的小數概念研究發現

透過指示物的操弄能建立單位之間關係化聚與比較的概念

劉曼麗

(2001)

研究目的在探討國小學童的小數知識主要了解國小學童在學習

小數的概念和小數的計算方面表現情形與常犯的錯誤研究發現

這些學童在小數的表現上並不理想他們所獲得的小數知識似乎

都偏向程序性的了解或以記憶性的居多

康昆利

(2004)

研究旨在針對國小六年級學生的小數概念透過動態評量的方式

探討其成效研究發現學生在小數的意義位值化聚和單位小

數的轉換上出現許多迷思概念

張淑萍

(2006)

本研究是描述研究者個人進行五年級小數教學之行動研究歷

程研究發現學生學習小數除法時容易有「大數除以小數」的

迷思判斷錯商數位值不知道商數到計算哪一個位數掌握不

清餘數的位值等學習上之困難

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 28: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

20

劉曼麗

(2008)

研究發現六年級學生不易掌握除數為純小數的除法意義且容易

受到「大的數divide小的數」或「乘變大除變小」迷思概念的影響

因而在除法文字題的列式上產生困難此外學生在處理小數除

法計算問題時容易在商和餘數小數點的處理上產生錯誤

賴文溥

(2009)

研究旨在應用詴題關聯結構分析法形成學童小數除法概念結構

圖並分析學童在小數除法概念的迷思研究發現在進行小數除

以小數之計算時學童對商和餘數分別代表的意義不清楚也就

是對餘數及商之單位解讀產生錯誤許多學童仍屬於「大數除以

小數」型學童在處理小數除法時對於「位值」及「不夠除時

商要先補零」的概念很不清楚

朱欣傑

(2009)

研究旨在以運算過程分析提示問題寫作方式探討六年級學生小

數四則運算的了解情形研究發現除法運算的答題表現遜於其他

運算方式其中又以開放性的題型學生表現最差顯現學生停留

在程序性知識的學習忽略關係性知識的學習

綜合以上所述大多相關研究皆著重於小數迷思概念的探討和小數教學診斷

的研究較少針對學生小數的認知領域進行高階層能力之研究與分析所以本

研究將以相關研究中常見的小數迷思概念做為本研究測驗工具編製的屬性依

據以國小六年級小數的除法單元為主針對學童在認知領域中--知道應用和

推理三個能力上常會出現的迷思設計一份高階層之評量架構的測驗深入瞭

解學生關於小數的除法之認知領域的能力表現

第三節詴題反應理論模式

本研究主要目的是以 HO-IRT 模式編製一份國小六年級學生數學小數的除

法能力之測驗透過 HO-IRT 模式了解學生小數的除法能力與知道應用推

理間的關係比較 HO-IRTMIRT 及 UIRT 模式的分析結果驗證 HO-IRT 模

式是否可以應用於小數的除法能力測驗以下僅針對本研究所使用之的模式進

行介紹

壹單向度詴題反應理論

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 29: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

21

測驗理論是一種解釋測驗資料間實證關係的理論學說(余民寧1992a

1992b)主要分為古典測驗理論(classical test theory CTT)和詴題反應理論(item

response theory IRT)兩大類CTT在計分較簡單是其優點但在測量內容上有

樣本和詴題依賴的缺點而IRT在測量上可達到較客觀的要求

IRT 建立在兩個基本概念上一是受詴者在詴題上的答題表現可從潛在

特質(latent traits)或能力(abilities)來預測或解釋二是受詴者的答題表現及

其能力間的關係可透過詴題特徵曲線(item characteristic curve ICC)來解釋

任何一條詴題特徵曲線都是由受詴者的能力和詴題的特性來共同決定代表

受詴者答對某一詴題的機率(余民寧1992b)

以 IRT 進行測驗資料之分析時必頇符合四項基本的假設單向性

(unidimensionality)局部獨立性(local independence)非速度性(nonspeedness)

及「知道-正確」(ldquoknow-correctrdquo assumption)(Weiss amp Yoes 1991)

一單向性某一測驗只針對單一能力或潛在特質進行測量

二局部獨立性受詴者在不同詴題上的作答反應是互相獨立的亦即受詴者

在測驗上某一詴題的作答反應不會受其它詴題的影響

三非速度性施測時間不受速度的限制也就是受詴者的成就表現是由潛

在特質或能力所決定不是因為時間的限制而造成作答未完整影響其表

四知道-正確受詴者若知道某一詴題的正確答案就能答對該詴題反之

受詴者答錯某一詴題則表示不知道該詴題的答案

詴題反應理論中的各種模式有個最常用的共同假設那就是測驗中的各個

詴題都在測量同一種共同的能力或潛在特質這種單一能力或潛在特質必頇

包含在測驗詴題裡的假設便是單向度的假設適用於含有單一主要特質測驗

的詴題反應模式稱作單向度詴題反應理論模式(簡稱 UIRT 模式)適用於

含有多種主要特質的詴題反應模式就叫作多向度詴題反應理論模式透過詴

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 30: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

22

題反應理論的理論基礎可發展各領域之題庫適性化測驗的建置及發展特定目

的之測驗有關 IRT 的研究國內外都有許多相關之應用如美國的 TOEFL

TOEICGRE 和我國的國中基測此外PISANAEPTIMSS 與 PIRLS 等知

名的測驗亦使用 IRT 之相關理論作為其學術研究的主要工具之一本研究只

使用單參數對數模式以下僅針對單參數對數模式亦即 Rasch model 進行介

nie

ei

i

b

b

i 3211

)(P)(

)(

(1)

其中 )(P i 能力為之受詴著答對第 i題的機率

ib 第 i題的詴題難度參數

n 測驗長度

貳多向度詴題反應理論

多向度詴題反應理論(簡稱 MIRT 模式)是可以測量多個不同能力量尺的

模式對不同能力之次級量尺進行估計多向度測驗可以分為題間多向度測驗

( between-item multidimensional test ) 與 題 內 多 向 度 測 驗 ( within-item

multidimensional test)兩種(Adams Wilson amp Wang 1997)在測驗中的每一詴

題只測量一種能力就是單向度的詴題測驗中若含有多個不同能力之測量的

單向度詴題此測驗便是題間多向度(圖 2-3-1)例如國中基本學力測驗中的

自然科測量到包含物理化學生物和地球科學等學科之能力在測驗裡的

每一個詴題若不只測量單一種能力亦即詴題內含有多個向度則此測驗稱為

題內多向度測驗例如數學成就測驗裡的文字題一個題目不僅測量問題解決

之能力還同時有可能測量到計算能力和推理能力(圖 2-3-2)(林佳樺2009)

邱美珍(2008)的研究便是以多向度詴題反應理論模式來探討兒童獨自步行

上下學之能力

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 31: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

23

圖 2-3-1 題間多向度測驗

圖 2-3-2 題內多向度測驗

目前常見的多向度詴題反應理論模式大多是單向度詴題反應理論模式的衍

Item1

Item2

Item3

Item4

Item5

1

2

Item1

Item2

Item3

Item4

Item5

1

2

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 32: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

24

生模式MRCMLM就是延伸Rasch模式而成的多向度詴題反應理論模式(Hoskens

amp De Boeck1997Wang Wilson amp Cheng 2000Wilson amp Adams 1995)PISA

之數學能力的測量模式就是使用MRCMLM模式其模式定義如下

iK

kikik

ikik

ikX

1

)exp(

)exp()1(P

ξaθb

ξaθbθ|ξBA (2)

其中 ikX 受詴者之做答反應組型

iK 第 i 詴題的計分類別數

θ受詴者的能力參數矩陣(多向度能力)

ξ詴題參數向量

ika 第 i 題中第 k 個反應類別的設計向量(design vector)

ikb 第 i 題在第 k 個反應類別上的計分向量(scoring vector)

A整份測驗的設計矩陣(design matrix)

B整份測驗的計分矩陣(scoring matrix)

100

010

001

A

000100

000000

000010

000000

000001

000000

654321

答對

答錯

答對

答錯

答對

答錯

試題

B

MRCMLM的優點是可推論單向度多點計分的測驗資料對於測量模式若存

在非獨立的情況可以藉由題組搭配該測量模式來做資料分析更可以處理多向

度多點計分的測驗資料其應用範圍可涵蓋多種不同變化的測驗類型但

MRCMLM的缺點是只可應用於單一階層資料之推論

參高階層詴題反應理論模式

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 33: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

25

高階層詴題反應理論模式(HO-IRT 模式)包含兩階層的能力量尺第一層

的能力量尺是測量學生在不同領域的能力表現稱為領域量尺第二層的能力

量尺是整合領域量尺預測量之高階層的學科能力稱為整體量尺在 HO-IRT

的模式中一個測驗可觀察到多個單向度的領域測驗當不同領域量尺皆測量

相同的能力時則整份測驗就是單向度的測驗當不同領域量尺之間有關聯時

則會藉由一高階層能力來連接所有的領域量尺

隨著大型測驗需求量的快速增加及形式的改變其測驗的議題廣泛受到矚

目目前國際上較著名之大型測驗皆屬於高階層測量模式若使用傳統單向度測

驗理論可能會因違背其假設而使整體量尺能力估計不準確或當領域量尺所對

應的題數較少時導致領域量尺能力估計效果不可靠de la TorreSong(2009)

提出HO-IRT模式此模式同時包含整體量尺和領域量尺的能力以下就de la Torre

Song(2009)的模擬方法來進行說明

在 HO-IRT 模式中一個測驗可觀察到多個單向度的領域測驗也就是領

域量尺 )(d

i )(d

i 表示第 i位受詴者在領域量尺d 的表現其中 Dd 321

當不同領域量尺測量相同的能力時則整份測驗被認為是單向度的測驗而不

同領域量尺之間有關聯時則會藉由整體量尺 i 來連接所有領域量尺其中 i 為

第 i位受詴者在整體量尺的能力值其中並假設領域量尺是整體量尺的一線性函

idi

dd

i )()( (3)

其中 )(d 為迴歸參數 id 為誤差項 id 假設服從帄均數為 0 且變異數為

2)(1 d 的常態分配 1|| )( d 根據這些假設可得知 )(d

i 的分配與 i 相同

屬於標準常態分配 )10(N 此外更假設在整體量尺已知的模式下各個領域

量尺間會互相獨立其中 )(d 更可表示整體量尺分數與領域量尺分數間的相

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 34: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

26

關而領域量尺 d 與 d 間的相關則為 )()( dd 雖然 )(d 可為負數但在

教育測驗的應用上整體量尺及領域量尺間的相關皆為正的

圖 2-3-3 為 HO-IRT 的模式圖第一層表示第 i位受詴者在領域量尺d 中的

第 j 題詴題之反應情形 )(d

ijX 第二層表示受詴者的反應透過詴題參數 )(d

j 連結到

領域量尺分數模式中的 )(d

j 假設為已知第三層表示受詴者的領域量尺分數

透過迴歸參數 )(d 連結到相對應之整體量尺分數 i

圖 2-3-3 HO-IRT 的模式圖(de la TorreSong2009)

de la TorreSong(2009)的研究顯示HO-IRT 模式比一般單向度 IRT

(conventional unidimensional item response theory簡稱 CU-IRT同本研究之

UIRT 和 MJRT)模式的誤差值為小且在整體量尺和領域量尺的能力值估計上

HO-IRT 模式比 CU-IRT 模式來得好只是此研究模式中的 )(d

j 假設為已知

林佳樺(2009)以模擬實驗方式探討 HO-IRT 之完整模式估計方法與 PISA 中

)I( )II(

)( D i

)I(

i

)II(

i

)(D

i

)I(

ijX

)II(

ijX

)(D

ijX

)I(

j

)II(

j

)(D

j

觀察變項以圓圈表示

固定變項以方框表示

其餘變項表示待為估計

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 35: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

27

所使用之單向度 IRT 分開模式估計方法的成效差異結果發現 HO-IRT 模式在

估計誤差上皆接近或優於 PISA 之估計方式de la Torre Hong(2010)又以

HO-IRT 模式做小樣本的參數估計但是這次研究想要顯示在模式中詴題參數

為未知時是否也能複製得到相同的結果亦即在詴題參數為未知的情形下

HO-IRT 模式的誤差值是否也能比 CU-IRT 模式為小且在整體量尺和領域量

尺的能力值估計上HO-IRT 模式是否也能比 CU-IRT 模式來得好結果發現

即使在小樣本和各領域詴題數不長時之真實資料同樣的可以計算得到在詴

題參數估計上 RMSE(root mean square error)的帄均標準差HO-IRT 模式比

CU-IRT 模式來得小或相等另外在單一整體量尺和多個彼此有關聯之領域量

尺的能力值估計上HO-IRT 模式也優於 CU-IRT 模式

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 36: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

28

第三章 研究方法

本研究使用 HO-IRT 模式建立國小六年級學童小數的除法能力之測驗驗

證 HO-IRT 模式是否可以應用於小數的除法能力測驗並透過 HO-IRT 模式了

解整體量尺--小數的除法能力與領域量尺--知道應用推理間的關係本

章共分為四節第一節研究設計第二節研究流程第三節研究對象和第四節

研究工具

第一節 研究設計

本研究自編一份國小六年級學童小數的除法測驗並參考林佳樺(2009)

所探討之 HO-IRT 估計模式透過實證資料方式探討完整估計與分開估計之估

計效果並以 AICBIC 和 DIC 指標來檢驗 HO-IRTMIRT_CMIRT_U 和

UIRT 四種模式之適配度作為模式選用之依據用統計軟體進行各階層之分開

估計及兩階層之完整估計接著比較 UIRTMIRT_C 和 MIRT_U 的分開估計與

HO-IRT 完整估計的成效

壹自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分大型測驗大多屬於多向

度測驗多向度測驗又分為題間多向度測驗和題內多向度測驗本研究自編之

國小六年級學生之小數的除法測驗為二元計分共有 24 題測驗之詴題設計為

題間多向度測驗

貳模式估計

本研究用來做測驗參數估計的模式有 UIRTMIRT_UMIRT_C及 HO-IRT

四種本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 37: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

29

領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)應用(L2)

和推理(L3)

UIRT模式是指估計整體量尺的能力如圖 3-1-1MIRT_U模式是指用UIRT

來估計 MIRT 的模式也就是將各個領域量尺視為獨立如圖 3-1-2L1包含

X01到 X09和 X17也就是詴題 1 到 9 和詴題 17 L2包含 X10到 X13 X15

X19 X20 X22和 X24也就是詴題 10 到 13 和詴題 1519202224 L3

包含 X14X16X18X21和 X23也就是詴題 14161821 和詴題 23MIRT_C

模式也是用 UIRT 來估計 MIRT 的模式但各個領域量尺之間彼此有關聯L1

包含 X01到 X09和 X17L2包含 X10到 X13 X15 X19 X20 X22和 X24L3

包含 X14X16X18X21和 X23如圖 3-1-3HO-IRT 模式是指同時估計整體量

尺和領域量尺的能力 X01到 X09和 X17是估計 L1X10到 X13 X15 X19

X20 X22和 X24是估計 L2X14X16X18X21和 X23是估計 L3 1 2

和 3

分別代表 L1L2和 L3與 H 間的相關係數如圖 3-1-3

圖 3-1-1 UIRT 模式

X01-09 X17

X10-13

X15 X19 X20

X22 X24

X14 X16 X18

X21X23

整體量尺

小 數 的 除 法 (H)

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 38: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

30

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-3 MIRT_C之題間多向度模式

推 理 (L3)

X01-09

X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

領域量尺

知 道 (L1)

應 用 (L2)

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21

X23

X01-09

X17

領域量尺

應 用 (L2)

推 理 (L3)

知 道 (L1)

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 39: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

31

圖 3-1-4 HO-IRT 之題間多向度模式

最後將 UIRT 和 HO-IRT 估計出的參數值及 MIRT_UMIRT_C 和 HO-IRT

估計出的參數值做相互比較探討不同模式在估計上是否有一致性HO-IRT 之

完整估計成效是否較佳

參模式檢定

應用 IRT 模式進行測驗資料的分析若想要獲得該模式所提供的優勢則

必頇先確定資料與模式之間的適配度是合適的謝典佑等(2009)利用貝葉斯

架構(Bayes framework)下的 Akaikersquos information coefficient (AIC)Bayesian

information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標

驗證 HIRT 架構下的測驗資料以了解 AICBIC 和 DIC 三種指標在 HO-IRT

模式之詴題反應函數(item response function IRF)選擇的效果

本研究採用 Congdon(2003)基於貝葉斯架構的 AICBIC 與 DIC 三種指標

X01-09 X17

X10-13

X15 X19

X20 X22

X24

X14 X16

X18X21X

23

1

領域量尺 整體量尺

知 道 (L1)

應 用 (L 2)

推 理 (L 3)

3

2

小 數 的 除 法 (H)

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 40: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

32

探究在 HO-IRTMIRT_UMIRT_C和 UIRT 模式下哪一種模式與測驗資料

之間的適配度是合適的三種指標的定義如下(引自謝典佑等2009)

一 AIC 指標是指統計上模式之相對適配度的測量

pdM o d e lA I C 2)(

d 為偏差對一個模式而言偏差的值較小表示資料與模式的適配度較

好d 是minus2timeslog(最大概似法maximum likelihood) p 為模式中的參數量

本研究之參數量有一個主要量尺三個次級量尺一個詴題難度參數和三個

迴歸參數一共八個參數量

二 BIC 指標在不同類別之參數量中模式選擇的一種指標

N)p(dModelBIC log)(

N 為樣本數本研究樣本數為 538 人

三 DIC 指標AIC 和 BIC 的一般化階層式模式的指標以 MCMC 模擬方法

獲得後設分配且當後設分配是多元常態分配時DIC 指標才有價值

DD PDpDM o d e lD I C 2)()()(

)(D 為後設模式之帄均偏差是一種模式適配度的 Bayesian 測量而

)(D 為後設模式之偏差 Dp 為模式中的自由參數量 )()( DDPD 以

DIC 的最小值作為模式的選擇是觀察一組複製相同結構之資料的最好預測

此外DIC 的優點是從樣本中以 MCMC 模擬方法很容易就能算出指標值

第二節 研究流程

本研究之流程首先研讀相關文獻以擬定研究主題而後就研究主題蒐集

相關資料做為理論基礎編製測驗並敦請專家檢核詴題修題接著進行組卷

和施測再將收集到的紙筆測驗結果進行分析並做出結論最後撰寫研究報

告如圖 3-2-1

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 41: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

33

圖3-2-1 測驗編製與實驗程序圖

第三節 研究對象

本研究測驗採立意取樣題目為選擇題共 24題對象為九十八學年度六

年級學生包括中部四縣市共 18個班級有效樣本共計 538人人數來源如表

3-3-1

相關文獻探究

分析六年級數學小數的除

法內容

將紙筆測驗結果進行分析

資料和模式的比較與分析

撰寫研究報告

確立研究目的與問題

編製詴題

進行組卷

評估測驗成效

敦聘專家檢核詴題修題

正式施測

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 42: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

34

表 3-3-1 樣本人數來源表

樣本人數

學校代碼 班級數 男生 女生 小計

台中市 A 國小 9 154 120 274

南投縣 B 國小 4 63 47 110

台中縣 C 國小 3 47 48 95

台中縣 D 國小 2 35 24 59

合計 18 299 239 538

第四節 研究工具

本研究使用的工具有 MATLAB 軟體WinBUGS 軟體SPSS 軟體與自編

之六年級數學領域小數的除法測驗

壹MATLAB 7

本研究使用 Matlab 撰寫程式因為 Matlab 的程式語法簡單並具有強大

的函數庫功能可評估測驗模式之成效

貳WinBUGS

WinBUGS統計軟體使用方法很彈性WinBUGS軟體可應用的模式相當廣

泛包括一般線性和非線性模式處理連續和非連續性資料及多變量模式

(Cowles 2004 Qiu Song amp Tan 2002 Sturtz Ligges amp Gelman 2005)本研

究使用WinBUGS軟體進行單一階層能力估計與完整估計

參SPSS

本研究以電腦統計套裝程式 SPSS 軟體進行本測驗之信度分析分析測

驗內部一致性的數值

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 43: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

35

肆自編測驗

本研究採用自編之六年級數學領域小數的除法測驗在編寫測驗之前以

TIMSS 評量架構中的認知向度為依據並確認單元教學目標內所包含的節點進

行命題詴題編製完成後敦聘數學教育專家及數位國小教師進行審題接著進

行組卷當測驗題目完成後進行詴題的項目分析

一測驗編製依據

研究者分析九年一貫課程的教材後訂定小數的除法能力為本測驗的主要量

尺再依據教材內容分析出三個次級量尺分別為知道應用及推理等三個認知

能力本測驗有 24 題為詳細了解學童的作答情形每題並給予空白處讓學童

將運算過程詳細紀錄採二元計分方式計分完整測驗詴卷如附錄一

二施測

當測驗題目完成後接著進行施測及詴題的項目分析測驗採立意取樣施

測對象為九十八學年度就讀之六年級學生有中部四縣市共 18 個班級有效樣

本共計 538 人

(一)難度

本研究之測驗以通過率表示難度計算全體受詴者在該題答對人數的比

率稱之為難度指數(item difficulty index)難度指數愈高代表該題愈容易

反之則代表該詴題愈難難度指數計算公式如下

N

RP P難度指數 R答對人數 N 全體受詴者

(二)鑑別度

詴題鑑別度是指能夠區別高低能力學習者的程度本研究使用古典測驗理

論來考驗詴題得分與測驗總分的同質性作為詴題鑑別度的依據

(三)信度

本測驗的信度採用 Cronbach α 係數作為分析測驗內部一致性之估計方法

(四)效度

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 44: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

36

本測驗之效度採用的是內容效度及專家效度分析本研究邀請具有教學及

測驗編製經驗的專家學者與現任國小教師一同開會討論依據九年一貫課程數學

領域六年級課程內容及詴題編製原則來編製小數的除法測驗之詴題詴題完

稿後再經討論檢核詴題編製合宜並提供修改測驗工具的建議使本研究有良好

的專家效度

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 45: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

37

第四章 研究結果 本章根據研究目的進行資料分析之結果與討論共分為四節第一節為小

數的除法測驗分析第二節為模式適配度指標的分析比較第三節為整體量尺與

領域量尺間的關係第四節為HO-IRT完整估計與MIRT_UMIRT_C及UIRT分開

估計之模式分析結果

第一節 小數的除法測驗分析

在本研究中編製國小六年級數學小數的除法能力測驗是相當重要的一部

分本研究以現行九年一貫課程綱要數學領域中六年級之小數的除法為主要測

驗內容進行紙筆測驗詴卷經施測後分析作答情形在測驗內部一致性的數值

Cronbach α係數值為079具有良好的測驗信度顯示本測驗結果有良好的內部

一致性

本研究之測驗以通過率表示難度測驗之帄均難度值為0549其中詴題11

13通過率較低詴題46通過率較高本測驗詴題之帄均鑑別度值為0328如表

4-1-1另外本研究發現TIMSS 2007評量架構應用在國小六年級學生之數學成就

調查在認知領域方面學生表現最好的是知道領域帄均答對率為0684其次

是應用領域帄均答對率為0456表現較差的是推理領域帄均答對率為0447

與相關文獻之研究結果相同

表4-1-1 詴題之難度和鑑別度

認知領域 詴題編號 難度 鑑別度

知道

01 0764 0379

02 0755 0320

03 0721 0390

04 0905 0330

05 0766 0355

06 0812 0459

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 46: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

38

認知領域 詴題編號 難度 鑑別度

07 0749 0370

08 0398 0187

09 0496 0304

17 0474 0176

帄均 0684

應用

10 0732 0453

11 0212 0137

12 0387 0340

13 0279 0294

15 0563 0434

19 0643 0342

20 0429 0357

22 0457 0404

24 0437 0318

帄均 0456

推理

14 0539 0426

16 0392 0288

18 0517 0374

21 0377 0227

23 0413 0307

帄均 0447

總帄均 0549 0328

第二節 模式適配度指標的分析比較

HO-IRTMIRT_UMIRT_C及UIRT四種模式之適配度指標AICBIC和DIC

的分析數據如表4-2-1數值較低者較適合做為模式之選擇AICBIC和DIC三

種指標皆顯示HO-IRT模式與本測驗資料之分析較為適配

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 47: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

39

表 4-2-1 各模式指標的分析結果

第三節 整體量尺與領域量尺間的關係

HO-IRT 模式中迴歸參數表示整體量尺與領域量尺間的相關在教育測驗

的應用上整體量尺與領域量尺間皆為正相關範圍在 0~1 之間由表 4-3-1

可發現 HO-IRT 模式的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--

小數的除法能力與三個領域量尺--知道應用推理間的相關程度很高且迴

歸參數 2 和 3

的值也都相當高顯示小數的除法能力與第二個領域量尺( 2 )

--應用和第三個領域量尺( 3 )--推理的相關程度比第一個領域量尺( 1

)--

知道來得高亦即在小數的除法測驗中小數的除法能力對應用和推理能力的

影響較大

表 4-3-1 HO-IRT 迴歸參數()比較表

HO-IRT 迴歸參數 1

2 3

08240 09822 09733

模式

指標 UIRT MIRT_U MIRT_C HO-IRT

AIC 17024 16803 16187 15538

BIC 17148 16987 16311 15663

DIC 17407 18776 17879 16854

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 48: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

40

第四節 HO-IRT完整估計與MIRT_UMIRT_C及

UIRT分開估計之模式分析結果

本研究使用 UIRTMIRT_UMIRT_C及 HO-IRT 四種模式來估計學生在

小數的除法測驗中整體量尺領域量尺及詴題難度的參數值並做相互比較

使用 UIRT 進行整體量尺--小數的除法能力及詴題難度參數之估計學生小數的

除法能力估計値詴題難度參數如表 4-4-1

使用 MIRT_UMIRT_C進行三個領域量尺--知道應用推理及詴題難度

參數之估計MIRT_UMIRT_C估計領域量尺時因編製測驗時的評量架構為

題間多向度測驗所以分析資料時採用題間多向度測驗MIRT_UMIRT_C

之題間多向度測驗的三個領域量尺--知道應用推理之估計値詴題難度參

數如表 4-4-1

使用 HO-IRT 進行完整估計整體量尺--小數的除法能力及三個領域量尺--知

道應用推理及詴題難度參數HO-IRT 進行完整估計時亦因編製測驗時的

評量架構為題間多向度測驗所以分析資料時亦採用題間多向度測驗HO-IRT

題間多向度測驗之整體量尺及三個領域量尺的估計値迴歸參數值 λ 如表

4-3-1詴題難度參數如表 4-4-1綜合比較結果如下

壹各模式在詴題難度參數的估計比較

將 UIRTMIRT_UMIRT_C及 HO-IRT 與詴題難度參數做比較發現 UIRT

MIRT_UMIRT_C及 HO-IRT 四種模式在詴題難度參數的估計上有很高的一

致性如表 4-4-1各模式皆顯示詴題 46 是較容易的詴題詴題 11 難度較高

再把學生測驗的詴卷拿來比對學生在詴題 46 的答對率高達 80以上在

詴題 11 的答對率僅有 18從四種模式的詴題難度參數之帄均數及標準差來

看其估計值也有很高的一致性依據本研究的實證資料分析顯示UIRT

MIRT_UMIRT_C及 HO-IRT 在整體量尺--小數的除法能力和三個領域量尺--

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 49: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

41

知道應用推理與詴題難度的估計皆有一致性

表4-4-1 各模式詴題難度參數比較表

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

4 0905 -25242 -26007 -25975 -26052

6 0812 -16852 -17313 -17232 -17245

5 0766 -13591 -14070 -13994 -14046

1 0764 -13544 -13959 -13860 -13953

2 0755 -12970 -13451 -13300 -13383

7 0749 -12573 -12985 -12903 -13046

10 0732 -11692 -11995 -12103 -11883

3 0721 -10866 -11320 -11201 -11320

19 0643 -06820 -07033 -07203 -07121

15 0563 -02894 -03227 -03215 -03244

14 0539 -01727 -01942 -01816 -01937

18 0517 -00630 -00936 -00821 -00984

9 0496 00294 00332 00469 00361

17 0474 01361 01119 01511 01105

22 0457 02130 01911 02079 01868

24 0437 03219 02980 03094 02886

20 0429 03502 03227 03374 03246

23 0413 04356 04044 04401 04093

8 0398 05076 05121 05274 05167

16 0392 05295 05136 05278 05014

12 0387 05586 05339 05628 05319

21 0377 06003 05957 06128 05806

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 50: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

42

編號 詴題難度 UIRT MIRT_U MIRT_C HO-IRT

13 0279 11384 11188 11510 11125

11 0182 17603 17567 17931 17379

帄均數 -05641 -05921 -05780 -05943

標準差 10148 10300 10385 10265

貳各模式在整體量尺及領域次級量尺的估計比較

一UIRT 與 HO-IRT 在整體量尺的估計參數比較

發現學生在小數的除法能力估計值上UIRT 和 HO-IRT 估計的整體量尺相

關係數為 098如表 4-4-2顯示 HO-IRT 與 UIRT 在整體量尺--小數的除法

能力的估計上有很高的一致性再將受詴者依低中高分組來做分析發現

學生在整體量尺--小數的除法能力估計值上UIRT 和 HO-IRT 差異不大以學

生測驗得分和 UIRT 及 HIRT 對學生小數的除法能力估計值相比較發現得分

低的學生在 UIRT 及 HO-IRT 估計下其小數的除法能力估計值也低得分高

的學生其小數的除法能力估計值也高如表 4-4-3

表 4-4-2 UIRT 和 HO-IRT 在整體量尺(H)上之相關係數

UIRT HO-IRT

UIRT 1 098

HO-IRT 1

表 4-4-3 UIRT 與 HO-IRT 在整體量尺(H)的估計參數表(部分)

受詴者編號 得分() UIRT HO-IRT

6489 8 -21774 -19915

6036 8 -21869 -18291

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 51: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

43

受詴者編號 得分() UIRT HO-IRT

6307 13 -19109 -18800

6039 13 -18873 -18291

6451 17 -17095 -16126

6031 17 -17066 -15214

6293 21 -14790 -16849

6521 21 -14691 -14049

6534 25 -13348 -11951

6098 25 -13109 -12145

6409 29 -10607 -13382

6132 29 -10583 -09950

6453 33 -09391 -08983

6507 33 -09294 -06771

6430 38 -07041 -11234

6177 38 -06994 -08178

6495 42 -05978 -06567

6075 42 -05832 -08546

6215 46 -03475 -03435

6449 46 -03272 -05912

6227 50 -02385 -03455

6382 50 -02346 -01902

6112 54 -00111 -00061

6444 54 -00027 -00817

6303 58 00873 02217

6530 58 01124 -02320

6379 63 03559 01538

6011 63 03720 03006

6429 67 04497 04750

6529 67 04627 01640

6247 71 07221 07131

6330 71 07255 08092

6536 75 08529 09800

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 52: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

44

受詴者編號 得分() UIRT HO-IRT

6503 75 08530 06939

6404 79 10906 09654

6074 79 10925 12981

6253 83 12594 11855

6254 83 12688 14207

6115 88 15635 14187

6027 88 15688 14459

6135 92 17579 16863

6064 92 17657 16444

6260 96 21017 18364

6235 96 21227 19222

6446 100 24401 21230

二MIRT_UMIRT_C與 HO-IRT 在三個領域量尺的估計參數比較

MIRT_UMIRT_C與 HO-IRT 在學生的三個領域量尺--知道應用推理

的估計值上MIRT_U 與 HO-IRT 的 L1L2L3相關值分別為 092090081

MIRT_C 與 HO-IRT 的 L1L2L3相關值分別為 098097095都有很高的

一致性且 MIRT_C與 HO-IRT 之相關程度優於 MIRT_U 與 HO-IRT 之相關程

度如表 4-4-4顯示 HO-IRT 與 MIRT_C在三個領域量尺的估計上有相當高的

一致性再將受詴者依低中高分組來做分析發現學生在三個領域量尺的

能力估計值上MIRT_UMIRT_C和 HO-IRT 差異不大以學生各分測驗得分

和 MIRT_UMIRT_C及 HO-IRT 的三個領域量尺的能力估計值相比較發現得

分低的學生在 MIRT_UMIRT_C及 HO-IRT 估計下其三個領域量尺的能力估

計值也低得分高的學生其三個領域量尺的能力估計值也高如表 4-4-5

表 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在三個領域量尺之相關係數比較

L1 L2 L3

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 53: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

45

MIRT_U 和 HO-IRT 092 090 081

MIRT_C和 HO-IRT 098 097 095

表 4-4-5 MIRT_UMIRT_C 和 HO-IRT 在領域量尺的估計參數表(部分)

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6425 8 -2082 -2302 -2413 -1603 -2034 -2330 -0554 -1368 -2234

6225 13 -2056 -2193 -2144 -1198 -1623 -1847 -0571 -1206 -1797

6386 17 -1356 -1527 -1700 -1207 -1510 -1857 -1098 -1498 -1863

6293 21 -1008 -1289 -1474 -1595 -1752 -1708 -0543 -1140 -1639

6534 25 -0977 -1167 -1206 -1177 -1332 -1210 -0637 -1032 -1167

6418 29 -0656 -0879 -0967 -0763 -1037 -1126 -1129 -1282 -1167

6476 29 -0682 -0899 -0961 -1638 -1559 -1170 -0086 -0601 -1046

6128 33 -0655 -0778 -0894 -0755 -0900 -0976 -0681 -0852 -0995

6042 33 -0678 -0825 -0864 -0852 -0962 -0879 -0577 -0833 -0892

6030 38 -0648 -0734 -0841 -0369 -0516 -0870 -0615 -0704 -0899

6352 38 -0350 -0537 -0815 -0759 -0842 -1148 -0585 -0805 -1105

6147 42 -0279 -0412 -0457 -0406 -0547 -0487 -0630 -0714 -0499

6034 42 0020 -0171 -0295 -1139 -0993 -0626 -0101 -0358 -0532

6029 46 0024 -0147 -0211 -0761 -0685 -0412 -0147 -0284 -0324

6266 46 0017 -0149 -0202 -0405 -0508 -0395 -0619 -0644 -0448

6333 50 0438 0213 0011 -0779 -0634 -0435 -0131 -0243 -0395

6268 50 0451 0246 0021 -0380 -0369 -0303 -0607 -0555 -0344

6511 54 0423 0307 0106 0015 -0004 -0193 -0583 -0382 -0223

6143 54 0439 0303 0108 -0387 -0295 -0205 -0064 -0109 -0170

6096 58 0448 0395 0302 -0397 -0163 0208 0448 0337 0259

6538 58 0757 0569 0506 -0443 -0278 0101 -0173 -0115 0103

6517 63 0871 0708 0539 -0760 -0347 0130 0855 0698 0269

6520 63 0789 0686 0671 -0412 -0127 0294 0376 0382 0350

6497 67 0856 0828 0679 -0016 0194 0355 0373 0441 0404

6473 67 0869 0857 0634 0710 0661 0344 -0610 -0157 0230

6127 71 0839 0873 0840 0295 0496 0716 0400 0551 0745

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 54: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

46

模式

受詴者

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

MIRT

_U

MIRT

_C

HO-

IRT

編號 得分 L1 L2 L3

6179 71 0818 0841 0878 0346 0510 0792 0372 0564 0779

6536 75 0828 0903 1014 0290 0592 0931 0807 0909 0995

6086 75 0858 0979 1023 0347 0652 0956 0850 0988 0990

6494 79 0864 1025 1092 0350 0700 1041 1338 1379 1126

6262 79 0873 1061 1144 0624 0903 1205 0899 1069 1197

6190 83 0874 1173 1202 1470 1556 1312 0375 0880 1224

6468 83 1315 1503 1444 0670 0977 1212 0829 1088 1257

6027 88 1334 1558 1557 1399 1603 1465 0317 0911 1376

6238 92 1305 1692 1759 1051 1474 1791 1405 1732 1852

6106 96 1286 1784 1838 1500 1925 1904 1351 1880 1931

6446 100 1295 1942 1982 1913 2316 2121 1391 2071 2118

三MIRT_UMIRT_C和 HO-IRT 在各領域量尺間相關係數之比較

因 MIRT_U 模式是以 UIRT 來估計 MIRT 的模式也就是將各個領域量尺

視為獨立所以 L1L2L2L3L1L3彼此間所估計出來的相關係數並不高

分別為 051056 和 046如表 4-4-6MIRT_C模式也是 MIRT 的模式各個

領域量尺兩兩之間彼此有關聯因而估計出來 L1L2L2L3L1L3彼此間

的相關係數還算高分別為 079087 和 077如表 4-4-6而 HO-IRT 模式估

計出來 L1L2L2L3L1L3彼此間的相關係數皆非常高分別為 093100

和 093如表 4-4-6因各個領域量尺兩兩間應有關聯所以MIRT_U 模式的

估計是較不適合的

表 4-4-6 MIRT_UMIRT_C 和 HO-IRT 在各領域量尺間相關係數之分析比較

L1L2 L2L3 L1L3

MIRT_U 051 056 046

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 55: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

47

MIRT_C 079 087 077

HO-IRT 093 100 093

四全體受詴者在整份測驗中整體量尺和領域量尺的表現情形

(一)UIRT 和 HO-IRT 模式估計整體量尺的能力之表現情形

以 UIRT 和 HO-IRT 模式估計全體受詴者在整體量尺的能力值與原始作答

反應之散佈情形因 UIRT 模式是以單參數 Rasch 模式估計全體受詴者在此份

測驗的整體表現所以所估計出來全體受詴者的能力值較集中而 de la Torre

Hong(2010)以 HO-IRT 模式估計全體受詴者整體量尺的能力值時考慮到

單一整體量尺和多個領域量尺彼此間有關聯因此所估計出來的整體能力值

HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT 模式所估

計出來全體受詴者的能力值較分散如圖 4-4-1顯示 HO-IRT 模式較能真實的

估計出全體受詴者在整份測驗中整體量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 4 8 12 16 20 24

答對題數

能力值

HIRT

UIRT

圖 4-4-1 UIRT 和 HO-IRT 整體量尺能力值與答對題數之散佈圖

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 56: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

48

(二)MIRT_UMIRT_C和 HO-IRT 模式估計領域量尺的能力之表現情形

以 MIRT_UMIRT_C和 HO-IRT 模式估計全體受詴者在領域量尺的

能力值與原始作答反應之散佈情形因 MIRT_U 的估計方法同 UIRT 模式都

是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現所以所

估計出來全體受詴者在各領域量尺的能力值表現情形都非常集中MIRT_C雖

然也是以單參數 Rasch 模式估計全體受詴者在各領域測驗的整體表現但因

考慮各領域之間的能力表現彼此有關聯因此所估計出來全體受詴者在各領

域量尺的能力值表現情形都較 UIRT 模式分散但也都較 HO-IRT 模式來得集

中de la Torre Hong(2010)以 HO-IRT 模式估計受詴者的能力值時考慮到

整體量尺和多個領域量尺彼此間有關聯因此所估計出來受詴者的各領域量

尺能力值HO-IRT 模式優於一般單向度 IRT(CU-IRT)模式也因此HO-IRT

模式所估計出來全體受詴者的各領域量尺能力值最為分散如圖 4-4-24-4-3

4-4-4顯示 HO-IRT 模式較能真正的估計出全體受詴者在整份測驗中各領域

量尺之能力的表現情形

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-2 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L1的能力值與答對題數

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 57: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

49

-3

-2

-1

0

1

2

3

0 2 4 6 8 10

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-3 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L2的能力值與答對題數

之散佈圖

-3

-2

-1

0

1

2

3

0 1 2 3 4 5 6

答對題數

能力值

HIRT

MIRT_C

MIRT_U

圖 4-4-4 MIRT_UMIRT_C 和 HO-IRT 在領域量尺 L3的能力值與答對題

數之散佈圖

之散佈圖

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 58: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

50

第五章 結論與建議

本章分二節第一節為研究結論第二節為研究建議就本研究未盡完備

之處提供相關研究建議以供後續研究者參考

第一節 研究結論

壹自編小數的除法測驗信度和效度佳

本研究使用 HO-IRT 模式建立之小數的除法測驗其內部一致性的數值

Cronbach α 係數值為 079顯示有良好的測驗信度效度採用的是內容效度及

專家效度分析在測驗編製過程中均與有測驗編製經驗的專家學者及現任國

小教師一同開會討論進行詴題內容與測驗編排的審核和修訂詴題完稿後再

經討論檢核詴題之編製

貳HO-IRT 模式較適合分析高階層評量架構之測驗

比較 HO-IRTMIRT_CMIRT_U 及 UIRT 四種模式適配度的 AICBIC

和 DIC 三種指標HO-IRT 的指標值都較 MIRT 及 UIRT 來得低顯示 HO-IRT

模式與本測驗資料之分析較為適配

參HO-IRT 模式顯示小數的除法能力與應用和推理相關較高

HO-IRT 的三個迴歸參數值都在 08 以上顯示本測驗的整體量尺--小數的

除法能力與三個領域量尺--知道應用推理間的相關程度高在迴歸參數 2 和

3 的值較高顯示第二個領域量尺( 2

)--應用和第三個領域量尺( 3 )--推理

與小數的除法能力相關比第一個領域量尺( 1 )--知道要來得高亦即在小

數的除法測驗中小數的除法能力對應用和推理的影響較大和大部分的文獻

探討結果相似學生在應用和推理的通過率都表現較差

肆HO-IRT 模式的分析結果佳

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 59: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

51

本研究的實證資料研究結果發現HO-IRTMIRT 及 UIRT 在整體量尺--

小數的除法能力和三個領域量尺--知道應用推理的估計皆有相當高的一致

性且 HO-IRT 之完整估計模式優於 MIRT 及 UIRT 之分開估計模式較能估計

出受詴者的真正能力

第二節 研究建議

壹詴題編製

本研究在測驗的編製內容上只針對數學內容中數與量的有理數部份進行

出題建議未來研究者可擴大出題範圍在數與量這方面進行探究另外本

測驗的詴題都是選擇題後續研究者可以朝向編製建構式反應詴題來探討模

式的適配度是否有差異

貳測驗使用的 HO-IRT 和 MIRT 估計模式

本研究測驗的估計模式僅使用HO-IRT和MIRT模式中的題間多向度作分

析未來可編製題內多向度測驗並估計之另外本研究探討以TIMSS 2007數學

評量架構中認知領域為領域量尺的高階層詴題反應後續研究者可朝向TASA

PISANAEP等大型的測驗探討模式的參數估計是否有差異

參計分方式

本研究之計分型態屬於二元計分後續研究者可延伸研究至多點計分或二

元計分與多點計分之混合探討模式參數估計的精準度是否有差異

肆結合電腦科技

由於本研究仍屬於紙筆測驗在施測上耗費較多的人力和物資也不夠環

保後續研究者可以朝向電腦化測驗進行探討

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 60: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

52

參考文獻

中文部分

方建彰(2006)探討不同語言結構對學生在科學上的答題影響-以TIMSS

2003詴題為例國立台灣師範大學科學教育研究所碩士論文未出版

艾如昀(1994)國小學生處理小數的歷程與困難國立中正大學心理研究所碩

士論文未出版

朱欣傑(2009)探討國小學童小數四則運算的了解台北市立教育大學數學教

育資訊研究所碩士論文

余民寧(1992a)詴題反應理論的介紹(二)ndash測驗理論的發展趨勢研習資訊

9(1)5-9

余民寧(1992b)詴題反應理論的介紹(三)-詴題反應模式及其特性研習資訊

9(2)6-10

杜建台(1996)國小中高年級學童小數概念理解之研究國立台中師範學院國

民教育研究所碩士論文

吳昭容(1996)先前知識對國小學童小數概念學習之影響國立台灣大學心理

學研究所博士論文未出版

周素芳(2008)TIMSS 2007評量架構在台灣國小學童數學成就評量發展模式之

應用國立臺北教育大學數學教育研究所碩士論文

周筱亭(1990)電子計算器對於國民小學小數運算學習之影響(Ⅰ)國教學

報(3)273-287

林佳樺(2009)高階層詴題反應理論及其成效探討國立臺中教育大學教育測

驗統計研究所碩士論文

林軍治(1986)兒童數學學習之心理基礎台灣省教育廳

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 61: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

53

邱美珍(2008)以多向度詴題反應理論量測兒童步行上放學知能力國立交通

大學運輸科技與管理學系碩士論文

陳永峰(1998)國小六年級學童小數知識之研究國民教育研究(3)337-373

教育部(2003)國民中小學九年一貫課程綱要數學學習領域台北市教育部

台國字第0920167129號

康昆利(2004)國小六年級小數概念動態評量的效益分析國立台北師範學院

數理教育研究所碩士論文

張淑萍(2006)一位教師實踐五年級小數教學之行動研究國立新竹教育大學

應用數學教育研究所碩士論文

張勝凱(2010)使用HIRT模式建立國小六年級學童數學推理能力測驗國立臺

中教育大學教育測驗統計研究所碩士論文

蔡志隆(2008)TIMSS 2007評量架構應用在金門縣國小學童數學成就之調查研

究國立臺北教育大學數學教育研究所碩士論文

劉曼麗(1998)國小數學新課程對「小數」概念的處理方式屏師科學教育(7)

41-48

劉曼麗(2002)台灣地區國小學童小數概念研究(Ⅱ)國小學童「小數與小數

運算」概念之調查研究國科會補助之專題計畫成果報告編號(NSC

90-2521-S-153-003)

劉曼麗(2004)九年一貫數學領域分數與小數能力指標的詮釋子計畫三----小

數行政院國家科學委員會專題研究計畫成果報告編號

(NSC 92-2521-S-153-008)

劉曼麗(2008)小數除法的學與教科學教育月刊(314)27-38

賴文溥(2009)國小六年級學童小數除法概念結構分析之研究國立臺中教育

大學數學教育研究所碩士論文

鮑健生(2004)以TIMSS看影響學生數學成就的因素上海上海教育

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 62: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

54

謝典佑林佳樺郭伯臣施淑娟(2009)單因子高層次 IRT 模式適合度檢定

之研究以 TASA 數學科為例「大型教育資料庫建置及相關議題」學術研討

會國立臺中教育大學

簡茂發劉湘川(1993)八十一年度國民教育階段學生基本學習成就評量國小

組詴題編製及抽測結果報告台中市國立台中師範學院

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 63: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

55

英文部分

Adams R J Wilson M amp Wang W C (1997) The multidimensional random

coefficients multinomial logit model Applied Psychological Measurement 21

1-23

Bell A Swan M amp Taylor G (1981) Choice of operation in verbal roblems with

decimal numbers Educational Students in Mathematics 12 399-420

Congdon P (2003) Applied Bayesian modelling New York John Wiley

CowlesMK(2004) Review of WinBUGS 14 The American Statistician 58

330-336

de la Torre J amp Song H (2009) Simultaneous estimation of overall and domain

abilitiesA higher-order IRT model approach Applied Psychological

Measurement 33(8)620-639

de la Torre J amp Yuan Hong (2010) Parameter estimation with small sample size a

higher-order IRT model approach Applied Psychological Measurement

34(4)267-285

Fischbein E Deri M amp Marino M (1985) The role of implicit models in

multiplication and division Journal for Research in Mathematics Education 16

3-7

Hiebert J(1992)Mathematical cognitive and instructional analyses of decimal

FractionsIn G Leinhardt R Putnam amp R A Hattrup (Eds)Analysis of

Arithmetic for mathematics teaching 283-322 Hillsdale NJLEA

Hiebert J amp Wearne D(1986) Procedures over concepts The acquisition of decimal

number knowledge In JHiebert(Ed) Conceptual and procedural

knowledgeThe case of mathematics199-222 HillsdaleNJ Lawrence Erlbaum

Associates

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 64: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

56

Hiebert J amp Wearne D (1988) A cognitive approach to meaningful

mathematics instruction Testing a local theory using decimal numbers

Journal for Research in Mathematics Education 19(5) 371-384

Hoskens M amp De Boeck P (1997) A parameteric model for local dependence

among test items Psychological methods 2 261-277

Lee J Grigg W amp Dion G (2007) The Nationrsquos Report Card Mathematics 2007

National Center for Education Statistics Institute of Education Sciences US

Department of Education Washington DC

Martin MO Gregory KD amp Stemler SE (Eds) (2000) TIMSS 1999 Technical

Report Chestnut Hill MA TIMSS amp PIRLS International Study Center Boston

College

Mullis IS Martin MO Ruddock GJ OrsquoSullivan CY Arora A amp Ebru E

(2005)TIMSS 2007 assessment frameworks Chestnut Hill MATIMSS amp

PIRLSInternational Study Center Boston College

Mullis I V S Martin M O amp Foy P (2008) TIMSS 2007 international

mathematics report Findings from IEArsquo s trends in international mathematics

and science study at the fourth and eighth grades Chestnut Hill MA TIMSS amp

PIRLS International Study Center Boston College

Ina VS Mullis Michael O Martin Graham J Ruddock Christine Y O`Sullivan

Alka Arora Ebru Erberber (2007) TIMSS 2007 Assessment Frameworks

Chestnut Hill MA Boston College

Qiu Z Song P X-K amp Tan M (2002) Bayesian hierarchical models for

multi-level repeated ordinal data using WinBUGS Journal of Biopharmaceutical

Statistics 12 121-135

Sturtz S Ligges U amp Gelman A (2005) R2WinBUGS A package for running

WinBUGS from R Journal of Statistical Software 12 1-16

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 65: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

57

httptimsssecntnuedutwtimss2007serotc2007_4asp

Wang W Wilson M amp Cheng Y (2000) Local Dependence between Latent Traits

when Common Stimuli are Used Paper presented at the International Objective

Measurement Workshop New Orleans LA

Weiss D amp Yoes M (1991) Item Response Theory In R K Hambleton amp J Zall

(Eds) Advances in educational and psychological testing Boston

Kluwer-Nijhoff

Wilson M amp Adams R J(1995) Rasch models for item bundles Psychometrika

60 181-198

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 66: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

58

附錄一國小六年級數學推理能力詴卷

六年級數學 第 9單元小數的除法 性別男 女

縣(市) 國小 六 年 班 姓名 座號 一選擇題請寫計算過程(1~24

題每題 4 分)

( )1 算式「18divide09=20」中若被

除數與除數同時乘以 10 之

後商是多少

02 2 20 200

計算過程

( )2 下列各式中哪一個式子的商

小於被除數

A (05divide025) B (15divide15)

C (10divide05) D (325divide09)

A B C D

計算過程

( )3 已知「449006divide454=989」則

下列算式何者正確

A 449006divide454=989 B

449006divide454=989

C 4490060divide454=9890 D

449006divide4540=9890

E 449006divide454=989

AC BDE A

BC ABCE

計算過程

( )4 計算「15divide08=( )」答案是

多少

18 186 1875

1875

計算過程

( )5 計算「12divide125=( )」答案是

多少

0096 96 975

96

計算過程

( )6 計算「6858divide0254=( )」答

案是多少

027 27 27 270

計算過程

( )7 計算「3196divide047=( )」答

案是多少

0068 068 68

68

計算過程

( )8 計算「2667divide43=

( )hellip( )」求商到小數第一

位餘數是多少

0001 0087 087

87

計算過程

( )9 計算「26divide3125=

( )hellip( )」求商到個位餘

數是多少

01 1 26 26

計算過程

( )10 吳大一走南二高從台中到台

南汽車內的里程儀器表從

14520 轉到 14685用去了 125

公升的汽油請算出在高速公

路上帄均每公升的汽油可行駛

多少公里

132 132 1325

132

計算過程

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 67: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

59

依下列敘述回答 11~13 題

憶蓉老師帶學生做科展研究的主題是

「多少濃度的鹽水能讓蛤蠣的吐沙量

達到最大」

( )11 甲杯要調出濃度 8的鹽水溶

液那麼 5 公克的鹽要加入多

少毫公升的水解決這個問題

的算式應該下列哪一個

5divide008 5divide008-5

8divide5 5divide(1-08)

計算過程

( )12 乙杯要調出濃度 2的鹽水溶

液那麼 490 毫公升的水要加

入多少公克的鹽

5 10 245 500

計算過程

( )13 丙杯裡裝了 120 毫公升的水

加入 5 公克的鹽丙杯的鹽水

溶液濃度是多少

004 4 42 24

計算過程

( )14 依林的爸爸花了 648 萬元在

大坑買了一塊長 20m寬

1324m 的土地打算蓋別墅請

計算出這塊土地帄均每坪的

售價是多少萬元(一坪大約

是 331m2)

24 81 27 81

計算過程

( )15 林台延想製鹽取海水 45 公

升加熱水完全蒸發後製得鹽

6345 公克相同的海水 918

公升可以製得多少公克的

129438 15228

6426 15228

計算過程

依下列敘述回答 16~17 題

小牛的爸爸預計今年底退休打算將部

分的退休金存定存所孳生的利息作為

小牛將來出國留學的費用銀行定存的

年利率是 8小牛今年是小六的畢業

生求學一路順利從國中三年高中

三年到大學四年大學畢業後出國留

學費用預估要 200 萬元那麼小牛的爸

爸至少要存多少退休金在銀行呢(不

計複利)

( )16 解決這個問題的算式應該下

列哪一個

200divide8 200divide8times10

200divide10divide008 200divide008

計算過程

( )17 接上題小牛的爸爸至少要存

幾萬元在銀行呢

25 200 250

2500

計算過程

依下列敘述回答 18~20 題

玉樺的媽媽花了 818 萬元在台北買了

一間華廈型的中古屋打算重新裝潢

( )18 在房屋的權狀上登記的坪數

是 42 坪扣掉公設也就是全

體住戶共用的空間佔 25剩

下的才是室內的坪數想自己

DIY 粉刷室內所有的空間預

估 1 桶油漆可以粉刷 36 坪

室內全部粉刷要用掉幾桶油

291 5 875

875

計算過程

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程

Page 68: 以TIMSS 2007 數學評量架構中認知領 域進行國小六年級小數的除 …ntcuir.ntcu.edu.tw/bitstream/987654321/5320/1/099NTCTC629066-001.pdf · 學評量架構,編製六年級數學小數的除法測驗,利用實證資料比較HO-IRT、

60

( )19 長 72m寬 64m 的客廳地

板預計改鋪每塊面積 064 m2

的正方形拋光石英磚需要鋪

多少塊的正方形拋光石英磚

2125 72 1125

720

計算過程

( )20 長寬都是 18m 的浴室地板

預計要鋪長 024m寬 005m

的長方形小磁磚需要鋪多少

塊的長方形小磁磚(長方形

小磁磚可以切割)

27 435 150

270

計算過程

( )21 怡如的姊姊今天下班後很

累想泡個澡回到家同時打

開冷熱水管注入一個直徑

1m高 1m 的圓形檜木桶裡

兩管同時注水帄均每分鐘注水

002 公秉注水到八分滿時(亦

即 08 桶)需要多少分鐘(圓

周率=314)

254 3925 314

3184

計算過程

( )22 貞美老師在屈臣氏買了一罐

容量 0275 公升的美白霜回

家後分裝成小罐裝攜帶方便

每 003 公升裝一小罐裝滿最

多罐後還剩下多少公升

0005 005 05

5

計算過程

依下列敘述回答 23~24 題

明宗的阿公在台東種有機稻米帄均每

一期的收成量大約是每公頃可收 355

公噸的稻米

( )23 阿公的耕種面積是 104 公

頃收成的稻米用自家載重 18

公噸的小貨車運到米店出售

載滿最多趟後剩下的留著自

己食用剩下的是多少公噸

0092 092 2 92

計算過程

( )24 接上題留著自己食用的有機

米帄均每個月吃掉 0016 公

噸吃了最多月份後還剩下

有機米幾公噸

0002 0012 012

12

計算過程