150420 教育評価論(日吉)第2講

22
慶應義塾大学教職課程 (日吉)「教育評価論」第 2 評価情報の取得手法としてのテスト 文部科学省 国立教育政策研究所 総括研究官 やま もり こう よう (教育心理学) [email protected] 平成 27 4 20 この内容は個人的見解であり 国立教育政策研究所の公式見解ではありません

Transcript of 150420 教育評価論(日吉)第2講

慶應義塾大学教職課程 (日吉)「教育評価論」第 2講

評価情報の取得手法としてのテスト

文部科学省国立教育政策研究所

文部科学省

国立教育政策研究所

総括研究官やま山もり森

こう光よう陽

(教育心理学)[email protected]

平成 27年 4月 20日

この内容は個人的見解であり国立教育政策研究所の公式見解ではありません

はじめに

本日の出席とスライド

本日の出席

https://questant.jp/q/0420

本日のスライド

http://bit.ly/eduass150420

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 2 / 32

はじめに

本日の内容

1 学習評価の目的と評価の妥当性

2 テスト項目とテスト冊子

3 テスト項目の善し悪し

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 3 / 32

学習評価の目的と評価の妥当性

学習評価の目的と評価の妥当性

形成的評価と総括的評価

教室学校 校外

形成的評価 総括的評価

学習のための評価

Figure 1: 形成的評価と総括的評価の違い慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 5 / 32

学習評価の目的と評価の妥当性

学習評価の妥当性

Table 1: 学習評価の結果の利用のされ方と妥当性の種類(Brookhart(2003)[1], Messick(1995)[2]を参考に作表)

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 6 / 32

学習評価の目的と評価の妥当性

分析・具体化と統合・要約化

Figure 2: 分析・具体化と統合・要約化の関係慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 7 / 32

学習評価の目的と評価の妥当性

目標の具体化から評価課題設定までの手順

目標の具体化 目標の検討 評価課題設定 判断基準設定

評価の観点の趣旨

単元の評価規準

基準の細分化

基準の細分化

項目応答向き

課題解決向き

テスト項目設定

評価課題設定

正答設定

判定基準設定

Figure 3: 評価課題設定の手順と方法の選択慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 8 / 32

テスト項目とテスト冊子

テスト項目とテスト冊子

目標の検討と評価方法の選択項目に応答させる形式

確実に記憶すべき内容の再生一定の手続により正答を導く能力知識量の推定

やや複雑な課題解決を行い正答が一つとなる形式ある特定の問題場面に擬似的に直面させ (課題文),資料なども用いながら (グラフなどの非連続テキスト)一義的な正答を選択する能力

課題を解決させ行動の様子やその出来具合で評価する形式現実的な問題を解決することができるかを推定正答が一義的に定まらない場合

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 10 / 32

テスト項目とテスト冊子

項目に応答させる形式:知識量の推定

引羽雲園遠何科夏家歌画回会海絵外角楽活間丸岩顔汽記帰弓牛魚京強教近兄形計元言原戸古午後語工公広交光考行高黄合谷国黒今才細作算止市矢姉思紙寺自時室社弱首秋週春書少場色食心新親図数西声星晴切雪船線前組走多太体台地池知茶昼長鳥朝直通弟店点電刀冬当東答頭同道読内南肉馬売買麦半番父風分聞米歩母方北毎妹万明鳴毛門夜野友用曜来里理話

絵顔汽明姉組戸回米母

夜工分会考新外聞門画歩理遠点魚昼東矢前雲多絵弟自春曜心帰読親科寺黒弱道毎角今後少

Figure 4: 漢字テストの例 (小 2配当 160字)

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 11 / 32

テスト項目とテスト冊子

やや複雑な課題解決・正答が一つとなる形式日本の南側の太平洋上で台風が発生し,非常に強い勢力でさらに勢力を強めながら,図の矢印のように北上する見込みであることが報道されました。あなたにはA地点に住んでいて稲作を営んでいる親戚と,B地点の海の近くに住んでいて漁業を営んでいる親戚がいます。それぞれのあなたの親戚に対して,この台風に関してどのような注意をすればよいのかについてのアドバイスとして最も適切なものを,授業で習った台風の性質や,報道されている台風の進路,日本列島の地形,親戚の住んでいる場所を踏まえながら,選択肢の中から一つ選びなさい。

① A地点では強い南風が高山が連なる山脈を越えることで温かく乾燥した強い風が吹く可能性があるため,稲作に与える被害に注意する。Bの家の近くでは強い南風が吹き,海水が陸に向かって吹き寄せられる可能性があるため,家の浸水に注意する。

② A地点では高山が連なる山脈に台風がさえぎられるため,大きな被害はない。Bの家の近くでは強い南風が吹き,海水が陸に向かって吹き寄せられる可能性があるため,家の浸水に注意する。

③ A地点では強い南風が高山が連なる山脈を越えることで温かく乾燥した強い風が吹く可能性があるため,稲作に与える被害に注意する。B地点は台風の東側にあることから北からの風が吹くため,漁船が沖に向かって流されないように注意する。

④ A地点では高山が連なる山脈に台風が遮られるため,大きな被害はない。B地点は台風の東側にあることから北からの風が吹くため,漁船が沖に向かって流されないように注意する。

A

B

実社会との関連のある場面の設定をすることで,課題に対する価値を高め,児童生徒にとって解決しがいのある課題となるようにすることで,問題解決的思考を十分に発揮させるようにする。

条件を設定することで評価対象となる能力を特定する。

設問文に記述された問題場面にあわせて,身につけた知識・技能に加えて提示された資料などを援用しながら解決させるようにする。

課題文より選択肢の文のほうが短くなるように記述する。

正答の選択肢と誤答の選択肢(錯乱肢)の文の長さは同じくらいにすることと,よく起こりうる間違いを錯乱肢とすることで,当て推量によって正答を選択する確率を低める。

図3 「思考・判断・表現」の観点の評価に用いる項目応答評価の例

Figure 5: 問題場面項目の例と設定方法慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 12 / 32

テスト項目とテスト冊子

テスト項目が持つべき性質

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Item response function

Ability

Pro

babi

lity

of a

cor

rect

res

pons

e

Figure 6: 項目特性曲線

一定以上の能力の受験者が正答する確率が高く一定以下の能力の受験者が誤答する確率が高い

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 13 / 32

テスト項目とテスト冊子

テスト冊子が持つべき性質

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Item response function

Ability

Pro

babi

lity

of a

cor

rect

res

pons

e

Figure 7: 複数項目の項目特性曲線

項目を複数用意することで評価範囲に幅を持たせる

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 14 / 32

テスト項目とテスト冊子

テスト冊子が持つべき性質

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Item response function

Ability

Pro

babi

lity

of a

cor

rect

res

pons

e

Figure 8: 複数項目の項目特性曲線

項目を多めに用意することで段階を増やす(数値化の手前)

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 15 / 32

テスト項目とテスト冊子

テスト冊子が持つべき性質

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Item response function

Ability

Pro

babi

lity

of a

cor

rect

res

pons

e

Figure 9: 複数項目の項目特性曲線

項目を多数用意することで目盛りが細かくなり数値化に近づく

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 16 / 32

テスト項目とテスト冊子

不適切な項目による得点のゆがみ

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Item response function

Ability

Pro

babi

lity

of a

cor

rect

res

pons

e

Figure 10: 識別力低・当て推量確率高

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

1.0

Item response function

Ability

Pro

babi

lity

of a

cor

rect

res

pons

e

Figure 11: 困難度が逆

不適切な項目が含まれたテスト冊子では能力が高いほど得点が高いという関係が成立しない

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 17 / 32

テスト項目の善し悪し

テスト項目の善し悪し

多肢選択項目設定の留意点

Number of items

Gue

ssin

g ra

te

1 2 3 4 5 6 7 8 9 10

010

2030

4050

6070

8090

100

Figure 32: 項目数と当て推量確率

3つの攪乱肢が機能するように注意する。仮に観点別評価でA程度の受検者が正答できる項目であるなら,Bの受検者が選択しやすい攪乱枝と,Cの受検者が選択しやすい攪乱枝を用意する。1つの選択肢に 1行選択肢の文の長さを同程度よくある間違いの利用「ではない」「すべて」などは太字などで強調

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 29 / 32

テスト項目の善し悪し

短答項目設定における注意

Figure 33: 正誤が一義的に定まる出題慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 30 / 32

References

References

引用文献 I

[1] S. M. Brookhart.Developing measurement theory for classroomassessment purposes and uses.Educational Measurement: Issues and Practice,Vol. 22(4), pp. 5{12, 2003.

[2] S. Messick.Validity of psychological assessment: Validation ofinferences from persons’ responses andperformances as scienti˛c inquiry into scoremeaning.American Psychologist, Vol. 50, pp. 741{749,1995.

慶應義塾大学教職課程「教育評価論」 第 2 講 平成 27 年 4 月 20 日 32 / 32