HSK 一个成功的汉语作为第二语言的考试

42

Click here to load reader

description

HSK 一个成功的汉语作为第二语言的考试. 郭树军. 2006 年 7 月. (一) HSK 研制与开发过程 (二) HSK 的性质和特点 (三) HSK 适合于测试以汉语 为第二语言的少数民族 考生的汉语水平 (四) HSK 的改进与我们的发展. (一) HSK 研发过程. HSK 从 1984 年开始由北京语言大学开始研制, 22 年来 HSK 的发展经历了酝酿与启动、试验与改进、发展与推广等阶段。 - PowerPoint PPT Presentation

Transcript of HSK 一个成功的汉语作为第二语言的考试

Page 1: HSK 一个成功的汉语作为第二语言的考试

HSK一个成功的汉语作为第二语言的考试

2006年 7月

郭树军

Page 2: HSK 一个成功的汉语作为第二语言的考试

• (一) HSK 研制与开发过程• (二) HSK 的性质和特点• (三) HSK 适合于测试以汉语• 为第二语言的少数民族 考生的汉语水平• (四) HSK 的改进与我们的发展

Page 3: HSK 一个成功的汉语作为第二语言的考试

(一) HSK 研发过程• HSK 从 1984 年开始由北京语言大学开始研

制, 22 年来 HSK 的发展经历了酝酿与启动、试验与改进、发展与推广等阶段。

• 22 年来,所有参加 HSK 研制和开发的人员用自己的智慧和汗水,不断探索,不断尝试,努力把 HSK 打造成世界上最具权威性、最有影响力、科学化程度最高的汉语作为第二语言的考试,在海内外产生了很大影响。

Page 4: HSK 一个成功的汉语作为第二语言的考试

• 1984 年底开始研制。• 1985 年编制出 HSK 第一套试题,北语一、二

年级来自 70 多个国家的 360 余名考生参加了试测。

• 1986 - 1989 年,进一步的试验与改进,开发出了 HSK 的计算机管理系统。

• 1989 年北语汉语水平考试中心正式成立。• 1990 年 HSK 首次证书考试在北语举行,有 39

名外国考生参加了考试。• 1990 年 2 月, HSK (初中等)通过国家教委

组织的专家鉴定。专家们认为: HSK 能够比较准确地测出考生的实际汉语水平, HSK 填补了我国语言测试的一项空白。

• 1991 年 HSK (初中等)首次推向海外。

Page 5: HSK 一个成功的汉语作为第二语言的考试

• 1992 年 8 月首届汉语考试国际学术讨论会召开。

• 1993 年 7 月 HSK (高等)通过专家审定。• 1997 年 11 月 HSK (基础)通过专家鉴

定。• 2003 年三套考试大纲重新修订。• 2004 年加速扩充题库,全年生产万道题。• 2005 年全面创新,稳步提高质量。• 2006 年 HSK (入门级)问世,首次向社

会公布 HSK 全真试题及分析。

Page 6: HSK 一个成功的汉语作为第二语言的考试

1988年

考生人数的增长:

2005年 246,977 人(包括中国少数民族考生)

39人

2006 年 5 月考试 新疆少数民族考生人数 80,000 余人

截至到目前, HSK 考生人数约为:

1,250,000

其中少数中国民族考生人数约为: 620,000 HSK 迎来了考生人数增长的黄金期

Page 7: HSK 一个成功的汉语作为第二语言的考试

.

0

20000

40000

60000

80000

100000

120000

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

来华留学生及国外考生人数增长图

Page 8: HSK 一个成功的汉语作为第二语言的考试

.

0

20000

40000

60000

80000

100000

120000

140000

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

国内少数民族考生人数增长图

Page 9: HSK 一个成功的汉语作为第二语言的考试

.

0

50000

100000

150000

200000

250000

1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

考生总人数增长图

Page 10: HSK 一个成功的汉语作为第二语言的考试

• (二) HSK 的性质和特点•

• ★HSK 是汉语作为第二语言的考试• ★HSK 是一种水平考试( Proficiency test )

• ★HSK 是一种标准化考试• ★HSK 是开发得很成功的、科学化程

度很高的汉语作为第二语言的标准化语言水平考试

Page 11: HSK 一个成功的汉语作为第二语言的考试

中国汉语水平考试( HSK )是为测试母语非汉语者(包括外国人、华侨和中国少数民族人员)的汉语水平而设立的标准化考试。 目前, HSK 包括初、中等汉语水平考试[简写为 HSK (初中等)]、高等汉语水平考试[简写为 HSK (高等)]以及基础汉语水平考试[简写为 HSK (基础)]。这三个考试既互相独立又互相衔接,既可以测试出只学过有限的汉语课程的考生的实际汉语水平,又可以测试出相当于汉语本科毕业的汉语作为第二语言的学习者的实际汉语水平。

Page 12: HSK 一个成功的汉语作为第二语言的考试

• 首先, HSK 不同于用来测试母语为汉语的人的语文水平的考试,像我们大家熟悉的我国的中小学语文考试、大学语文考试以及国家语委的普通话水平测试,这些考试都是测试母语为汉语的人的。 HSK 则是一种第二语言考试,参加这个考试的考生应该是把汉语作为外语的学习者(比如母语为英语的美国人)或把汉语作为第二语言的学习者(比如母语为维吾尔语的中国少数民族)。有人把HSK说成是“中国托福”,因为美国的托福( TOEFL )考试是一种把英语作为外语的考试,它是不能用来测试母语为英语的美国人的英语水平的,同样,如果用 HSK 来考母语为汉语的中国人也是无效的。

Page 13: HSK 一个成功的汉语作为第二语言的考试

• 第二, HSK 不同于一般的旨在考查学生是否掌握某门课程内容的成绩考试,而是一种目的在于测量考生的一般语言能力的水平考试。HSK 不以任何特定的教材或特定的教学大纲的内容为依据, HSK 的命题人员不会考虑考生究竟是在哪儿学的汉语、用了什么样的教材、学了哪些内容、怎么学的、学了多长时间,他们也没法去考虑这些。 HSK 的目的是考查汉语作为第二语言的学习者的现有汉语水平即汉语的熟巧程度。

Page 14: HSK 一个成功的汉语作为第二语言的考试

• 第三, HSK 不同于一般教师自编的考试, HSK 是一种按照系统的科学程序组织、具有统一的标准并对误差作了严格控制的标准化的考试。

Page 15: HSK 一个成功的汉语作为第二语言的考试

• 最重要的是, HSK 是一个科学化程度很高的汉语作为第二语言的标准化水平考试。

• 1 HSK 能够可靠地测量考生的汉语水平,是一个信度非常高的考试。

• 信度是指一个考试的结果的一致性和稳定性如何,如果对同一群考生实施同一个考试,在考生的知识和能力水平不变的情况下,多次考试的结果是稳定的、一致的,那么我们就认为这个考试是可靠的,或者说它的信度比较高。信度可以用信度系数表示,一般认为标准化考试的信度系数应该在 0.90 以上,托福考试在 0.95 以上,而 HSK 考试的 α系数一般是在 0.97~0.98之间。

• HSK 试卷的长度和题目的高区分度是 HSK 高信度的最重要的保证。

Page 16: HSK 一个成功的汉语作为第二语言的考试

听力理解 语法结构 阅读理解 综合填空 总 分题目数量 50 30 50 40 170

考生人数 19530 19530 19530 19530 19530

平均分数 29.4300 17.8051 30.5810 22.4765 100.2925

α 系数 0.8789 0.8373 0.9125 0.8900 0.9703

平均难易度 0.5886 0.5935 0.6116 0.5619 0.5900

总点双列 0.3860 0.4232 0.4402 0.4408 0.4217

考生人数 77250 77250 77250 77250 77250

平均分数 26.8487 17.5372 29.4299 22.1592 95.9751

α 系数 0.9057 0.8811 0.9062 0.8949 0.9714

平均难易度 0.5370 0.5846 0.5886 0.5540 0.5646

总点双列 0.4272 0.4816 0.4283 0.4483 0.4423

全国留学生与新疆少数民族考生 HSK( 初、中等 ) 考试同一试卷考试结果主要数据对照

外国留学生考试结果

新疆少数民族考生考试结果

Page 17: HSK 一个成功的汉语作为第二语言的考试

• 2 HSK 能够有效地测量考生的实际汉语水平,是一个效度比较高的考试。 比信度更为重要的是考试的效度,效度是指一个考试是不是测到了它想要测的东西,是否达到了测量的目的。如果一个叫做“汉语水平考试”的考试考的不是学生的汉语水平而是别的能力(比如记忆能力、计算能力等),那么这个考试就是无效的或者说是效度不高的。效度的证据不像信度的证据那么容易获得,而是需要长期的积累。 HSK经过多年的考试,积累了不少效度方面的证据,HSK 的用户认为 HSK 的确能把考生的汉语水平高低区分开来, HSK 的确考出了学生的实际汉语水平。 HSK效标关联效度的研究也证明了 HSK 的有效性。

Page 18: HSK 一个成功的汉语作为第二语言的考试

• HSK 是标准化程度很高的考试。所谓标准化是对考试的全过程都实施标准化,包括试题编制的标准化、考试实施的标准化、阅卷评分的标准化以及分数转换与解释的标准化。 HSK 在每一个环节上都做了严格的控制,最大限度地减小了考试的误差。

• 特别是在试题编制标准化和分数转换与解释的标准化这两个重要环节上, HSK 都有自己的特点,是比较成功的。

Page 19: HSK 一个成功的汉语作为第二语言的考试

• HSK 试题编制的标准化HSK编制基本流程

/命题 题目一审和修改

题目分析

预测

/入题库 制作正式试卷

施测

等值处理

阅卷、计算分数

制作成绩单和证书

是否合格?

汉考中心

合格

能否修改?

修改题目

放弃

无修改价值

可以修改

题目二审

?是否合格

合格

不合格

题目三审不合格

Page 20: HSK 一个成功的汉语作为第二语言的考试

• HSK 在试卷难度控制方面是国内标准化语言水平考试中做得最好的。多年来,我们靠控制预测样本(即常模参照点)的方式来稳定难度的做法非常成功。 HSK 试卷的难易度期望值一直稳定在 0.53左右。 预测范围的扩大和预测试卷的大量增加,一方面使我们有望在较短的时间内生产较多的试卷并加速题库建设,但另一方面,在新的预测方式下,如何很好地控制难度也是我们面临的新的挑战。目前我们已经摸索出一些规律,能够比较有把握地保证 HSK 试卷难度的稳定性。

Page 21: HSK 一个成功的汉语作为第二语言的考试
Page 22: HSK 一个成功的汉语作为第二语言的考试

HSK 题目难易度期望值听力理解 语法结构 阅读理解 综合填空 全  卷

标准卷 0.5716(28.58)

0.5600(16.80)

0.4990(24.95)

0.5007(20.03)

0.5315(90.36)

听力理解 语法结构 阅读理解 综合填空 全 卷 期望平均分

Nxx3 0.5572 0.5427 0.5284 0.5173 0.5368 91.25

Nxx4 0.5492 0.5469 0.5439 0.5438 0.5459 92.81

Nxx5 0.5329 0.5488 0.5302 0.5087 0.5292 89.96

Nxx6 0.5417 0.5465 0.5419 0.5398 0.5422 92.17

Nxx7 0.5334 0.5368 0.5401 0.5366 0.5367 91.24

Nxx8 0.5382 0.5360 0.5267 0.5383 0.5344 90.86

Nxx9 0.5348 0.5362 0.5298 0.5356 0.5337 90.73

Nxx10 0.5320 0.5380 0.5353 0.5360 0.5350 90.95

Nxx11 0.5265 0.5302 0.5440 0.5576 0.5396 91.74

Page 23: HSK 一个成功的汉语作为第二语言的考试

P3

.90.85

.80.75

.70.65

.60.55

.50.45

.40.35

.30.25

.20.15

.10.05

J323ÄÑÒ׶ÈÆÚÍû·Ö²¼Ö±·½Í¼30

20

10

0

Std. Dev = .15

Mean = .54

N = 170.00

P3

.90.85.80.75.70.65.60.55.50.45.40.35.30.25.20

J324ÄÑÒ׶ÈÆÚÍû·Ö²¼Ö±·½Í¼30

20

10

0

Std. Dev = .14

Mean = .55

N = 170.00

P3

.90.85

.80.75

.70.65

.60.55

.50.45

.40.35

.30.25

.20.15

.10.05

J325ÄÑÒ׶ÈÆÚÍû·Ö²¼Ö±·½Í¼

30

20

10

0

Std. Dev = .16

Mean = .53

N = 170.00

P3

. 90. 85. 80. 75. 70. 65. 60. 55. 50. 45. 40. 35. 30. 25. 20. 15. 10

J326ÄÑÒ׶ÈÆÚÍû·Ö²¼Ö±·½Í¼30

20

10

0

Std. D ev = . 16

Mean = . 54

N = 170. 00

Page 24: HSK 一个成功的汉语作为第二语言的考试
Page 25: HSK 一个成功的汉语作为第二语言的考试

HSK 题目区分度 ( 预测 ) 统计Rpb1>=.25 Rpb2>=.25 Rpb3>=.25 Rpb>=.20 Rpb3>=.20

NXX3 148 151 167 166 169

NXX4 155 157 168 169 170

NXX5 154 157 168 168 170

NXX6 143 159 167 162 170

NXX7 146 152 163 147 170

NXX8 141 146 166 139 170

NXX9 134 149 166 141 170

NX10 157 156 169 163 170

NX11 151 156 164 170 170

Page 26: HSK 一个成功的汉语作为第二语言的考试

• HSK 在分数转换与解释的标准化方面有自己的特点。 HSK 最成功的地方是有效地运用标准化手段使考试结果具有很强的可比性。

• HSK 的分数体系为解释 HSK 成绩提供了比较充分的信息。

Page 27: HSK 一个成功的汉语作为第二语言的考试

HSK (初中等)分数体系 ●HSK (初中等)分测验分数是一个以 50 为平均数,

以 15 为标准差的报导分数: HSK [初中等](分测验)= 15Z+ 50

● HSK (初中等)总分是一个以 200 为平均数,以60 为标准差的报导分数:

HSK [初中等](总分)= 60Z+ 200

Page 28: HSK 一个成功的汉语作为第二语言的考试

• 等值( Equating )是标准化考试中技术性最强的一个环节, HSK 的等值技术的运用在国内语言测试领域处于领先地位,在国际上亦很有特色。目前我们根据情况的不断变化,实施了多种等值设计和手段,保证了 HSK 分数的可比性。

锚题

X 卷 ( 新卷 )

Y 卷 ( 标准卷 )

锚题

Page 29: HSK 一个成功的汉语作为第二语言的考试

• HSK 的分数体系和等值处理技术保证了各次 HSK 成绩和证书之间的可比性。

• 由于 HSK 分数由 Z 分数转换而来,又由于建立了常模参照点(标准样组),不仅同次 HSK 考试考生之间的分数可比,而且不同次考试之间的分数也是可比的, HSK 分数反映考生在标准样组中的位置,但不反映其在所属考生团体中的位置— HSK 分数是通过标准样组计算得来的。

Y 考试团体X 考试团体考生 A 与考生 B 可比

但不表明其在此团体中位置

考生 C 与考生 D 可比

但不表明其在此团体中位置

标准样组

标准试卷反映在标准样组中的位置

反映在标准样组中的位置

A 与 C 在标准样组中位置可比

Page 30: HSK 一个成功的汉语作为第二语言的考试

★ HSK 是在语言学、对外汉语教学、心理测量学和教育测量学及语言测试理论指导下,结合汉语特点而设计的一种汉语作为第二语言的水平考试,其科学化程度得到了广泛的承认。

Page 31: HSK 一个成功的汉语作为第二语言的考试

• HSK 考试作为最权威的汉语作为第二语言的水平考试,它对于对外汉语教学的推广起到了十分积极的促进作用。另外,作为一项考试, HSK 能够给教学提供一些反馈信息。

• 但是 HSK 毕竟只是一个考试,它是一个可靠的、有效的测量工具,但它几乎不可能成为一个提高教学水平的手段或工具。考试的任务仅仅是准确地测量考生的水平而不是提高学生的水平,要想真正地提高教学质量,还得从教学的理论、原则、方法上多下功夫。

Page 32: HSK 一个成功的汉语作为第二语言的考试

(三) HSK 适合于测试以汉语为 第二语言的少数民族考生的 实际汉语水平

HSK从最初设计时就考虑到了为将我国少数民族考生作为其测试对象,多年来的实践证明,HSK 能够可靠而有效地测试出以汉语为第二语言的少数民族考生的实际汉语水平。

Page 33: HSK 一个成功的汉语作为第二语言的考试

2005 年 5 月全国留学生考生 HSK (初、中等)考试结果与 2006年 5 月新疆少数民族考生 HSK(初、中等)考试结果的分析和比较表明: HSK完全适合测试以汉语为第二语言的中国少数民族考生。

Page 34: HSK 一个成功的汉语作为第二语言的考试

2005 年 5 月全国外国 HSK (初、中等)考试考试结果分析报告

听力理解 语法结构 阅读理解 综合填空 总 分

题目数量 50 30 50 40 170

考生人数 19530 19530 19530 19530 19530

平均分数 29.4300 17.8051 30.5810 22.4765 100.2925

方差 80.0823 34.4202 105.0915 63.7128 917.1223

标准差 8.9489 5.8669 10.2514 7.9820 30.2840

偏态值 0.0293 0.0163 -0.1228 -0.1940 -0.0346

峰态值 -0.7011 -0.7286 -0.9390 -0.7336 -0.8146

α 系数 0.8789 0.8373 0.9125 0.8900 0.9703

标准误差 3.1141 2.3663 3.0320 2.6473 5.2221

平均难易度 0.5886 0.5935 0.6116 0.5619 0.5900

总点双列 0.3860 0.4232 0.4402 0.4408 0.4217

总双列 0.5100 0.5594 0.5792 0.5930 0.5595

Page 35: HSK 一个成功的汉语作为第二语言的考试

新疆 2006 年 5 月 21日 HSK (初、中等)考试 考试结果分析报告

听力理解 语法结构 阅读理解 综合填空 总 分

题目数量 50 30 50 40 170

考生人数 77250 77250 77250 77250 77250

平均分数 26.8487 17.5372 29.4299 22.1592 95.9751

方差 104.3554 45.3606 100.3130 68.8865 1036.937

标准差 10.2155 6.7350 10.0156 8.2998 32.2015

偏态值 0.1349 -0.1386 -0.1371 -0.2748 -0.0595

峰态值 -0.9107 -0.9926 -0.8050 -0.7491 -0.8833

α 系数 0.9057 0.8811 0.9062 0.8949 0.9714

标准误差 3.1376 2.3221 3.0673 2.6906 5.4436

平均难易度 0.5370 0.5846 0.5886 0.5540 0.5646

总点双列 0.4272 0.4816 0.4283 0.4483 0.4423

总双列 0.5520 0.6348 0.5618 0.5943 0.5803

Page 36: HSK 一个成功的汉语作为第二语言的考试

2005 年 5 月全国外国留学生 HSK (初、中等)考试分测验分数相关矩阵

听力理解 语法结构 阅读理解 综合填空 总分1.00 0.77 0.73 0.72 0.88

0.77 1.00 0.81 0.79 0.90

0.73 0.81 1.00 0.86 0.94

0.72 0.79 0.86 1.00 0.92

0.88 0.90 0.94 0.92 1.0

新 疆 2006 年 5 月 21 日 HSK(初、中等)考试分测验分数相关矩阵

听力理解 语法结构 阅读理解 综合填空 总分1.00 0.75 0.74 0.70 0.88

0.75 1.00 0.83 0.80 0.91

0.74 0.83 1.00 0.83 0.93

0.70 0.80 0.83 1.00 0.91

0.88 0.91 0.93 0.91 1.00

Page 37: HSK 一个成功的汉语作为第二语言的考试

2005 年 5 月全国外国留学生 HSK(初、中等)考试题目区分度统计

点双列相关系数(区分度)

题目数量

<0.1 2

0.1~0.1999 3

0.2~0.2999 17

0.3~0.3999 45

0.4~0.4999 69

0.5~0.5999 36

0.6~0.7 3

总计 170

新 疆 2006 年 5 月 21 日 HSK(初、中等)考试题目区分度统计

点双列相关系数(区分度)

题目数量

<0.1 4

0.1~0.1999 2

0.2~0.2999 8

0.3~0.3999 35

0.4~0.4999 69

0.5~0.5999 47

0.6~0.7 5

总计 170

Page 38: HSK 一个成功的汉语作为第二语言的考试

听力理解 语法结构 阅读理解 综合填空 总 分题目数量 50 30 50 40 170

考生人数 19530 19530 19530 19530 19530

平均分数 29.4300 17.8051 30.5810 22.4765 100.2925

ALPHA 系数 0.8789 0.8373 0.9125 0.8900 0.9703

平均难易度 0.5886 0.5935 0.6116 0.5619 0.5900

总点双列 0.3860 0.4232 0.4402 0.4408 0.4217

考生人数 77250 77250 77250 77250 77250

平均分数 26.8487 17.5372 29.4299 22.1592 95.9751

ALPHA 系数 0.9057 0.8811 0.9062 0.8949 0.9714

平均难易度 0.5370 0.5846 0.5886 0.5540 0.5646

总点双列 0.4272 0.4816 0.4283 0.4483 0.4423

全国留学生与新疆少数民族考生 HSK( 初、中等 ) 考试同一试卷考试结果主要数据对照

外国留学生考试结果

新疆少数民族考生考试结果

Page 39: HSK 一个成功的汉语作为第二语言的考试

SCORET

170.0

160.0

150.0

140.0

130.0

120.0

110.0

100.0

90.0

80.0

70.0

60.0

50.0

40.0

30.0

20.0

10.0

0.0

10000

8000

6000

4000

2000

0

Std. Dev = 32.20

Mean = 96.0

N = 77250.00

新疆 2006 年 5 月 21日 HSK (初、中等)考试 分数分布直方图 (77,250 人 )

SCORET

170.0

160.0

150.0

140.0

130.0

120.0

110.0

100.0

90.0

80.0

70.0

60.0

50.0

40.0

30.0

20.0

10.0

0.0

2005Äê5ÔÂÈ«¹úÁôѧÉúHSK(³õ¡¢ÖеÈ)

·ÖÊý·Ö²¼Ö±·½Í¼£¨19539ÈË£©3000

2000

1000

0

Std. Dev = 30.28

Mean = 100.3

N = 19530.00

Page 40: HSK 一个成功的汉语作为第二语言的考试

(四) HSK 的改进与我们的发展

现行的 HSK 作为一个第二语言考试还有不少局限,例如,试卷体系结构的问题,分数等级划分过细的问题,初、中等 HSK没有口语考试的问题等。目前, HSK 的改进工作已经启动,改进方案正在制定中。相信,全面改进版的 HSK 问世后,一定会更为可靠和有效地测量出考生的汉语水平。

HSK 的改进

我们的发展

北京语言大学汉语水平考试中心作为一个考试研发机构,有责任和义务为社会提供专业化的服务,有能力跟踪国际上语言测试的最新研究动向,把最先进的理论、原则、方法和技术尽可能地运用到语言考试的研究和开发中,开发出更多的适应各种需求的汉语作为第二语言的考试。

Page 41: HSK 一个成功的汉语作为第二语言的考试

HSK 计算机自适应考试

HSK 写作能力测试

汉语学习能力测试学者汉语水平测试汉语教学成绩测试

商业汉语考试高等 HSK 考试作文动态语料库

高等 HSK 考试口语语料库HSK (入门级)

实用中国语水平认定考试( C.TEST )

HSK 整体改进版

HSK 口语能力测试

HSK 语音水平测试

Page 42: HSK 一个成功的汉语作为第二语言的考试

汉语水平考试

永远励精图治