基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

6
山东外语教学 ShandongForeignLanguageTeachingJournal 2012 年第期(总第151 期) 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与评估 刘玉山,胡志军 (山东大学外国语学院,山东济南 250012 基金项目: 本文得到了山东大学自主创新基金( IIFSDV )(编号: IFW09062 )的资助。 收稿时间: 20120620 作者简介: 刘玉山( 1973- ),男,汉族,山东青州人,讲师。研究方向:英语教学、教师专业发展。 胡志军( 1970- ),男,汉族,山东茬平人,教授。研究方向:英语教学、法律英语。 摘要: 本文简要介绍了在线免费语料库 TheCompleatLexicalTutor 的主要构成及功能,通过具体实 例阐述了学习者如何通过数据驱动式学习,根据词汇使用的不同语境,自主辨析词义的细微差异、 词汇搭配结构差异、口语与书面语词汇的使用词频差异、词汇的语用功能差异以及辨认“新词”结 构。通过语境共现词条,强化学习者“注意”,加强词汇的有效记忆与应用。此外,本文还运用该语 料库中语篇词汇描述功能,对两篇学生作文用词做出量化分析,评估词汇水平,这对于如何改进词 汇学习与写作起到重要的反馈作用。 关键词: 语料库;数据驱动式学习;词汇学习;词汇评估 中图分类号: H319  文献标识码: A  文章编号: 10022643 2012 06006406 1.0 背景 随着计算机科学的出现和发展, 20 世纪 60 代计算机语料库诞生。语料库最初应用于词典编纂 和语法研究,如今语料库已逐步扩展到语言教学、话 语分析、翻译研究、自然语言处理等多个领域。语料 库和语言教学关系十分密切,它对语言教学产生了 极其重要的影响。语料库运用于语言教学的重要原 因就是语料库对实际语言运用给予清晰描述,能够 展示与语言形式相关的语境特征。通过语料库,可 以清楚地看出某个词或短语的使用频率和典型搭 配。( Hunston 2002 )语料库为探索具体语境下词汇 的含义及运用规律提供了合适的资源。语料库,不 仅对教师研究与教学十分有益;对于学生来说,通过 分析真实语料,巩固已有知识,增强语言意识,提高 语言技能,也有重要意义。Leech 1997 )将语料库运 用于语言教学归纳为三点: )直接将语料库运用于 教学,即教学生了解什么是语料库,教学生如何使用 语料库学习,怎样有选择地运用语料库进行教学。 )间接应用于教学,即出版词典、参考书等,运用频 度搭配编辑教学材料以及语言测试。)建立教学 语料库,即专门用途英语学习者( LearnerforSpecific Purposes )语料库、第一语言 ( firstlanguage )和第二 语言( secondlanguage )学习者语料库、双语( bilin gual )和多语( multilingual )语料库。2000 年以来,随 着国内语料库语言学的迅猛发展,众多学者将语料 库与课堂语言教学相结合,做了大量研究(张淑静, 2002 ;李文中, 2003 ;濮建忠, 2003 ;滕延江、刘世铸, 2006 ;胡显耀, 2011 ),研究的内容主要涉及词汇教 学、写作教学、翻译教学、口语教学等方面,但词汇研 究成果最多。相关研究表明基于语料库的词汇学习 有助于学习者词汇记忆的牢固与持久,从而有利于 产出性词汇能力的发展。( Hunston 2002 ;邓联健, 2006 ;权立宏, 2008 长期以来,词汇被看作是语言学习最主要的要 素之一。( Nation 2001 )词汇一直是大学英语教学 的重点和难点。笔者曾对 2009 级护理专业和预防 专业 116 名大学生的词汇学习做过一个小型课堂调 查,其中学生反映两个最突出问题是如何有效记忆 词汇和增加作文的词汇丰富性。马广惠和文秋芳 1999 )研究表明表达性词汇量( productivevocabula ry )对写作能力的直接影响最大,表达词汇量越大, 作文分数越高。学生表达词汇过窄,必然会影响到 作文的深度和质量。为了有效掌握词汇,学习者应 当较少地依赖教学过程,更多地依赖自我实践活动。 Macaro 2001 )在基于语料库的数据驱动式学习过 程中( DatadrivenLearning )学习者不再是知识的被

Transcript of 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

Page 1: 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

 山东外语教学           ShandongForeignLanguageTeachingJournal         2012年第6期(总第151期) 

基于在线免费语料库 TheCompleatLexicalTutor的词汇自主学习与评估

刘玉山,胡志军(山东大学 外国语学院,山东 济南 250012)

基金项目:本文得到了山东大学自主创新基金(IIFSDV)(编号:IFW09062)的资助。收稿时间:20120620作者简介:刘玉山(1973-),男,汉族,山东青州人,讲师。研究方向:英语教学、教师专业发展。

胡志军(1970-),男,汉族,山东茬平人,教授。研究方向:英语教学、法律英语。

摘要:本文简要介绍了在线免费语料库TheCompleatLexicalTutor的主要构成及功能,通过具体实例阐述了学习者如何通过数据驱动式学习,根据词汇使用的不同语境,自主辨析词义的细微差异、

词汇搭配结构差异、口语与书面语词汇的使用词频差异、词汇的语用功能差异以及辨认“新词”结

构。通过语境共现词条,强化学习者“注意”,加强词汇的有效记忆与应用。此外,本文还运用该语

料库中语篇词汇描述功能,对两篇学生作文用词做出量化分析,评估词汇水平,这对于如何改进词

汇学习与写作起到重要的反馈作用。

关键词:语料库;数据驱动式学习;词汇学习;词汇评估

中图分类号:H319  文献标识码:A  文章编号:10022643(2012)06006406

1.0背景随着计算机科学的出现和发展,20世纪60年

代计算机语料库诞生。语料库最初应用于词典编纂

和语法研究,如今语料库已逐步扩展到语言教学、话

语分析、翻译研究、自然语言处理等多个领域。语料

库和语言教学关系十分密切,它对语言教学产生了

极其重要的影响。语料库运用于语言教学的重要原

因就是语料库对实际语言运用给予清晰描述,能够

展示与语言形式相关的语境特征。通过语料库,可

以清楚地看出某个词或短语的使用频率和典型搭

配。(Hunston,2002)语料库为探索具体语境下词汇的含义及运用规律提供了合适的资源。语料库,不

仅对教师研究与教学十分有益;对于学生来说,通过

分析真实语料,巩固已有知识,增强语言意识,提高

语言技能,也有重要意义。Leech(1997)将语料库运用于语言教学归纳为三点:1)直接将语料库运用于教学,即教学生了解什么是语料库,教学生如何使用

语料库学习,怎样有选择地运用语料库进行教学。

2)间接应用于教学,即出版词典、参考书等,运用频度搭配编辑教学材料以及语言测试。3)建立教学语料库,即专门用途英语学习者(LearnerforSpecificPurposes)语料库、第一语言(firstlanguage)和第二语言(secondlanguage)学习者语料库、双语(bilin

gual)和多语(multilingual)语料库。2000年以来,随着国内语料库语言学的迅猛发展,众多学者将语料

库与课堂语言教学相结合,做了大量研究(张淑静,

2002;李文中,2003;濮建忠,2003;滕延江、刘世铸,2006;胡显耀,2011),研究的内容主要涉及词汇教学、写作教学、翻译教学、口语教学等方面,但词汇研

究成果最多。相关研究表明基于语料库的词汇学习

有助于学习者词汇记忆的牢固与持久,从而有利于

产出性词汇能力的发展。(Hunston,2002;邓联健,2006;权立宏,2008)

长期以来,词汇被看作是语言学习最主要的要

素之一。(Nation,2001)词汇一直是大学英语教学的重点和难点。笔者曾对2009级护理专业和预防专业116名大学生的词汇学习做过一个小型课堂调查,其中学生反映两个最突出问题是如何有效记忆

词汇和增加作文的词汇丰富性。马广惠和文秋芳

(1999)研究表明表达性词汇量(productivevocabulary)对写作能力的直接影响最大,表达词汇量越大,作文分数越高。学生表达词汇过窄,必然会影响到

作文的深度和质量。为了有效掌握词汇,学习者应

当较少地依赖教学过程,更多地依赖自我实践活动。

(Macaro,2001)在基于语料库的数据驱动式学习过程中(DatadrivenLearning)学习者不再是知识的被

46

Page 2: 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

动接受者,而是自己发现和探索词汇运用规律,成为

知识的积极构建者。这一模式是建构主义理论在实

践中的具体应用,也有助于培养学习者的自主学习

能力。(张济华等,2008)本文简要介绍了语料库TheCompleatLexicalTutor的主要构成及功能。然后通过具体实例阐述了学习者如何自主探索词汇在

不同语境下的语言使用特征,增强对词汇的“注意”

(Schmidt,1994:17),提高语言输入和输出效率。最后,运用该语料库的语篇词汇描述功能,学习者可自

主对作文用词做出量化分析,评估词汇水平,对词汇

学习及写作起到重要的反馈作用。

2.0语料库与数据驱动下的自主学习SusanHunston(2002:2)将语料库定义为:“真

实语言样本的集合,可以由几个句子组成,也可以是

一些书面文章或磁带录音材料组成,收集的目的是

进行语言研究,近年来语料库专指电脑能够随机存

取的篇章的集合”。语料库本质上是通过对自然语

言运用的随机抽样,由大量在真实情况下使用的语

言信息集成的专供研究学习使用的文本组合。语料

库信息量大,语言形式反复出现,可以为各种语言研

究者和学习者提供丰富而又可靠的数据资源。语料

库可以揭示最典型的语言特征,发现语言在实际中

的使用规律,反映语言的真实面貌。语料库有三个

基本功能:1)显示词频(frequency);2)显示短语结构(phraseology);3)显示搭配(collocation)。(Hunston,2002:3-13)语料库中心词索引软件(Concordancer)是最强有力的工具,它查询到的语境共现(KeyWordinContext缩略为KWIC)词条,以节点词(nodeword)居中的形式,将一个单词、短语或语法结构所有语境例句以清单的形式呈现出来。根据需

要,语境的范围小至节点词左右的几个词,大至包含

有节点词的整个句子乃至全文。图1就是运用在线语料库 (TheCompleatLexicalTutor)中的BNC书面语料库 对stick一词进行中心词检索,由于篇幅限制,仅仅列出20行词条信息。

图1 stick一词在BNC书面语语料库的检索信息  学习者从图1中可以观察到stick一词的意义、语法结构和使用规律。语料库索引的这种功能为语

言学习者提供了语言使用的各种语境,这种特殊的

排列方式突显了在单个文本中不易体现的某些语言

特征。学习者运用数据驱动式的学习,自己对大量

真实的例子进行观察分析,得出语言使用规则,学习

者变成了“语言侦探”(Johns,1997:101),成为词汇使用的研究者,这就增强了学习者的学习动机。而

自主学习以建构主义理论为依据,强调的是以“学

生为中心”,要求学生由知识的被动接受者转变为

信息加工的主体和知识意义的主动建构者。学习者

要想完成对所学知识的意义建构,即达到对该知识

所反映事物的性质、规律以及该事物与其它事物之

间联系的深刻理解,最好的办法是让学习者在完整

的、真实的环境中进行有意义的体验活动,而不是仅

仅聆听别人关于这种经验的介绍和讲解。因此数据

驱动式学习与自主学习都强调学习者的主观能动

性,对真实语境的体验,自己发现问题,解决问题。

本文探讨的基于语料库词汇自主学习与评估是指学

习者在老师的引导下或自发运用语料库进行的网上

学习活动。

3.0关于网络在线TheCompleatLexicalTutor语料库加拿大魁北克大学 TomCobb教授开发的“致

力于知识的网上免费传播”为宗旨的语料库 TheCompleatLexicalTutor,是集多种功能于一体的大型免费语料库,提供Brown语料库、BNC口语、BNC书面语、BNC法律、BNC医学语料库、学习者语料库和学术摘要等 13种语料库供学习者和研究者使用。本网站包括三大部分(见图2):1)自我辅导(Tutorial);2)学习研究(Research);3)教师命题(Teach

56

Page 3: 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

ers)。第一部分是为学习者提供自主学习的机会,通过使用网络交互式工具,可以自测词汇量、词汇的

级别、积极和消极词汇对比,使用中心词索引词条测

试语法。第二部分有八大功能,其中主要功能包括:

1)语篇工具(Texttools),指运用工具处理语篇的功能,寻找每个词在语篇中的使用频率。2)位置确定工具(Range),主要是确定不同词汇和短语在不同语料库的位置。3)中心词索引工具(Concordancetools),它可以提供不同语言(英语、法语、西班牙语和德语)的语料库、语篇和故事为基础的中心词索

引,包括13个大型的语料库。4)语篇词汇描述工具(Vocabprofile),可以对语篇词汇进行描述,比如类符、形符的数目以及它们的比率,功能词、实词的

数目及与篇章单词数目比例,还有测量语篇的用词

量。测量语篇用词量是以MichaelWest(1953)所编的《通用英语词表》最常用1000词族、2000词族以及Coxhead(2000)的570个学术英语词族表(AcademicWordList,简称AWL)为基准测量的。第三部分主要是让教师自己输入材料为学生定制合适的词

汇练习,其中主要包括文字语音转化生成(TTSBuilder)、完形填空生成(ClozeBuilder)、超文本生成(HypertextBuilder)。本研究主要使用第二部分的中心词索引工具 (Concordancetools)来研究词汇在不同语境下词汇意义的区别。此外,运用语篇描

述功能工具(Vocabprofile)来评估不同学生写作用词的差异。

图2 TomCobb建立的免费语料库TheCompleatLexicalTutor主页面

4.0在线语料库在词汇学习中的具体应用运用在线语料库学习词汇主要有两种方法:演

绎法与归纳法。(Schmitt,2002)演绎法就是运用语料库验证自己的假设。而归纳法就是运用语料得出

自己的结论。学习者可以自己运用语料库进行学

习,也可以和老师合作共同学习。前者可以最大程

度发挥学习者的主观能动性和学习兴趣,自己提出

问题,比如某个动词后边用 on还是 in,自己运用语

料解决问题,缺点是老师对学生很难进行控制。如

果和老师合作学习,比如老师说出一个语言现象,让

学生通过语料去验证或者归纳,这样可以有目的地

学习,老师对学生有更多控制,但缺点是学生可能对

提出的问题不感兴趣。具体教学过程中,可以根据

不同的场合和条件以及学习者的英语水平对上述方

法灵活运用。语料库应用于词汇学习主要体现在五

个方面。

4.1辨析词汇语义细微差异学习者学习中经常遇见一些词汇,即便查词典,

也难以看出其语义差异。但是通过语料库,根据各

自所在的大量的语境共现词条,可以辨别出其中微

妙的差异。比如incredibly和 surprisingly,这两个词的意义很难区别,即使查词典也难以区分,因为两者

都有“十分,非常”的含义。我们使用在线语料库

TheCompleatLexicalTutor中 BNC语料库对其词义细微差异进行辨析。两词在 BNC书面语语料库(100万)中的词条索引显示:surprisingly超出 25条,而incredibly仅3条。surprisingly在书面语语料库中,多数句子前面有否定词 not或 rather,而 incredibly没有这样的用法,所以我们看出 surprisingly经常用在句首,常接在not,rather等词的后边,起到修饰整个句子的作用。从 incredibly在各词条的含义,可以清楚看出它是 very的强式表达语。此外,BNC对应的口语语料库也是 100万。在口语语料中,incredibly共10条,而 surprisingly仅仅3条。与书面语词条数量进行对比可以看出 surprisingly常用于书面语,而incredibly常用于口语。4.2辨析短语结构搭配

短语结构在二语习得中十分重要。因为这样的

结构以单个词项的形式在大脑中储存提取,使用短

语结构可以增强言语输出的流利度。正如 Ellis(1997)所说,讲话像本族语者就是能够熟练、高频地运用短语结构搭配,因此学习者的任务就是学会

这些熟悉的词频序列。通过使用中心词索引,可以

使学习者观察到在通常语境下观察不到的特殊规

律。在学习中,学生经常混淆 interesting和 interested的区别。在 TheCompleatLexicalTutor中 Brown语料库(100万)检索的结果显示:检索结果每个词都超过25条,数量没有差异。但是从检索词条可以清楚地看出 interested绝大多数词条用于短语结构interestedin,并且最常见的结构就是 someoneisinterestedindoingsomething,而 interesting一词,几乎总是用于名词前面的这种结构 an/the+interesting+thing和be+interesting这样的表语结构。这样我们的教学重点就转移到这两个词的主要用法上,学

生也很容易获得这样有规律的结构形式,增强学生

66

Page 4: 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

的注意,有意识对结构形式明示关注使二语学习者

更可能对输入和输出的内容进行认知对比(Ellis,2005:215)。Schmidt(2001:30)也提倡“更多的关注可以造就更多的学习”。

4.3辨析口语与书面语不同语体词汇使用区别口语与书面语是两种不同的语体,在词汇使用、

语法结构等各方面存在明显的差异。对于许多词

汇,我们直觉无法了解是书面语还是口语词汇。通

过口语与书面语语料库词频对比,可以清晰地看出

书面语词汇和口语词汇在词频使用上的差异。比如

gorgeous一词在 TheCompleatLexicalTutor中 BNC口语(100万)和书面语(100万)对比语料库显示的词条表明:gorgeous一词在100万的口语语料库出现21次,而同样在100万的书面语中出现7次,所以gorgeous一词多用于口语,并且尤其以 itisgorgeous(that)结构在口语中呈现,而在书面语用法中却没有这样的用法。所以通过某个词在书面语和口

语语料库中的词频对比,可以比较容易确定哪些词

更倾向于书面语,哪些词更倾向用于口语。

4.4辨析词汇的语用功能通过语料库,可以探求词汇使用的语用功能。

有些词汇看似简单,但在不同语篇语境或情景语境

中蕴藏着丰富的语用功能,比如 mean一词,意义非常简单,但是通过关键词检索词条,可以看出 mean一词除了表示基本的所指意义和隐含意义外,mean最大的功能是交际功能。JoanCutting(2008)将 Imean交际功能分为三类:1)Imean在交际中,表示“犹豫现象、填充词和保持话轮的作用”。比如:

“Well,I,will,youknow,Imean,willcarryonasChairman.”2)Imean作为话题转换标记词和强调词。比如:“ImeanyourDadisn’tgonnaagree.”3)Imean可以作为填充词和理解确认词。比如:“SeewhatImean?”mean一词在TheCompleatLexicalTutor中BNC口语语料库中的搜索,总共有499项词条。通过分析,可以看出不同词条具有的不同语用

功能。

4.5辨认新词结构通过运用语料库,可以辨析一些生词结构,比如

“Let’smeetatsixish.”中 sixish就是一个新的结构变体。这是在传统课本中找不到的语言形式,传

统课本中都采用了处理的比较干净的单词结构形

式。然而语料研究表明这样的未经处理的语言形式

在说话人之间建立和维持社会关系,培养人际之间

的和谐是十分重要的。(Carter,2004)下面是ish结尾的新词在 TheCompleatLexicalTutor语料库中心词索引的搜索结果:

[001]ritesport!Onlytwo!Ertwoandhalf-

ISH!Abouttwoandahalf[002]!AbouttwoandahalfISH.Three[003].Three-ISH.Why’sthat?[004]n’twe?AnderDonnawalkedinabout

nineISHwasn’tit?HalfpastnineSomething从上面的检索词条可以看出一个规律性的用

法,那就是在数字后常用后缀ish,我们可以推测出它的词义是“大约、左右”,表示不太确定的含义,比

如 halfpasteightish就是8点半左右。尽管这种材料是否应该展示给学习者还存在争议,但学习者在

语料库中获取自然语言,意识到自然语言没有那么

“整洁干净”是十分必要的。

5.0运用在线语料库对写作词汇进行评估英语词汇习得长期以来一直没有得到很好的解

决。在英语写作中,教师常发现学习者使用词汇简

单,缺少变化,不知如何使用新学过的生词,作文的

深度和质量大打折扣。学生可以运用语料库语篇词

汇描述工具对作文词汇自行评估。也可与同伴合作

对写作词汇进行对比评估分析,发现词汇使用存在

的问题,对词汇学习与使用起到重要的反馈作用。

尽管句法、语义、背景知识方面会影响文本的难度,

但词汇水平(lexicalproficiency)在很大程度上能决定文本的难度和质量。(梁茂成等,2010:143)因此,它是测量学习者作文中词汇特点的常用术语。

(陈建林,2011:57)词汇水平的测量方法多种多样,这里采用Linnamd(1986)研究中词汇多样性(lexicalvariation)和词汇密度两个方面来测量整体词汇能力,同时辅以 Laufer&Nation(1995)提出的词汇频数概貌(lexicalfrequencyprofile)来验证。

词汇多样性是类符和形符的比率(typetokenratio)。类符(type)指的是语篇中不同的单词数目,而形符(token)指的是所有的单词数目。类符形符比就是类符的数目除以所有单词数目得出的比例。

(Adolphs,2006)比如:“Thischaptermovesfromthediscussionofdesignanddevelopmentsofelectronictextresourcestotechniquesandpracticesindataanalysis.”这句含有21个形符,19个类符。因为单词and和of出现了两次。所以这个句子的类符形符比就是19/21=1.11。这个比值的高低可以反映出语篇的复杂程度,词汇使用量的大小。这个比值越高,词

汇使用量越大、越丰富,相应的语篇更难、更复杂些。

词汇密度是实义词的数目与篇章数目的比值。实义

词指名词、动词、形容词和副词。(Biber,2006:38-41)同样上边这个例句,可以计算出词汇密度是12/21=0.57。词汇密度也是衡量作文难度的重要指标之一。这个比值越大,作文越难、越复杂。词汇频数

概貌(lexicalfrequencyprofile)是反映作文中词汇在76

Page 5: 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

不同词汇级别中分布情况的一种测量手段。Nation个人网页上Rang-GSL-AWL.zip里包含三级词汇表,第一级1000高频词族(简称 K1),第二级1000高频词族(K2),大学学术词汇570词族(AWL),其中前2000词族源自 West(1953)所编的《通用词汇表》(AGeneralServiceListofEnglishWords)。570个词族源自Coxhead(2000)的学术词汇表(AcademicWordList)。

下面是运用第二部分的语篇词汇描述功能工具

Vocabprofile(WebVP1.02001)对两个学生的作文(作文A和作文 B)词汇水平进行比较。两篇作文是本校2009级药学专业7年制学生在大二下学期所写,他们有较好的英语基础,写作能力较强。作文

A的作者是班里中游学生,作文 B的作者是班里的优秀生。首先将两篇作文分两次复制粘贴到页面空

白处,然后点击 Submit,就出现作文 A和 B的描述内容(见表1和表2),为了便于比较,我们将两篇作文A和B的显示结果合二为一。由于篇幅的限制,只提供了部分内容。

表1 作文A和作文B词汇多样性(类符形符比)及词汇密度

类别 作文A 作文B

形符Wordsintext(tokens) 352 342

类符Differentwords(types) 167 182

类符形符比Type-tokenratio 0.47 0.53

词汇密度Lexdensity(contentwords/total) 0.52 0.56

表2 作文A和作文B词汇频数概貌统计

类符Types 形符Tokens 百分比Percent

作文A 作文B作文A 作文B作文A作文B

K1Words(1-1000):

127 132 310 284 88.07 83.04

K2Words(1001-2000)

17 15 18 15 5.11 4.39

1K+2K 93.18 87.43

AWLWords(学术词汇):

12 17 13 20 3.69 5.85

Offlistwords(词表外词汇)

11 18 11 23 3.13 6.73

  通过表1,可以看出作文A有167个类符和352个形符,而作文B有182个类符和342个形符。作文A的词汇多样性 (类符形符比)是0.47,而作文B词汇多样性(类符形符比)是0.53。作文 A词汇密度0.52,作文 B的词汇密度0.56。通过这些数字,我们可以清楚地看出作文B比作文A词汇量使用范围大,文章更难、更复杂些。

我们运用词汇频数概貌(如表2)进一步考察两篇作文词汇的使用,作文 A用的词汇88.07%是包含在最常用1000词族之中,而作文 B使用的词汇

83.04%来自最常用的 1000词族。作文 A中 93.18%的词汇来自前2000常用词族,而作文 B中87.43%的词汇来自前 2000常用词族。梁茂成等(2010:138)的研究表明,学术词汇及词表外词汇是更可靠的篇章难度判别标准。作文 A使用的非常用词族[学术词汇(3.69%)+词表外词汇(3.13%)]占文章6.82%,而作文B使用的非常用词族[学术词汇(5.85%)+词表外词汇(6.73%)]占文章12.58%。由此,也可以看出作文 B比作文 A词汇范围使用广得多,这进一步印证了表1的统计结果。虽然作文B词汇使用范围较广,但与以英语为母语的学生写作词汇相比还有很大差异,Ringbom(1998)研究得出的结论为在 K1(1-1000词汇),K2(1001-2000词汇),AWL(学术词汇)和 Offlistwords(词表外词汇)学生写作用词比例分别为70%,10%,10% 和10%,这说明中国学生过度使用了最常用的1000词汇,而少用了其他的词汇。

如果查看页面其他部分,还可知道该作文功能

词和实词的区分,第二级1000高频词族(K2)、学术专用词汇以及词表外词汇的区分。例如:作文 A中学术专用词汇(AWL)包括 adapt,adequate,beneficial,create,creative,ignore,job,methodology,motivated,mutually,obvious,passive。词表外词汇包括additionally,engaged,enjoyably,forthly,inactive,prefare,routinely,superior,thridly,viewpoint,worthwhile(带星号的是错误拼写)。教师和学习者就可以清楚看到作文中用了哪些生词,它们的使用

特点,为词汇学习起到重要的反馈作用。本文对比

是横向比较,比较两个学习者的词汇使用量大小及

词汇使用差异。可以纵向比较某一个学习者在不同

时期的作文词汇使用量,这样可以跟踪一个学生某

个时期内词汇范围使用的变化及词汇的使用特点,

可以看出学生词汇量的动态发展过程。

6.0结论语料库是语言教学潜在的丰富资源,如今这已

达成共识。运用在线免费语料库进行词汇学习为学

习者开辟了一条新途径,语料库能提供词汇多种真

实语境,具有信息量大,语言形式反复突显出现的特

点,学习者可以基于语料,进行数据驱动式学习,通

过对比检索词条及语料库的其它功能,提高学习者

词汇学习效率和评估能力。运用语料库,学习者可

以增强其自主学习能力,提高语言学习的动机和兴

趣,语料库起到重要的“支架”作用。在基于语料库

的词汇学习和评估的初始阶段,可以进行师生合作

式的学习,然后可以逐渐过渡到学生自主性的词汇

学习,自己确定任务,自己寻求解决办法,自己评估

学习效果,使学生真正从学习者变成“研究者”。

86

Page 6: 基于在线免费语料库 TheCompleatLexicalTutor 的词汇自主学习与 …

参考文献

[1]Adolphs,S.IntroducingElectronicTextanalysis[M].London:Routledge,2006.

[2]Biber,D.UniversityLanguage:ACorpusbasedStudyofSpokenandWrittenRegisters[M].Amsterdam:JohnBenjamins,2006.

[3]Carter,R.LanguageandCreativity:Theartofcommontalk[M].London:Routledge,2004.

[4]Coxhead,A.ANewAcademicWordList[J].TESOLQuarterly,2000,34:213-238.

[5]Cutting,J.PragmaticsandDiscourse(secondedition)[M].London:Routledge,2008.

[6]Ellis,N.C.Vocabularyacquisition:Wordstructure,collocation,wordclassandmeaning[A].InN.Schmitt&M.McCarthy(eds.).Vocabulary:Description,AcquisitionandPedagogy[C].Cambridge:CambridgeUniversityPress,1997.122-139.

[7]Ellis,R.Principlesofinstructedlanguagelearning[J].System,2005,33:209-224.

[8]Hunston,S.CorporainAppliedLinguistics[M].Cambridge:CambridgeUniversityPress,2002.

[9]Johns,T.Contexts:Thebackground,developmentandtriallingofaconcordancebasedCALLprogram[A].InA.Wichmann(ed.).TeachingandLanguageCorpora[C].Essex:AddisonWesleyLongmanLimited,1997.100-115.

[10]Laufer,B.&P.Nation.Vocabularysizeanduse:LexicalrichnessinL2writtenproduction[J].AppliedLinguistics,1995,16(4):307-322.

[11]Leech,G.Teachingandlanguagecorpora:Aconvergence[A].InA.Wichmann(ed.).TeachingandLanguageCorpora[C].Essex:AddisonWesleyLongmanLimited,1997.1-23.

[12]Linnamd,M.LexisinComposition:APerformanceAnalysisofSwedishLearners’WrittenEnglish[M].Malmo:LiberForlagMalmo,1986.

[13]Macaro,E.LearningStrategiesinForeignandSecondLanguageClassrooms[M].London:Continuum,2001.

[14]Nation,P.LearningVocabularyinAnotherLanguage[M].Cambridge:CambridgeUniversityPress,2001.

[15]Ringbom,H.VocabularyfrequenciesinadvancedlearnerEnglish:Acrosslinguisticapproach[A].InS.Granger

(ed.).LearnerEnglishonComputer[C].London:Longman,1998.41-52.

[16]Schmidt,R.Deconstructingconsciousnessinsearchofusefuldefinitionsforappliedlinguistics[J].AILAReview,1994,11:11-26.

[17]Schmidt,R.Attention[A].InP.Robinson(ed.).CognitionandSecondLanguageInstruction[C].Cambridge:CambridgeUniversityPress,2001.3-32.

[18]Schmitt,N.Usingcorporatoteachandassessvocabulary[A].InM.Tan(ed.).CorpusStudiesinLanguageEducation[C].Bangkok:InstituteforEnglishLanguageEducationPress,2002.

[19]TheCompleatLexicalTutor,V.4TESLEJ(TheElectronicTournalforEnglishasasecondLanguage)2004,8(3)[J/OL].[2011-12-10]http://tesl-ej.org/ej31/m2.html

[20]West,M.AGeneralServiceListofEnglishWords:WithSemanticFrequenciesandaSupplementaryWordlistfortheWritingofPopularScienceandTechnology[M].London:Longmans,GreenandCo.,1953.

[21]陈建林.基于 CEW语料库的大学英语专业学生两种体裁作文词汇丰富性研究 [J].天津外国语大学学报,2011,(4):55-61.

[22]邓联健.二语产出性词汇能力发展综述[J].外语与外语教学,2006,(2):25-27.

[23]胡显耀.基于语料库的翻译共性研究新趋势[J].解放军外国语学院学报,2011,(1):56-62.

[24]李文中.基于英语学习者语料库的主题词研究[J].现代外语,2003,(3):283-293.

[25]梁茂成,李文中,许家金.语料库应用教程 [M].北京:外语教学与研究出版社,2010.

[26]马广惠,文秋芳.大学生英语写作能力的影响因素研究 [J].外语教学与研究,1999,(4):34-39.

[27]濮建忠.英语词汇教学中的类联接、搭配及词块[J].外语教学与研究,2003,(6):438-445.

[28]权立宏.英语口语词汇学习的语料库方法探讨[J].广东外语外贸大学学报,2008,(3):79-82.

[29]滕延江,刘世铸.基于语料库的英语写作教学新模式[J].外语电化教学 2006,(4):49-54.

[30]张济华,高钦,李玉香.语料库与大学英语教学改革[J].山东外语教学,2008,(5):64-68.

[31]张淑静.中国英语专业学生 make的使用特点调查报告[J].解放军外国语学院学报,2002,(4):58-63.

UsingFreeOnlineCorpora“TheCompleatLexicalTutor”toLearnandAssessVocabularyLIUYushan,HUZhijun

(SchoolofForeignLanguages,ShandongUniversity,Jinan250012,China)Abstract:Thepaperbrieflyintroducesthecontentandfunctionsoftheonlinecorpora“TheCompleatLexicalTutor”.Students

areencouragedtouseDatadrivenLearningApproachtoexplorethesubtledifferencesofsynonymsandcollocations,thedifferentfrequenciesofthewordsinspokenandwrittenEnglishcorpora,thedifferentpragmaticfunctionsofthewordsandidentifysomenewwordsaswell.Thisapproachcaneffectivelyenhancestudents’noticingandmemorizationofthewords.Besides,theVocabprofileisusedtomeasurelexicalproficiencyintwostudents’compositionswhichdeterminesthedifficultyofthetextstoalargercontentandprovideseffectivefeedbacktovocabularylearningandwriting.

Keywords:corpora;DatadrivenLearning;vocabularylearning;vocabularyassessment

96