创建Wiki翻译语料库的构想 - celea.org.cn · 岑秀文 65...

5
64 中国外语教育(季刊) Foreign Language Education in China (Quarterly) 2008 年 11 月 November 2008 第1卷 第4期 Vol. 1 No. 4 1. 引言 当前,翻译平行语料库建设在国内外取得 了很大发展,但存在取料耗资耗时,构建和使用 只能局限于部分研究者的不足。翻译的个体差异 性、跨学科的广泛性及实用的社会性决定了传统 语料库的局限性。Wiki 是一种因互联网而产生的 理念和技术,其中 Wikipedia(维基百科)是世界 上最大的 Wiki 系统。《自然》杂志的一项研究报 告认为,Wikipedia 的准确性与权威已与大英百科 全书(Britannica)相当(陈世钦 2006)。Wiki 式广泛用于传媒、企业等各个领域,如 Google 司和摩托罗拉公司一直使用 Wiki 系统进行管理。 Wiki 在教育领域的应用尚在起步阶段。上海中医 药大学徐平教授的“针灸研究和教学”,率先利 Wiki,师生一起进行国家课题的研究和内容共 创(庄秀丽 2004)。基于 Wiki 的开放性、便捷性 与广泛性等特点,本文提出创建 Wiki 翻译语料库 的构想,以此来丰富传统翻译语料库的功能。 2. 传统翻译语料库和 Wiki 简介 2.1 传统翻译语料库 语料库是按照一定的语言原则,运用随机抽 创建Wiki翻译语料库的构想 岑秀文 河北工业大学 © 2008 中国外语教育(4),64-68页 要:本文提出以Wiki模式创建翻译语料库的构想。Wiki翻译语料库将增强传统语 料库的功能,促进翻译学习、实践和研究理念及模式的改变。 关键词:翻译;Wiki;语料库 样方法,收集自然出现的连续的语言,运用文本 或话语片段而建成的具有一定容量的大型电子文 本库。从其本质上来说,语料库实际上是通过对 自然语言运用的随机抽样,以一定大小的语言样 本代表某一研究中所确定的语言运用总体(杨惠 200277)。翻译语料库方面则以英国曼彻斯 特大学科技学院(VMIST)翻译研究中心 1995 年创建的世界上第一个翻译语料库(Translational English Corpus, TEC) 最 为 著 名( 柯 飞 2002)。 自此,涌现了一批如 Mona BakerGideon TouryMiriam ShlesingerKirsten Malmkjaer 等语料库翻 译研究代表性理论家(廖七一 2000380-384)。 Baker 为例,她把 TEC 用于语言频率统计、 双语词典编纂、双语词语搭配对比、翻译教学和 译员培训等各方面。如今,语料库和语料库语言 学成了功能主义和结构主义两阵对垒的天平上一 个举足轻重的砝码(顾曰国 19981)。各国关于 翻译语料库的研究和应用已成为研究的热点且发 展迅猛。 国际上,只有少数如 COBUILD, TEC 等语 料库能够提供在线索引,而且即使能够提供在 线索引的几个语料库,功能也较单一,几乎只 是起到演示作用。在国内,就汉英双语对照语 料而言,尚且没有超过 10 万句对的平行语料

Transcript of 创建Wiki翻译语料库的构想 - celea.org.cn · 岑秀文 65...

Page 1: 创建Wiki翻译语料库的构想 - celea.org.cn · 岑秀文 65 库公开出版;相关的研究和介绍主要侧重于双 语语料的对齐技术和双语平行语料的应用技术,

64

中国外语教育(季刊)

Foreign Language Education in China (Quarterly)

 2008 年 11 月 November 2008

第 1卷  第 4期 Vol. 1 No. 4

1.引言

当前,翻译平行语料库建设在国内外取得

了很大发展,但存在取料耗资耗时,构建和使用

只能局限于部分研究者的不足。翻译的个体差异

性、跨学科的广泛性及实用的社会性决定了传统

语料库的局限性。Wiki 是一种因互联网而产生的

理念和技术,其中 Wikipedia(维基百科)是世界

上最大的 Wiki 系统。《自然》杂志的一项研究报

告认为,Wikipedia 的准确性与权威已与大英百科

全书(Britannica)相当(陈世钦 2006)。Wiki 模

式广泛用于传媒、企业等各个领域,如 Google 公

司和摩托罗拉公司一直使用 Wiki 系统进行管理。

Wiki 在教育领域的应用尚在起步阶段。上海中医

药大学徐平教授的“针灸研究和教学”,率先利

用 Wiki,师生一起进行国家课题的研究和内容共

创(庄秀丽 2004)。基于 Wiki 的开放性、便捷性

与广泛性等特点,本文提出创建 Wiki 翻译语料库

的构想,以此来丰富传统翻译语料库的功能。

2.传统翻译语料库和Wiki 简介

 

2.1 传统翻译语料库

语料库是按照一定的语言原则,运用随机抽

创建Wiki翻译语料库的构想

岑秀文

河北工业大学

© 2008 中国外语教育(4),64-68页

提  要:本文提出以Wiki模式创建翻译语料库的构想。Wiki翻译语料库将增强传统语

料库的功能,促进翻译学习、实践和研究理念及模式的改变。

关键词:翻译;Wiki;语料库

样方法,收集自然出现的连续的语言,运用文本

或话语片段而建成的具有一定容量的大型电子文

本库。从其本质上来说,语料库实际上是通过对

自然语言运用的随机抽样,以一定大小的语言样

本代表某一研究中所确定的语言运用总体(杨惠

中 2002:77)。翻译语料库方面则以英国曼彻斯

特大学科技学院(VMIST)翻译研究中心 1995

年创建的世界上第一个翻译语料库(Translational

English Corpus, TEC)最为著名(柯飞 2002)。

自此,涌现了一批如 Mona Baker、Gideon Toury、

Miriam Shlesinger、Kirsten Malmkjaer 等语料库翻

译研究代表性理论家(廖七一 2000:380-384)。

以 Baker 为例,她把 TEC 用于语言频率统计、

双语词典编纂、双语词语搭配对比、翻译教学和

译员培训等各方面。如今,语料库和语料库语言

学成了功能主义和结构主义两阵对垒的天平上一

个举足轻重的砝码(顾曰国 1998:1)。各国关于

翻译语料库的研究和应用已成为研究的热点且发

展迅猛。

国际上,只有少数如 COBUILD, TEC 等语

料库能够提供在线索引,而且即使能够提供在

线索引的几个语料库,功能也较单一,几乎只

是起到演示作用。在国内,就汉英双语对照语

料而言,尚且没有超过 10 万句对的平行语料

外语教育技术

Page 2: 创建Wiki翻译语料库的构想 - celea.org.cn · 岑秀文 65 库公开出版;相关的研究和介绍主要侧重于双 语语料的对齐技术和双语平行语料的应用技术,

岑秀文

65

库公开出版;相关的研究和介绍主要侧重于双

语语料的对齐技术和双语平行语料的应用技术,

对大规模双语平行语料库的系统性构建却较少

(刘荣 2006:84-85)。如何使现有翻译语料库语

料更广泛,操作更简便,更具即时性,易于为

大众应用,集学习、研究和使用为一体,是一

个很值得探究的话题。

 

2.2 Wiki 简介

Wiki(维客或维基)是一种社会软件,用于

社群内的协同创作,所有成员都可以对其内容进

行浏览、创建、更改,同时所有修改过的页面都

会得到保存。其特点有:(1)使用方便。简单的

格式标记取代 HTML 格式,降低了写作和发布

难度。(2)汇聚功能。用户多样性使内容相对全

面、客观和公正。(3)主题明确。每个页面都有

一个被置于单独命名层次中的明确主题,不会造

成网站结构混乱。(4)即时更新。任何人对页面

的修改或创建都可即时反应出来。

为维持网站的正确性,Wiki 在技术上和运

行规则上做了一些规范:(1)保留网页每一次更

动的版本。(2)主要页面可用锁定技术将内容锁

定。(3)每个页面都有更新纪录,两个版本之间

可进行对比,自动找出彼此差别等。

3.Wiki 翻译语料库的构建

 

3.1 构想的萌芽

徐彬(2006:62)指出可以参照维基百科的

成功之路,建立一个全体网络用户都可以参与编

辑修订的开放式多语名词数据库。国际知名的翻

译交流网站 ProZ.com 2006 年 4 月的电子通讯 ,

宣布了一个可以用所有语种,把所有词汇的概念

进行编写的 Wikiwords 动态在线语料库(ibid.)。

截至 2008 年 9 月 19 日,该在线语料库主页介

绍的术语翻译为 900 多语言对(language pairs)

(Wikiwords website 2008)。Bowker 提出了一种

基于语料库的翻译教学方法 , 即在翻译课堂上让

学生以合作形式建立针对特定专题如计算机、财

经、法律等的翻译语料库 ( 邓 静、穆雷 2005:

318-320)。

传统的翻译语料库的建设在不断的发展和完

善中,其应用和研究也越来越广泛。把 Wiki 理

念引入其中,尤其是语料的采集和加工过程,将

使翻译语料库更具代表性、开放性。基于以上情

况,本文作者萌发了创建 Wiki 翻译语料库的想

法。以下将对其构建规划进行探讨。

3.2 构建范围

以 Wiki 理念建设的翻译语料库可以是世界

性的,也可以是国家、城市、大学、公司或社区

的范围,虚拟社区内共同完成多语种互译工作。

我们还可以建立分学科的、专业化的 Wiki

翻译网站和团队,来形成不同专业人员的网络

联盟和翻译专业化学习社区。比如就翻译研究

而言,就可以建立国际会议语料库平台,以

“翻译语料库的构建”议题为例,世界各地的爱

好者都可以把自己的构建雏形发到平台上,在

虚拟的平台随时“召开国际会议”,共同完成论

文、项目等。

3.3 技术支持与运行管理

现在已经有很多可供参考使用的软件,也可

根据翻译语料库建设的特定需要来设计开发相应

的 Wiki 软件。

专职技术人员和志愿者的参与对 Wiki 翻译

语料库正常的运行和管理是必需的。根据所建库

范围及规模的差异,来确定特定环境下的运行和

管理模式。如教育部门可以在城域网上架构,综

合性大学也可以在自己的局域网上架构 Wiki 系

统,逐渐建成功能完备的翻译语料库,以供特定

范围人群学习和研究。

具体而言,学校要建立 Wiki 后台系统较

简单的方式有三种:申请 Wiki 网站提供的注

册服务,建立小组讨论模式;使用桌面 Wiki

软件;或者是在服务器端构架 Wiki 后台系统

(于洋 2007:5)。目前最常用的 Wiki 引擎有

MediaWiki、MoinMoin、PmWiki、CooCoWakka、

TaviWiki 等。

目前网络上的翻译平台大多“安家”在不同

Page 3: 创建Wiki翻译语料库的构想 - celea.org.cn · 岑秀文 65 库公开出版;相关的研究和介绍主要侧重于双 语语料的对齐技术和双语平行语料的应用技术,

创建 Wiki 翻译语料库的构想

66

的网站,彼此之间相对独立,参与的人群和信息

共享都很有限。因此我们提倡中小规模的 Wiki

翻译语料库不断扩展、联合,实现以点到面的普

及,从而逐渐形成大的翻译网络平台。我们同样

鼓励更多的翻译工作者在研究和实践中使用和维

护 Wiki 翻译语料库。最终建成全球性的 Wiki 翻

译网络平台。

4.Wiki 翻译语料库的优势

 

4.1 提供最及时的语料数据

在语料库建设中,需要认真考虑语料的

获得渠道和方式,语料的格式和编码及索引软

件等,这些工作都很复杂,非常耗时(杨惠中

2002:333)。然而,语言是发展的,大型语料

库建设往往要耗时数年,翻译的即时性要求语

料库以第一时间、开放性地提供可供参考的语

言资源,Wiki 系统则可随时为教学、研究和实

践提供最新的语料数据,其取料、加工等也更

方便。

4.2 有助于翻译跨学科问题的解决

跨学科性导致翻译人员对某一特定领域的知

识永远不能满足需要。中国的翻译市场 95% 是

非文学文本,人才、技术的不足导致大量的外文

信息未能翻译(李长栓 2004:20)。基于 Wiki 理

念,各个领域的专业人士都可加入 Wiki 平台。

他们包括各学科领域的专家、翻译需求者(市场

和出版社等)、译者、翻译研究者。不同学科人

员联系起来,语言优势和专业优势结合,充分考

虑需求者和研究者的意见,各层面人士共同产生

最大限度符合需求的译文。

4.3 实现译文的多语种化

中国小语种翻译人员更为缺乏,Wiki 上已

完成汉英翻译的文本可进一步实现小语种的翻

译。懂多种语言的人在欧洲很普遍,Wiki 上的

汉英双语文本,可以很容易由欧洲的参与者按照

英译本,译成多国文字,如法语,德语,西班牙

语,俄语,葡萄牙语,挪威语,芬兰语等欧洲语

言。另外非洲和拉美很多地区的人能讲英语和法

语,那里一些较小语种的翻译也可用英、法译本

作为蓝本。

Wiki 实现小语种翻译是由母语是目的语的

译者完成的,解决了类似于中式英语的问题。翻

译的理想状态是译者的母语是目的语,然而目前

大量的汉译英工作仍需母语是汉语的人来做。如

果存在 Wiki 翻译平台,一些国外热爱中国文化

的人,可从文化和语言角度,对母语是汉语的译

者所做译文进行评论,建议,甚至是编辑、译

审、译校工作。

Wiki 合作模式可以采用志愿者形式,也

可以由翻译公司协调,采用国际信用卡付费

方式。

4.4 为翻译实践和研究提供更优质的取样

维基百科的指导手册称:“观点中立是为了

提供支持者和反对者都认同的思想和事实”(见

维基百科主页)。Wiki 的编辑以保持开放、中立

观点为指导原则 , 这与描写性翻译研究主张描述

和理解翻译的原生态思想不谋而合。

翻译的实证研究很难大范围取样,可读性

和读者反应一直是翻译批评的瓶颈。Wiki 翻译

库可以更方便、快捷地来测定大规模读者群的反

应,同时自然也就得到了大多数人认可的译法。

而且,传统取样中由于受试者的被动性,不可能

所有受试者都对测试话题感兴趣,在 Wiki 平台,

参加者出于自发和自愿,因而表露的观点更真

实。一如许多关于有争议问题的词条,在维基百

科下得到更全面的阐释一样,有争议的翻译问题

也可放 Wiki 平台讨论。例如,在 Wikipedia 中,

“全球化”这个词两年里被编辑次数达 90 多次。

编辑网页的网友来自 10 个国家,世界各种组织,

如世界贸易组织、跨国公司,甚至反全球化运动

的组织也发表了自己的看法。同理,如对《尤

利西斯》的两个译本的读者取向等问题都可以在

Wiki 得到全面的反馈,从而以最及时、最全面

的方式得到更为客观的评价。这一系列的参与

过程同时又是 Wiki 翻译库提供给翻译研究的最

好取样。

Page 4: 创建Wiki翻译语料库的构想 - celea.org.cn · 岑秀文 65 库公开出版;相关的研究和介绍主要侧重于双 语语料的对齐技术和双语平行语料的应用技术,

岑秀文

67

4.5 有助于更深入地进行描写性翻译研究

4.5.1 描写性翻译研究的要求

科学研究的基本要求是按照对象的特点来把

握对象(欧阳康 2001:336)。由于包括译者、读

者、政治背景等的翻译研究对象具有变动性,只

有多义性的诠释,深入的描述,经验的分享达成

真实的理解,才能客观地对翻译进行评价。翻

译平行语料库最重要的贡献正在于它使人们认

识到翻译研究应从规定性向描写性过渡(Baker

1995:231)。TEC 遵循文本内部—译者文体—

外部的社会文化环境的研究模式,从而把语言习

惯、译者背景和翻译需求等在研究中联系起来。

TEC 的创建者 Baker 认为这种研究涉及面广泛,

需要较长的时间及多方面的描写翻译作品的数据

才能弄清楚,同时也承认有不少问题仍需进一步

探讨(张美芳 2002:54-57)。

4.5.2 Wiki 进行描写性研究的优势

Wiki 可多方面收集翻译作品的相关数据。

Wiki 社群交流的方式符合翻译研究所需要的参与

性观察、交往行动和描写收集等条件。(1)可以

提供参与者自传性质的描写。Wiki 可提供参与者

的翻译记录,翻译理论备忘录(比如在翻译实践

中联想到的相关理论观点)、他人观点摘录和推

论等。(2)可以体现文献分析的重要性。Wiki 可

记录包括相关日期、作者、任务、背景事件、市

场要求和氛围等情况,对研究者进行翻译背景的

描写和进一步阐述有重要意义。

4.5.3 Wiki 翻译语料库符合阐释学标准

Wiki 平台能满足深度描写研究所需要的阐

释学标准(邓金 2001)。通过 Wiki,所有参与者

之间的对话,即对翻译过程的理解和诠释得以充

分展示;而且阐述结构是连贯的,过程是开放

的。这样,翻译研究和实践在协同合作中体现的

历史性、过程性、关系性特征得以充分体现,从

而做到对翻译的深度描写。

总之,我们不能仅靠一套规范并有固定选项

的调查问卷来获取诸如译者背景、翻译动机和研

究者目的等的诠释,利用 Wiki 这一工具可以更

深入了解译者的认知过程和翻译动机。

5.困难预测

运用 Wiki 促进翻译领域发展是一个缓慢的

过程,这需要很多人的努力。Wiki 翻译语料库需

要更多专业人士共同完成,因此它有一个探讨、

完善的过程。

我们初步预测了 Wiki 翻译语料库建设中的

困难。(1)有些人对其内容可信度可能提出质

疑。Wikipedia 初始是在很多网站宣传,而 Wiki

翻译语料库,如何让很多人来认识它,激起拥护

者的热情,需要大量志愿者投入。(2)如何将

Wiki 和现有的传统翻译语料库进行嫁接、在不同

层次进行有效组织还有待深入探索。

6.结语

本文提出了用 Wiki 模式和理念创建由点到

面的翻译语料库的构想,以求不断完善现行翻译

语料库的功能。在后现代主义者看来,在一个计

算机、网络化的社会里知识的标准将发生根本性

的变化,运作的可能性将成为判断各类知识的

唯一标准。如何把 Wiki 技术和传统语料库结合,

增强翻译组织内部和外部的开放性和自由度,提

高团队合作效率,为人类知识的共创、分享提供

有力的技术支持和应用模式样板,需要进行大量

深层次的挖掘。当然,这需要所有翻译人的智

慧,同时也有不可估量的意义和前景。

参考文献

Baker, M. 1995. Corpora in translation studies: An overview and some suggestions for future research [J]. Target (7): 231.

Wikiwords website. 2008. History [OL]. http://www.wikiwords.org/wikiwords?pg=about(Accessed 4/11/2008).

陈世钦,2006,百科争霸战——大英杠上“自然”

[OL],http://news.sina.com/udn/105-103-102-104/

Page 5: 创建Wiki翻译语料库的构想 - celea.org.cn · 岑秀文 65 库公开出版;相关的研究和介绍主要侧重于双 语语料的对齐技术和双语平行语料的应用技术,

创建 Wiki 翻译语料库的构想

68

中国外语教育(季刊)

Foreign Language Education in China (Quarterly)

 2008 年 11 月 November 2008

第 1卷  第 4期 Vol. 1 No. 4

2006-03-25/1155757063.html(2008 年 11 月 4 日

读取)。

邓金,2001,《诠释性交往行动主义》[M]。伦敦:

Sage 出版公司。

邓静、穆雷,2005,象牙塔的逾越:重思翻译教学介

绍 [J],《外语教学与研究》(4):318-320。 顾曰国,1998,语料库与语言研究——兼编者的话 [J],

《当代语言学》( 试刊 ) (1):1。柯飞,2002,双语库:翻译研究新途径 [OL],http://

www.corpus4u.org/show thread.php?t=395(2008年 11 月 18 日读取)。

李长栓,2004,《非文学翻译理论与实践》[M]。北京:

中国对外翻译出版公司。 廖七一,2000,语料库与翻译研究 [J],《外语教学与

研究》(5):380-384。刘荣,2006,构建大规模的汉英双语平行语料库 [J],

《太原科技》(10):84-85。欧阳康,2001,《人文社会科学哲学》[M]。武汉:武

汉大学出版社。

徐彬,2006,CAT 与翻译研究和教学 [J],《上海翻译》

(4):62。杨惠中,2002,《语料库语言学导论》[M]。上海:上

海外语教育出版社。

于洋,2007, BLOG-WIKI 技术在促进知识发展中的

应用研究。硕士学位论文 [D]。长春:东北师范

大学。

张美芳,2002,利用语料库调查译者的文体 [J],《解

放军外国语学院学报》(3):54-57。朱永生,2006,名词化、动词化与语法隐喻 [J],《外

语教学与研究》(2):83-90。庄秀丽,2004,善用 WIKI [OL],http://www.chinaet.

org/content/54/2589.aspx(2008 年 9 月 2 日读取)。

作者简介

岑秀文(1971—),河北工业大学外国语学院讲

师。主要研究领域:翻译教学、外语教育技术。电子

邮箱:[email protected]