- 行业新闻
-
基于受控语言的译前编辑对机器翻译的影响
发布时间:2017-09-19 14:42 点击:
机器翻译在语言服务行业发挥着越来越重要的作用,如何提高机器翻译的准确度是急需解决的问题。除机器翻译技术本身的改进之外,人工参与是提高机器翻译质量的重要途径,这也是典型的人机交互翻译。针对机器翻译的交互而言,主要可分为两种:译前编辑与译后编辑。译前编辑是指在机器翻译之前对需要翻译的文本或文档进行有针对性的修改编辑以提高机器翻译产出的质量,译后编辑则是指对机器翻译的原始产出进行修改编辑的过程,目的也是为了通过人机结合提高机器翻译的最终质量。有效的译前编辑可以在很大程度上减少译后编辑者的工作量,所以业界有时也把译前编辑视为(广义)译后编辑的有机组成部分。一般而言,译前编辑与机器翻译的充分译后编辑密切相关,两者都是为了有效地传播信息,需要保证较高或可出版(publishable)的翻译质量。然而,如何进行译前编辑,什么样的文本适合进行译前编辑?有没有一定的规则可供遵循?是否可以运用受控语言(controlled language)的写作规则对文档进行译前编辑,基于受控语言的译前编辑对机器翻译质量的影响到底如何?基于实验与实例,本文尝试对这些问题进行解答,以探索受控语言在机器翻译的译前编辑方面的应用潜力。
如果原语文档使用受控语言写作,机器翻译的准确度便会大幅提高,尤其适用于多语发布的文档。胡清平曾指出,“翻译软件的研发和受控语言的推广是改进机器翻译质量的两个方向”,受控语言加机器翻译便是受控翻译(controlled translation),并提出了受控汉英翻译的设想与十点建议,对基于受控语言的译前编辑不无启示。当然,译前编辑并不能解决所有问题,因为很多机器翻译的错误是很难预知的,如果要达到较高的质量,还需要对机器翻译的产出进行译后编辑,刘毅就认为“无论机器多智能,也无论译者花了多长时间做译前编辑工作,未成功翻译的文本还是占有一定比例,我们不能完全依赖机器翻译,还需进行机器翻译后的编辑”。所以本文也会适当地讨论译后编辑,探讨如何通过基于受控语言的译前编辑以及对编辑过原文的机译产出进行译后编辑,以产生更高质量的译文。翻译自动化用户协会(TAUS)提供的译后编辑线上课程包括六个实践模块,其中之一便是译前编辑,这也一定程度上说明了译前编辑与译后编辑密不可分的关系。目前机器翻译主要应用于以下三个方面:(1)产生粗略的翻译,不需对原文或译文进行任何编辑,可称之为概要式或浏览式翻译;(2)对机器翻译的原始产出进行译后编辑以提高译文的质量(也包括译前编辑);(3)在某具体领域使用受控语言以生成较高质量的译文。通过初步实验,笔者认为,也完全可以把受控语言的写作原则应用到机器翻译的译前编辑之中,基于受控语言的译前编辑可以有效降低原文本身的复杂性与歧义性,提高机器翻译的可识别度(原文本身的可翻译性),从而减少(充分)译后编辑的工作量。
基于受控语言的译前编辑
目前已经有一百多种受控语言,广泛运用在大公司的技术文档写作中。通过采用语法和词汇的限制,受控语言提供更为清楚与直接的写作,减少词汇句法方面的歧义,提高了文档的可读性和可译性,使其更适合进行机器翻译,在大公司的科技文本系统中被广泛使用。受控语言采用受控词汇和受控语法,其中单词量和每个单词的意义都被严格控制以避免词法的歧义性,应用于机器翻译系统时是非常有利的。受控语法旨在强化清晰的风格,避免省略结构以及多重复合句的出现,把句法歧义(如介词短语结构、形容词修饰、回指短语等)降到最低程度。Mitamura 等和Nyberg 等提出了实施受控翻译的有利条件:翻译目的是为了传播信息,作者经过高水平训练,受控语言需经过检测者(软件)检验,应用领域为技术领域或特定领域。值得说明的是,受控翻译主要指文本写作时就使用受控语言以提高文本本身可理解性与可翻译性(针对机器翻译而言),基于受控语言的译前编辑主要是针对未使用受控语言的文本而言的。
机器翻译的译前编辑也可基于受控语言的写作规则进行规范,或者说对科技文本进行译前编辑也是受控翻译环境的组成部分。译者需要调整不同行业的文本使其适应受控语言写作指南,用来实现原语写作的连贯性以及提高这些文本的可译性。当描述语法和词性限制时,写作指南可在相关文献中轻易找到。Mitamura 等解释道,KANT机译系统所用的受控英语的词汇限制包括以下几个方面:尽量使用限定词等功能性词语;避免使用代词和连词,因为其容易增加句子歧义;在连词后面或简化关系从句中应该限制或减少使用分词形式(包括现在分词与过去分词),因此上述两个例子应改为:While you are driving the vehicle...和The directional stability that is caused by the wheel lock-up...。Mitamura 等(同上)还指出短语和句子限制的不同,在短语限制层面,要用单个动词替代动词短语(turn on应改为start),重复联合结构中的介词以避免歧义,如短语recorded memory of radio and each control unit是歧义的,因为它可以被解释为{recorded memory of radio} and {each control unit} 或 recorded memory {of radio and each control unit}。在句子限制层面,Mitamura 等(同上)指出有关并列句式(两部分应该处于同种形式),关系从句(应该由关系代词引入)以及省略结构(应尽量避免出现)的规则。Wojcik(1998)提供了波音所使用的受控语言的写作规则,指出:(1)诸如the,a,an,this和these这样的限定词应当合理使用;(2)在描述性写作中应该避免使用被动语态;(3)句子长度应该限定在25个单词以内;(4)应该避免超过三个单词的名词群;(5)不应该有超过两个形容词修饰一个名词或一个名词群;(6)现在分词的形式应该尽量避免;(7)动词后面的关联词that不能省略;(8)关系从句必须由关系代词引入;(9)并列结构中鼓励出现平行结构。这些受控语言的写作原则对机器翻译的译前编辑(英汉方向)基本上同样适用。
关于机器翻译的译前编辑,国内也略有探讨,个别学者也提出了受控语言在译前编辑中的作用。魏长宏探讨了几种译前编辑的方法,包括格式转换、拼写检查、句子调整、建立翻译记忆库、使用受控语言以及选择体裁和专业领域。魏长宏(同上)指出,受控语言是对原语的无限集进行一定的限制,这种限制分为自然限制和人为限制,自然限制指把研究对象局限于某一特殊领域内的子语言,人为限制指机器翻译系统附加上一个受控语言写作环境,让写作环境来提示作者写出满足机器翻译系统要求的句子,从而限制句型与句子的复杂度,保证系统处理的正确率。在魏长宏的研究中,采取受控语言只是译前编辑非常小的一部分,此部分的探讨远非充分与深入。吴慧颖以英国诺里奇市城堡博物馆荷兰画作的简介为例,研究了译前编辑与译后编辑分别使用机器翻译的对比。吴慧颖(同上)认为译前编辑所花费的时间和精力相对于译后编辑来说更长、更多,但其翻译效果并没有优于译后编辑。然而,这种观点有待商榷,针对可出版的机译质量而言,译前编辑与译后编辑更多的是一个整体,合理的译前编辑可以节省译后编辑的工作量,两者结合会比单纯的译后编辑节约精力。总之,“受控语言不仅可以提高技术文献的可读性和标准化程度,而且可以提高技术文献的可译性,是一种改进机器翻译质量比较有效的方法”。如果原文没有用受控语言写作的话,基于受控语言的译前编辑无疑也是提高机器翻译质量的有效途径。 北京翻译公司,天津翻译公司,郑州翻译公司,西安翻译公司,重庆翻译公司,长沙翻译公司,济南翻译公司,青岛翻译公司,- 上一篇:翻译质量管理的有效条件
- 下一篇:语言服务的类型


























