1. 引言
自然语言是在人类文明发展的漫长过程中自然形成的,它的形成是基于每个人所拥有的一种基本权利:自由创造语言符号和自由约定符号语义。而自然语言的“标准化”工作,则是以自由创造成果的自然流行为基础和前提。同时,机器翻译是人们通过对自然语言和人脑思维过程的理解,让计算机模拟人脑翻译过程来实现的。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics)、自然语言理解(NaturalLanguage Understanding)之间存在着密不可分的关系。目前,机器翻译仅仅是处理自然语言的一个研究分支,运用计算机翻译体系,把人类语言翻译的发展,转换成电脑的运算法则,使得电脑根据运算的法则,将输入的源语言翻译成所需要的目标语言……机器翻译对所涉及的语言现象往往采取一种简单化的处理态度,结果导致译文的可读性很差,难以付诸实用(冯志伟,2004)。机器翻译的发展依存于语言学的发展,即如何把源语言的词汇、语法结构对等地转换成目标语言的词汇语法结构。
目前市场上存在分别是以语法“规则”和“语料库”为基础的两种机译方法。从理论上来说,输进计算机中的规则和语言材料越多,翻译的质量也就越高。以最具特色、最具代表性的谷歌翻译为例,谷歌翻译目前可提供 63 种主要语言之间的实时翻译;它可以提供所支持的任意两种语言之间的互译,包括字词、句子、文本和网页翻译。甚至谷歌领先实现日常对话中的实时翻译,拥有较强的语音识别技术,可以通过声音实现自动检索,再将语音识别和机译结合在一起。
2. 机器翻译的瓶颈
到了 20 世纪 80 年代,“机器翻译”的研究进入了反思的理性阶段,其标志是开始有人质疑“机器翻译”这一概念,提出了我们必须区分机器翻译以下三种概念:(a) 机器翻译 (machine translation):全部翻译由机器完成,但是其结果必须经人工修订;(b) 辅助手段 (computer aids fortranslators):翻译活动由人工进行,机器翻译只是作为人们翻译时使用的辅助工具;(c) 非翻译人员为获取梗概大意偶尔使用的机器翻译系统 (translation systems for the“occasional” non-translator user)(John Hutchins,2001)。
中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。同时,他还指出:在人类尚未明了“人脑是如何进行语言的模糊识别和逻辑判断”的情况下,机译要想达到“信、达、雅”的程度是不可能的。这也是制约机译质量提高的一大瓶颈。值得一提的是,美国发明家、未来学家雷·科兹威尔最近在接受《赫芬顿邮报》采访时预言,到 2029 年机译的质量将达到人工翻译的水平。对于这一论断,学术界还存在很多争议。
我们现在的语言信息处理最先要解决的问题就是消除歧义。自然语言在词汇、句法、语义、语用等各个层面都充满歧义,请看下例 :
例 . 在对企业产生兴趣后,便要了解企业提供的职位,所需的人数和所需的专业,而这些便是职位需求的内容。
* In the interest of enterprise, and to understandthe enterprise provides the position, the number andthe professional, and these are the contents of theposition’s requirements.
就词汇层面而言:“产生兴趣”“专业”等都存在误译;句子层面上是一个介词短语和一个不定式串接,且设置为状语;从语义上看更是混乱,没有明确的主语和句间关系的体现。
经整合译为:Have been interested in the enterprise,we need to know the positions offered by enterprises,the required number and the desired professions, whichare the contents of the job demand.
不难看出,影响机译发展的最大因素在于译文的质量。就已有的成就来看,机译的质量离终极目标仍相差甚远。
3. 机器翻译毕业论文摘要
摘要是论文的缩影,在质方面的要求是要准确把握论文内容。在许多情况下,读者不必通读全文,只要看完摘要就会知道论文的梗概。尤其在英语专业毕业论文写作中,因为其他部分可参阅资料,而摘要部分必须双语一致且要自己整理撰写,因此,写好摘要对顺利完成论文写作至关重要。从语言研究的角度来说,机器翻译系统分析、理解和生成自然语言的能力还不到位,处理不了的语言现象很多。英语和汉语的语义和结构的解析过于简单化,使目前英汉机器翻译模式缺乏可信赖性。以下是一则毕业论文中文摘要,分别用有道翻译、爱词霸翻译(百度在线翻译与之相同)、和在线翻译进行中文摘要的翻译。
本文以中美企业招聘广告作为研究对象,从企业基本情况描述、职位需求、学历要求和继续教育、职位要求和具体能力素质方面、具体薪酬和培训发展机会、歧视问题、声明或愿景七个方面进行对比分析,归纳出中国企业在招聘广告中描述方式的不足,并给予了适当建议。
为便于机译翻译的分析,现将四种机译结果融合:
This article by the Chinese and American Enterprisewant ad took the object of study, from the enterprisebasic situation description, the position demand, theschool record request and the continuing education,the position request and the concrete abilityquality aspect, specific compensation and trainingand development opportunities, discrimination, thestatement or the prospect seven aspects of comparativeanalysis, summarized the Chinese enterprises in therecruitment ads describe the shortage of the way, andgive appropriate advice.
分析:(1)英语词汇选用错误。从词汇角度来看,商务英语词汇具有较强的专业性,常被认为专门词汇,需要专业知识和英语的综合运用。如“继续教育”(further education),“声明或愿景”(statement or vision description)等。
(2)机译语序错误。在进行商务英语论文写作时,句法、语义及语用就必须做深层次思考。英语句型有避免头重脚轻原则;中文摘要在对招聘广告进行大量描述后,才进入主句意义中;英文则不然。如“本文以中美企业招聘广告作为研究对象,从……七个方面进行对比分析”(With the objectof recruitment advertisements between Sino-Americanenterprises, this thesis will make a comparativeanalysis from seven aspects, such as…)。
(3)语言表述不规范。如“以……为研究对象”(Withthe object of…),“ 归 纳 …… 不 足”(summarize theadequacies of…)。
(4)语态使用不恰当。英文摘要重点突出摘要的客观性,同时突出摘要所要表达的相关信息。如“给予了适当建议”(theproper suggestions are offered)。
(5) 时态错误。在介绍论文研究内容、结论等客观事实时,一般现在时使用得最为广泛,主要用于陈述性、资料性文摘中,而有道翻译用了一般过去时态(summarized)。
4. 解决途径
从上述分析中,我们理解了机器翻译的瓶颈,但也看到机器翻译的广泛应用和不断完善。作为学生群体,如何更好地利用机器翻译,这也是本文的重点之一。由于语言的线性特征,学生在做机器翻译时必须首先分析语言语境,分析语言语境基本上能够确定原句的唯一意义 ( 贺学耘等,2007),能够分析上下句间的指代、替代、省略、连接、重复等的这些关系,才能够产生正确的可以接受的译文。
机器翻译的新课题之一——基于语料库的方法,对于相同或相似文本的翻译有非常显着的效果,随着例句库规模的增加,其作用也越来越显着。对于实例库中的已有文本,可以直接获得高质量的翻译结果。对与实例库中存在的实例十分相似的文本,可以通过类比推理,并对翻译结果进行少量的修改,构造出近似的翻译结果。学生应尽可能比较对比几类翻译结果,并进行类比推理,再结合专业知识进行信息组合。
机器翻译要求对所涉及的语言的各种知识和规律在计算机中表示、存贮和处理。因此,如何设计一种强有力的语言规则知识表示形式,即文法规则表示形式,并以此为基础,设计面向各种不同自然语言的结构分析规则体系,是机译系统开发中要解决的一个基本语言学问题。文法体系研究中另一个值得关注的就是建立和利用知识库。随着机器翻译研究中语用学的引入,知识库含义的外延在不断扩大。它不仅包括机器词典所提供的各种有关的语言知识,而且还包括各种有关语境、语用和常识等知识。
建立在一个客观认识和理性思考的基础上,我们也有理由相信:在计算器专家、语言学家、心理学家、逻辑学家和数学家的共同努力下,机译的瓶颈问题将会得以解决。