机器翻译现状

时间:2024-02-29 点赞:45276 浏览:86022 作者原创标记本站原创

这是一篇关于语言学方面毕业论文范文,与机器翻译现状相关毕业论文参考文献格式。是外文翻译专业与语言学及计算机及机器翻译方面相关的免费优秀学术论文范文资料,可作为语言学方面的大学硕士与本科毕业论文开题报告范文和职称论文论文写作参考文献下载。

摘 要 :随着经济飞速发展,各国之间交流日益频繁,各语言之间转换需求与日俱增,机器翻译应运而生.它涉及计算机语言学、数学和语言学等各个学科,其中语言学为其提供了机译数据库和技术支撑.然而,目前机器翻译还存在许多不足,需要多方面深入研究.本文对机器翻译发展历程、研究方法、存在问题及其应对方法进行了综述,以期机器翻译更进一步发展.

关 键 词 :机器翻译;发展历程;研究方法;语言学理论;问题;应对方法

中图分类号:H085 文献标识码:A 文章编号:1671―1580(2013)10―0107―03

机器翻译通过计算机实现不同自然语言之间的转换,也称为自动翻译,一般是指自然语言之间的部分句子或全文的翻译.它作为应用语言学的一个分支,是建立在语言学、数学和计算机科学基础上的跨学科研究.由于需要通过电脑数据库和翻译软件来完成操作,因此,机器翻译的发展与计算机科学、数学、人工智能、语言学等各学科的发展密不可分,可以说,机器翻译的推进需要这些学科的技术支撑和理论支持.人类进入21世纪以来,随着经济的发展,国际交流合作日益频繁,对机器翻译的需求日益增大.机器翻译是规避国家间交流障碍的有效手段,但作为综合性的学科,它的发展受到多方面牵制,因此需要相关研究人员和学者对其相关学科进行更深入的研究.

一、机器翻译发展历史

自20世纪30年代相关学者提出其雏形至今,机器翻译经历了几十年的发展历程.40年代进入实施阶段,60年代经历萌芽期,70、80年代进入繁荣发展的黄金期,如今处于高速发展的阶段.但机器翻译的发展之路并不是一帆风顺的,而是呈现曲折、回旋上升的分布形态.

机器翻译的发展可以归结为以下几个发展阶段:

1.机器翻译人员的独立工作阶段

20世纪50年代初期,随着第一台计算机的问世,美国的科学家W.Weer和英国工程师A.D. Booth就发表了翻译备忘录,提出了利用计算机进行翻译的设想.随后,通过不懈的努力和试验,美国的乔治伦敦大学和IBM公司合力推出了首个MT系统,为各国的机器翻译奠定了坚实的实践基础.但是由于受到计算机硬件局限性的限制,尤其是内存不足和存储速度慢,以及缺乏高级编程语言,研究人员无法完全依赖机器来完成大规模、高质量的翻译任务.同时,由于研究是在没有句法学家和语义学家的协助下独立进行的,翻译的质量难以保证.

在这样的背景下,早期研究者意识到,无论开发出什么样的系统都只能产生出低质量的输出,因此专家建议,先发展对有控制的语言进行翻译,并限定于某些特定领域.

2.进入高质量的翻译输出

20世纪60年代,受到改进了的计算机硬件和编程语言的鼓舞,研究人员对机器翻译产生了盲目的乐观.编程语言在句法分析上取得的长足进步让翻译人员感受到了技术革新的成果,他们相信机器翻译有巨大的前景,几年之内就可以达到高质量的输出,这一乐观论调很快传遍了全世界.研究人员还提出假设:机器翻译的目标是产出高质量翻译的全自动系统.研究的重点在于寻求完善的翻译理论和方法.

3.翻译软件和工具的发展

20世纪70年代以来,随着科技发展和各国间频繁交流,大规模翻译需求日益增加,对计算机翻译的依赖更加突出,机器翻译进入了新的发展阶段.实用性翻译和软件系统如雨后春笋频频出现,如Weinder系统、EURPOTRA多国种翻译系统、TAUM-METEO系统等.80年代产生了大量连接网络和大容量存储的微型计算机,各种翻译工具也应运而生,如词典和术语资料库、多语文字处理、词汇和术语资源的管理、信息传递的输入和输出.最近又新添了“翻译记忆”功能,它能够存储已存在译文,以便为再利用和修订提供范例.

这一时期的机器翻译已经逐步进入了机器和人工相结合的阶段,机助人译(Computer-aided Machine Translation)和人助机译(Human-aided Translation)相互结合,对各种类型和规模的翻译做出了突出的贡献.同时语料库的发展和应用为机译提供了坚实的理论和技术来源,机器翻译进入到崭新的上升阶段.

4.我国机器翻译的历程

我国的机器翻译始于1956年,由于当时与苏联的经济政治往来,我国对于机器翻译的需求逐渐显现,中俄语言间的互译催化了MT系统.80年代后,我国研制了KY-1和IMT/EC863两个英汉机译系统,随着计算机技术的成熟和发展,许多计算机公司研制出了一系列高科技的机译软件,如“译星”、“雅信”、“通译”、“科建”等.

机器翻译由简单到复杂,从初级到高级,不断进行着理论和实践的双重革新.其发展历程可概括为以下三代:第一代初级阶段,利用机器翻译词汇,不进行语法分析;第二代进步阶段,对句子的结构和语义进行分析;第三代人工智能阶段,随着心理学,特别是认知心理学的发展,人们认为电脑可以复制人脑的信息处理机制,使机器翻译更加智能化和自动化.目前,各国学者正经历着第三阶段,不断地攻克各种难关,提高机器翻译的质量和效率.

二、机器翻译的研究方法

机器翻译研究方法可以从两个方面来叙述,一方面是语言学理论的应用,另一方面是MT研究者们实际所从事的内容.

1.语言学的方法

机器翻译研究已经被看作一个试验新的语言理论或新的计算技术的领域.换言之,MT已经被视为语言理论的实验基础,因为翻译翻译的质量能由非专家来判断.

与之相关的理论有:20世纪50、60年代的信息理论、范畴语法、转换生成语法、从属语法和层次语法;70、80年代的人工智能、非语言知识基础,诸如词汇功能语法、广义短语结构语法、中心词驱动短语结构语法和蒙太古语法等形式主义理论;90年代的神经系统网络、连接主义、平行处理和统计学方法以及他理论. 人们还发现,那些以小样本为基础,在最初的试验中取得成功的新理论,最终都被证实存在一些问题.为了解决这些问题,必须检验一切有希望的方法并鼓励修正.

20世纪90年代初期,以语料库为基础的方法的出现使机器翻译研究有所增强,特别是引入了统计学方法和以实例为基础的翻译.统计学技术已经摆脱了以前专门以规则为基础(通常定位于句法)的方法的不足和它越来越明显的限制.在以语料库为基础的技术帮助下,歧义消除的问题、首语重复的解决和更多惯用语的生成都已经变得更容易驾驭.

2.转移法

根据机器翻译转移理论的多数观点,在机器翻译系统中有某种转移成分.这种成分是特定的,从而一对语言可产生一个目标句子.转移成分有一个相应的词库,这是源语言的范式和短语映现于目标语言的包罗万象的清单(Napier,2000).大量工作取决于对两种语言具体比较的信息.这种转移系统意味着,对每两种语言来说便要翻译,因此这种方法主张翻译本质上就是一种比较语言学的练习.由此可见,必须建立一个词库.

3.语际法

语际法基于这样的理解:在一批语言的每两种语言之间,只要求将每一个成语语言翻译成中间语言(interlingua),再从中间语言翻译成某种语言.如果有n种语言,就需要n个成员被翻译成目标语言.但Arnold等(1995)对这种方法不以为然,认为使用中间语会导致信息的丢失.

4.基于知识的方法

近来的趋势是转向基于知识的机器翻译,这是由Carnegie Mellon大学与新墨西哥州立大学的语言研究中心创导的.Arnold等(1995)认为需要3种知识来改进机器翻译系统.

(1)不依赖语境的语言学知识(语义学).研究者将词语和语义特征联系起来,从而能对其他出现的词语加以制约.

(2)依赖语境的语言学知识,有的成为语用知识(语用学).有多种方法处理语用学问题,其中之一是学习句子焦点的概念.

(3)常识/真实世界的知识(非语言学知识)

前两类是针对语言本身的,问题不是最大,计算机缺乏真实世界的知识才使研究人员苦恼不已.例如,计算机不能发现一个可吃的苹果和个人计算机苹果品牌之间的区别,也不能说明汉语中“山顶”的“顶”、“顶风”的“顶”和“顶好”的“顶”的不同意义.多少年来,正是这样的问题不仅困扰机器翻译的理论家,也困扰神经网络和人工智能的研究者.

随着语料库语言学的发展,最近研究者转向基于例句的机器翻译的研究.该方法将正确的翻译作为信息资源,以建立新的翻译作品.

三、转换生成语法――机器翻译的语言学理论支撑

机器翻译作为一门交叉学科,涉及到多学科的理论支持,其中语言学为机器翻译提供了文本的语法和语义的规范基础,尤其是美国语言学家诺姆乔姆斯基 (Noam Chomsky)提出的转换生成语法.该语法经过不断修正和改进,探索了人类语言的本质、起源和人类普遍语法的深层机制.乔姆斯基提出表层结构和深层结构能够对语义进行语法和句法分析.借由他的理论,可以对词典中的词条进行描述,分析机器翻译中的词义,从而有效地避免语义错误.乔姆斯基的理论给计算机科学的发展带来了革命性的变化,也推动了机器翻译的发展.

四、机器翻译的现状及其存在的问题

1.翻译质量差

随着大规模翻译的进行,一些翻译软件的不足日益凸显,数据库建设更新缓慢、计算机技术的瓶颈、数据编程的古板等都影响了翻译质量.翻译的刻板化、直白无意义严重影响了跨国领域或学科的发展.

2.翻译软件的单一

计算机技术的革命正在进行,各种翻译软件也层出不穷,但是还是无法满足现代社会的需要.功能单一的翻译软件无法自动识别一词多义、同音异义或者同形异义的词项,这大大降低了现实中译文的质量.

五、解决方案

机器翻译如果想得到长足的发展,必须采取一些相应的措施.

1.奠定语言学基础.计算机软件技术的发展只是机器翻译的一个方面,语言学作为机译的学科支撑,其相关理论必须不断完善.诸如词典编纂、语法数据库的规则机制等各方面研究应稳步进行,为机器翻译提供坚实的语言学理论基础.

2.注重专项化探索和研究.汉语和其他国家语言在起源等方面的差异,决定了翻译过程中的语码转换.转换过程中的句义、结构、语法方面的改变会影响整个译文的意思.搜集整合某个语言和汉语的互译数据、加强数据库的建设可以为多样的翻译提供规范模本,为日后翻译提供高效的技术和质量保证.

3.机器翻译涉及的领域广泛而多样,这就要求机器翻译的专有化.从历时的角度对机器翻译的技术和翻译数据进行专有化归类,可以进一步建设某个固定领域的翻译研究,并针对某一特定学科或领域的翻译制定统一的行业翻译标准或制定统一的通用语法,规范专业词典的编纂,不断提升翻译质量.

4.提高质量.计算机专家和语言学家应该共同努力,不仅要提高翻译软件的创新和应用,还要提高专业性和通用性翻译内容的稳定性.在主要依靠机器翻译的基础上,必要时添加人工翻译,使得译文的准确度提高.


六、结语

机器翻译自19世纪60年代以来,历经不同时期,目前虽已形成稳定的发展模式,仍需要各方面的努力使之趋于完善.全球化、科技化日益发展的今天,国家间交流频繁,机器翻译的重要性愈加凸显.然而,不成熟的机器翻译体系还不能实现高质量的纯机器译本,这需要计算机科学、语言学及其他相关学科的人员相互配合,不断完善翻译技术.期待在不久的将来,机器翻译可以得到一个质的飞跃,更好地服务社会生活的各个领域.

[参考文献]

[1]Arnold, D., Balkan, L., Meijer, S., Humphreys, R. L., Sadler, L. Machine Translation: An Introductory Guide[M].University of Essex,1995.

[2]Biber, Douglas, Susan Conrad and Randi Reppen. Corpus Linguistics[M]. Cambridge: Cambridge University Press,1998.

[3]Carnie, Andrew. Syntax: A Generative Introduction[M]. USA: BLACKWELL PUBLISHING. 2007.

[4]Chomsky, N. Aspects of the Theory of Syntax[M]. Cambridge, Mass: MIT Press,1965.

[5]Grishman, R. Computational Linguistics: An Introduction[M]. Cambridge: Cambridge University Press,1986.

[6]冯志伟.机器翻译研究[M].北京:中国对外翻译出版公司,2004.

[7]胡壮麟.语言学教程[M].北京:北京大学出版社,2007.

[8]易绵竹,南振兴.计算机语言学[M].上海:上海外语教育出版社,2005.

[9]张政,苗天顺.计算语言学与机器翻译导论[M].北京:外语教学与研究出版社,2010.

相关论文

国内外电子政务立法现状比较

该文为电子政务相关硕士论文范文,与国内外电子政务立法现状比较相关法本毕业论文,可作为国际刑法学专业电子政务论文写作研究的大学硕士与。

电子商务智能管理现状

本文是一篇电子商务论文范文,电子商务方面在职研究生毕业论文,关于电子商务智能管理现状相关硕士论文范文。适合电子商务及电子商务管理及商。

我国社会治安管理的现状

本文是一篇社会治安论文范文,关于社会治安毕业论文范文,关于我国社会治安管理的现状相关毕业论文提纲范文。适合社会治安及法律法规及市场经。

企业成本会计的应用现状改善

本文是一篇成本会计论文范文,关于成本会计类在职研究生毕业论文,关于企业成本会计的应用现状改善相关开题报告范文。适合成本会计及企业成本。

民族法学在民族高校的现状路径

本文是一篇民族法学论文范文,民族法学类学年毕业论文,关于民族法学在民族高校的现状路径相关毕业论文提纲范文。适合民族法学及法学教育及民。

三峡库区大学生就业就业指导现状

本文是一篇就业指导论文范文,就业指导有关毕业论文模板,关于三峡库区大学生就业就业指导现状相关研究生毕业论文开题报告范文。适合就业指导。

西部院校教学督导工作现状

本文是一篇教学督导论文范文,关于教学督导方面毕业论文格式范文,关于西部院校教学督导工作现状相关硕士毕业论文范文。适合教学督导及院校及。

中国B2C电子商务现状与趋势

本文是一篇电子商务论文范文,电子商务相关函授毕业论文,关于中国B2C电子商务现状与趋势相关电大毕业论文范文。适合电子商务及电子商务发展。