机器翻译时怎样分析文件
Ⅰ 应用计算机辅助翻译软件的必要性有哪些
CAT(computer-assisted translation)即计算机辅助翻译。顾名思义,是以电脑程式辅助人工翻译以及维持词汇的一致性
电脑辅助翻译中最常见的工具,便是翻译记忆库,这是以数据库的方式存储原文与译文,译者可以在翻译的同时利用电脑分析与搜寻翻译记忆库,找出相同或相似的句子,供译者使用或者参考。使用翻译记忆库,对于维持文件中词汇用法以及句型的一致型,有很大的帮助。一般而言,句型变化较少、内容重复性高的文件,诸如法律、技术或说明书等文件,比较适合使用翻译辅助软件。因此在国际化与本地化领域中,电脑辅助软件是很重要的工具,正如Transmate这款国由优译信息开发的辅助翻译软件一样,可以提高翻译速度1.32倍。
机器翻译,指利用电脑程式对译入语文本进行分析,然后自动将译入语翻译为译出语,亦即翻译程序本质上是由机器进行没有经过人工润饰,它是自然语言理解的一种应用,也是自然语言处理技术的一项主要目标。目前一些翻译机器,例如有道翻译、谷歌在线翻译,有时是可以将译入语的信息转变成某种程度上尚可理解的译出语(翻译),但是想要得到较有意义的翻译结果往往再输入语句是要适当地编辑,以利用电脑程式分析。在仅应用有限词汇,同时文句语法单纯的领域,例如气象报告等,机器翻译往往会发挥较大的功能。
但机器翻译的结果好坏,往往取决于译入跟译出语之间在词汇、文法结构、语系甚至文化上的差异,例如英文与德语同为印欧语系,这两种语言间的机器翻译结果,通常便会比中文与英文间机器对译的结果好很多。一般而言,大众使用机器翻译的目的,可能只是为了要得到原文句子或段落的要旨,而不是精确的翻译、总的说来。机器翻译还没有达到可以威胁人工专业翻译的程度
Ⅱ 笔译的技巧和方法总结
说实话,翻译水平特别是笔译能力的明显上升不是一年半载的事。
那么,在语言基础已经基本过关的情况下,笔译翻译工作如何提高自己的翻译水平?
或者通俗一点讲,如何从普通翻译上升到高级翻译?
一、多阅读,尤其要读高质量的作品
网上广为流传的蒙特雷国际研究学院给译者的建议前两条,就提到要广泛阅读,尤其是非母语内容,并具体列出了建议阅读的内容,比如:
每天阅读高质量报纸(例如:《纽约时报》、《华尔街日报》)且至少坚持一年。
Read high-quality newspapers (e.g. the New York Times, Wall Street Journal) EVERY DAY for at least a year.
逐页阅读高质量新闻杂志(例如:《经济学人》)
Read high-quality news magazines (e.g. the Economist,the Financial Times), cover to cover.
阅读感兴趣的非母语内容
Read your favorite topics in your non-native language(s).
阅读能够扩展视野的优秀作品
Read other well-written material that will help broaden your general knowledge.
观看多语时事新闻、收听多语新闻广播和音频节目。
Watch the TV news and listen to radio news and podcasts on current events in all working languages.
跟上当前形势,及时了解信息。
Keep abreast of current events and issues.
另外,平时要养成良好的名着阅读习惯,无论是翻译哪种语言都需要有一定的文学素养。的确,语言是翻译的基础,多读多听,掌握语法规则,再进行大量的练习,在提高语言能力的同时还能丰富自己的知识面,同时,还要学会对阅读的信息进行分析,搞清相关表达的逻辑关系和相关知识点,积累自己的翻译知识库。如此,长期以往必然可以为笔译打下良好的基础。
二、GET快速学习的能力
翻译人员需要处理的文件可能来自于各行各业,涉及到相关的行业知识、专业术语,译者不可能是绝对的全才和通才,就难免会出现卡壳的状况。我们的翻译工作者要想成长,想要成为大拿,就必须坚持不断的学习。
完全可以说,提高快速学习的能力是如何提高笔译水平这个问题中最重要的答案。如果有资深的译者还好,可以请教他们,但如果没有,就必须自己去搜集资料了,就要用最短的时间把遇到的所有障碍解决。如何搜集和学习?
可以注意强化自己翻译工作中经常碰到的领域的专业知识,在翻译职业规划方面往纵深方向发展,成长为这领域的佼佼者,以后但凡有这一领域的翻译任务,首先客户会想到你。在尽可能条件下强化自己在经济、历史、法律、国际政治、科学概念和原理方面的知识。技多不压身,博闻强识总是好的。
可以手抄非母语课本和期刊中的内容,抄得多了,慢慢就会有感觉了!多看政府工作报告,领导人讲话,从而学会新闻用语,甚至说官话等,熟悉“新闻体”、“联合国体”、等等写作风格,这样在翻译的时候才能熟门熟路,不至于不习惯找不着门路。
三、掌握常用的笔译技巧
有人说,翻译的技巧都是纸上谈兵,理论搞得好翻译水平并不一定高。还有人说,笔译技巧其实是汉语写作技巧。这些说话都有一定的道理。不过这是翻译水平已经到一定程度的人说的,也就是说,有了一定的积累之后是成立的。
所以,对于初学者来说,在基础知识的一定积累之后,笔译技巧是还是要好好注意的。长难句,无主句等等,没有一定的方法的引导,他们找不到重点理不不清逻辑,翻译起来就会有一定的困难,翻译也就达不到最好的效果。笔译不同于口译的即兴应变能力,更看重语言各领域专业知识的积累、对中西方文化背景的把握、对词语的锤炼等等。通用的笔译技巧,比如,网上有很多,也都有详细的例证和说明,这里由于篇幅原因就不多说了,各位网络吧。
在在基础知识的一定积累之后,笔译学习者要在模仿的基础上学习,在学习的基础上研究,在研究的基础上提高,在平时的翻译练习和翻译工作中的多与其他高手、原着译文进行比较,多做笔记,多进行总结,提升是自然而然的事。
四、熟练使用翻译工具
工欲善其事,必先利其器。所以,想做翻译,相应工具得会用!有了这些工具,就能让译员的翻译更为顺利。
如,Office软件自然不用说了,另外在翻译中经常用到的工具有计算机辅助翻译工具(CAT)、搜索工具、查词工具及一些版面和设计相关的软件。
搜索工具就是各大搜索引擎。有人说,外事问谷歌,内事问网络,谷歌现在需要翻墙,不太方便,微软应能帮上点忙。是不是有点儿道理,自己体会吧。
查词工具很好理解,就是各种词典,具体用哪个看自己的习惯,值得提醒的是要多查英英词典,因为英汉词典时常会限制对词语的理解。
计算机辅助翻译工具就是常说的翻译软件。翻译软件跟机器翻译是两码事,翻译软件不会帮你翻译(部分翻译软件也有机器翻译功能),它们主要有三种功能:
第一个功能是管理和处理文件。有的大型翻译任务涉及几十份文件,用翻译软件建立一个项目,把所有文件添加到项目里,方便管理;对于每份文件,软件又会对句子进行拆分,左边一栏显示源语,译员在右边一栏翻译,最后生成目标翻译。
第二个功能是建立翻译记忆库和术语库,这个功能在处理重复内容多的文件时特别有用,当确定一个句子的译文并入库后,后面再出现相同或类似的句子时,它会自动跳出译文。
第三个功能是质量检查,部分翻译软件有这项功能,可以帮助检查数字错误、译文不一致、术语不一致等等。比如,学习TRADOS、SDLX、De javu等辅助翻译软件。
另外还要学习一些桌面出版和文字识别软件,如PDF converter、ABBYY FineREADER,markup tools,acrobat等也是会用到的;现在需要翻译的网页文件越来越多,还学习基本的网页制作知识。
你不会的话,总不能等你翻译成文字了,客户再另外找人排版吧,那样他为什么不直接找一次就可以搞定翻译人选?
五、要耐得住寂寞
笔译是一项考验耐心和责任心的工作 。只有不断地练习,用各种各样的方法提高自己,才能做到与时俱进,不被时代和市场淘汰。
要保持对翻译工作的热情,要耐得住寂寞。如果不能从字里行间寻找乐趣,如果不能为弄清一个复杂冗长的句子结构而欢呼雀跃,如果不能为灵机一动想到的好词而沾沾自喜,你可能也坚持不了多长时间!
相反,对翻译感兴趣的人会觉得翻译是一门艺术,愿意花时间去琢磨,翻译完一篇文章就会很有成就感和满足感
Ⅲ 电脑是如何识别和翻译语言的
现在AI越来越厉害,各种语言基本上都能随听随翻。但是这是如何实现的呢?
为何电影、电视中星际间的不同物种恰巧能讲一口流利的英语?
答案是:没人想看太空船员在影片中花费数年来编撰外星人字典。
但为保持一致性,“星际迷航”和其他科幻小说创作者引进“万能翻译器”的概念:一种携带式装置,可即时翻译任何语言。
目前传统的语言学习,仍然会优于利用电脑程式的翻译。
但这不是简单的任务,世界上语言的数量,和人与人之间逐渐增加的语言互动,都会继续激发“自动翻译”的进步。
也许,遇到星际间的其他生物时,我们已经能够透过小装置来沟通,也或许最终,我们还是得着手编写那部字典。
欢迎关注微信公众号infoVision,更多精彩科普小动画等着你!
Ⅳ 你可理解机器翻译提高准确率的原理
学号:16020120050
姓名:吴言凡
转自:https://www.leiphone.com/news/201711/tj9wqI3Mqbjis3RQ.html
【嵌牛导读】:光靠在训练数据集中添加噪声,能解决误拼等问题吗?
【嵌牛鼻子】:机器翻译,训练数据
【嵌牛提问】:机器翻译是怎么分析语法,是怎么排除拼写错误的?
【嵌牛正文】:这是最近几年非常流行的一个句子,试试看能不能读懂——
“Aoccdrnig to a rscheearch at Cmabrigde Uinervtisy, it deosn’t mttaer in waht oredr the ltteers in a wrod are, the olny iprmoetnt tihng is taht the frist and lsat ltteer be at the rghit pclae.”
虽然大部分单词都是拼写错误的,但似乎并不会影响我们理解它的意思。这说明:人在理解语言时,鲁棒性是很强的,文本中即使漏掉一两个字母或者拼写错误,很多时候都不会影响人的阅读。
但对机器翻译(MT)系统来说,这些文本就几乎是不可理喻的了。甚至!一不小心还会造成恶劣的影响。近日在以色列就有一个案例,因为机器翻译的错误,一名建筑工人在他facebook上发了条状态后,“成功”进了局子。
故事大概就是,这名建筑工人10月15日在自己的facebook上发了一条状态:“يصبحهم”(ySbHhm,阿拉伯语)并配了一张照片:
照片中他斜靠在一辆推土机上。这条状态的原意是“good morning”,但facebook的MT 却将它和“يؤذيهم”(y*bHhm)混淆了,两者只差一个字母,但后者在希伯来语中的意思却是“attack them”向阿语专家请教,用中文理解应为“宰了他们”)。
以色列警方此刻正监管网络来找一群称为“lone-wolf”的恐怖分子,所以立马就注意到了这条状态。
推土机+“宰了他们”(过去曾有恐怖分子用推土机进行恐怖袭击),警方怀疑这个人很有可能要进行恐怖袭击,于是立即就逮捕了他。审问几个小时后才发现原来是机器翻译的乌龙。
一、噪声对机器翻译影响有多大?
在我们的文本当中,拼写错误(或者称为噪声)是很常见的现象,而在自然语言处理的各种神经网络的训练系统(包括翻译系统)中却并没有一个明确的方案来解决这类问题。大家能够抱希望的方式就是,通过在训练数据中引入噪声来减小翻译过程中噪声带来的破坏。
但是在训练数据集中引入噪声或者不引入噪声会带来多大的影响呢?在不同的语言机器翻译训练中引入噪声结果是否一致呢?似乎目前并没有对这一问题严格的研究。
最近来自MIT的Yonatan Belinkov和来自华盛顿大学的Yonatan Bisk就此问题在arXiv上发表了一篇有意思的论文。
论文中,他们利用多种噪声讨论了目前神经网络机器翻译的脆弱性,并提出两种增强翻译系统鲁棒性的方法:结构不变词表示和基于噪声文本的鲁棒性训练。他们发现一种基于字母卷积神经网络的charCNN模型在多种噪声中表现良好。
BLEU为机器翻译结果与人工翻译结果对比值(纵坐标应为%,作者忘记标注,下同)。可以看到随着文本中加入噪声的比例增加,机器翻译的结果快速下降。
二、模型
作者选择了三种不同的神经机器翻译(NMT)模型以做对比,分别为:
1、char2char。 这是一个seq-2-seq的模型,它有一个复杂的卷积编码器、highway、循环层以及一个标准的循环解码器。细节参见Lee等人(2017)的研究。这个模型在德-英、捷克-英之间的语言对翻译上表现非常好。
2、Nematus。 这也是一个seq-2-seq的模型,在去年的WMT和IWSLT上是一种较为流行的NMT工具包。
3、charCNN。 作者用词表示训练了一个基于character卷积神经网络(CNN)的seq-2-seq的模型。这个模型保留了一个单词的概念,能够学习一个依赖于字符的词表示。因为它可以学习词的形态信息表示,所以这个模型在形态丰富的语言上表现非常好。
三、数据
1、自然噪声
由于上面的数据集没有带有自然噪声的平行语料库,因此作者选择了其他的可用的语料库,例如:
法语: Max&Wisniewski在2010年从Wikipedia的编辑历史中收集的“维基网络更正和解释语料库”(WiCoPaCo),在本文中仅仅提取了单词更正的数据。
德语: 由RWSE 维基网络修订数据集(Zesch,2012)和MERLIN语言学习者语料库(Wisniewski et al., 2013)。
捷克语: 数据来源于非母语者手动注释的散文。
2、人工噪声
作者生成人工噪声的方法有四种,分别为交换(Swap)、中间随机(Middle Random)、完全随机(Fully Random)和字母错误(Key Typo)。
交换(Swap): 对一个字母个数大于4的单词,除了第一个和最后一个字母不变外,随机交换中间的任两个字母一次。
中间随机(Mid): 对一个字母个数大于4的单词,除了第一个和最后一个字母不变外,随机排列中间所有的字母。
完全随机(Rand): 所有单词的字母随机排列。
字母错误(Key): 在单词中随机选取一个字母,用键盘中和它临近的字母替换(例如noise-noide)
四、干净文本训练翻译模型
作者首先测试了用干净(Vanilla)文本训练出的模型是否能够经受住噪声的考验。
通过上表的结果,我们可以看出所有模型在有噪声(不管是自然的还是合成的)BLEU值都会显着下降。
或许通过下面这个例子,可以更明显地感受到人类理解噪声文本的能力与机器翻译的能力有多大差别。
输入文本是乱七八糟的德语文本,但人类翻译仍然能够根据文本猜测到意思,而目前几个优秀的机器翻译模型则表现很差。
五、两种方法改进模型
1、meanChar模型
从上面的结果我们可以看到,三种NMT模型对单词的结构都很敏感。Char2char和charCNN模型在字符序列上都有卷积层用来捕获字符n-gram;Nematus模型则基于由BPE获得的sub-word单元。因此所有这些模型对字符乱置(Swap、Mid、Rand)产生的噪声都会敏感。
那么可以通过对这样的噪声添加不变性来提高模型的鲁棒性吗?
最简单的方法就是将一个单词的embedding的平均值作为这个单词的表示。作者将这种模型称之为meanChar模型,也即先将单词表示为一个平均embedding的单词表示,然后在使用例如charCNN模型的字级编码器。
很显然,根据定义meanChar模型对字符乱置不再敏感,但是对其他类型的噪声(Key和Nat)仍然敏感。
用Vanilla文本训练meanChar模型 ,然后用噪声文本测试(由于字符乱置不影响结果,将Swap、Mid、Rand合为Scr)。结果如下表第一行所示,可以看出的是,meanChar模型用在法语和德语中对Scrambled文本表现提高了7个百分点,但捷克语表现很糟糕,这可能是由于其语言复杂的形态。
2、黑箱对抗训练
为了提高模型的鲁棒性,作者采用了黑箱对抗训练的方法,也即用带噪声文本训练翻译模型。
首先用如上表,用噪声文本训练在某些语言(例如法语)上表现良好,但是其鲁棒性并不具有稳定的提高。这也很明显,meanChar模型并不一定能解决key或者Nat噪声的问题。
那么如果我们用更复杂的charCNN模型就会提高模型对不同种类噪声的鲁棒性吗?作者将用于训练的Scr文本拆开来训练模型——
发现:
1)尽管模型在不同的噪声下仍然表现不一,但整体平均的表现有所提升。
2)用Rand数据训练出的模型,对Swap和Mid文本测试结果都表现良好;而反之则不成立。这说明在训练数据中更多的噪声能够提高模型的鲁棒性。
3)只有用Nat数据集来训练,才能提高Nat数据集测试的鲁棒性。这个结果表明了计算模型和人类的表现之间的一个重要区别——在学习语言时,人类并没有明确地暴露在噪声样本中。
4)作者将三种噪声(Rand+Key+Nat)混合起来训练模型,发现虽然针对每一个样本的测试都表现略差,但整体上的鲁棒性却是最高的,而且对于多种噪声具有普遍性。
六、对结果的分析
从上面的结果可以看出,多种噪声同时训练charCNN的模型的鲁棒性更好。But why?
作者猜测可能是不同的卷积滤波器在不同种类的噪声中学到了鲁棒性。一个卷积滤波器原则上可以通过采用相等或接近相等的权重来捕获平均(或总和)的操作。
为了检验这个猜测,他们分析了分别用Rand数据和Rand+Key+Nat数据训练的两个charCNN模型学习到的权重。针对每个模型,他们计算了1000个过滤器中每一个过滤器维度上的方差,然后对这些变量做以平均。结果如下图
从图上可以看出,Rand模型学到的权重方差要远小于混合噪声模型学到的权重方差。换句话说,混合噪声训练的模型学习了更多不同的权重,除了平均表示(meanChar)外,还有助于捕捉形态属性。
而另一方面,混合噪声模型中方差的变化则较大,表明不同字符嵌入维度的滤波器之间存在较大的差异。相比之下Rand模型中方差的变化就接近零。
另一方面,我们还看到合成噪声训练的模型没有一个在Nat数据的测试中表现较好的。这表明自然噪声合成噪声有很大的不同。作者人工地检测了德语的Nat数据集中大约40个样本后,发现在Nat数据集中最常见的噪声来源是语言中的语音或音韵错误(34%)和字母遗漏(32%)。这些在合成噪声中并没有,所以这表明要生成更好合成噪声可能需要更多关于音素以及相应语言的知识。
七、总结
让我们来看一看用Rand+key+Nat的charCNN模型来翻译一下前面那个混乱的德语翻译的结果吧:
“According to a study of Cambridge University, it doesn't matter which technology in a word is going to get the letters in a word that is the only important thing for the first and last letter.”
当然,其实他们的结果并不完美,但非常值得借鉴。
如作者所说:“我们的目的有二:
1)作为一个开始,让大家去谈论神经网络翻译的鲁棒性训练和建模技巧;
2)促进大家去创造出更多更好的人工噪声,以应用到新的语言和任务中。
Ⅳ 如何翻译整篇的pdf文档
因为不是专业的翻译,所以在面对大量的英文文档时,难免有些为难。借助一些翻译工具挨个短语翻译的话,还是需要一点时间的。
在网上翻译PDF版文献时,如果直接复制内容粘贴,会出现换行符导致语句被拆分,翻译效果大打折扣,那么如何正确的翻译英文版的PDF文件呢?本文分享一个简单又好用的方法给大家,简单几个步骤就能轻松实现翻译,快来看看吧!
推荐使用:金舟文档翻译软件
操作方法:
第一步、首先,打开翻译软件,然后在左侧选择“文档翻译”功能;
Ⅵ 谈谈你对机器翻译的认识,及如何利用机器翻译
给你在网上查了一下相关的概念,说说我的理解:
概念:计算机辅助翻译(CAT)是指在人工翻译过程中辅助使用计算机程序的自动翻译功能。重复的内容无需重复翻译,而是由计算机程序自动匹配后直接从翻译记忆库中获取出来,极大地减轻了译员的工作量。
理想的CAT工具是一个具有自学习功能的软件,它会随着用户的使用,记住用户翻译过的所有句子,并从中学习翻译方法,发现新的单词、语法和句型,并统统存储为翻译记忆库。但是在现实中,也就是实用化的商品软件中,还是以文本和字符串记忆为主,其余语法特征所用甚少。CAT工具必然还有内置的匹配率计算算法,可将用户需要翻译的句子与记忆库匹配,并给出匹配率指标方便用户选择使用。这样,用户就无需重复以前的劳动,从而提高翻译速度和准确性,为用户节省更多的时间。
从人为的翻译来看机器翻译,翻译的过程可被细分如下:
1、解译来源文字的文意
2、重新编译此解析后所得的文意至目标语言。
在这看似简单的步骤之后其实是复杂的认知操作。要能解译来源文字的完整意义,一个译者必须能够分析与诠释整段文章的所有特征,必须能够深度的了解其文法、语义、语法、成语等等,相当于了解来源语言的文化背景。译者同时也必须兼备目标语言相同深度的知识。
机器翻译(Machine Translation,经常简写为 MT)属于计算语言学(Computational Linguistics)的范畴,其研究借由计算机程序将文字或演说从一种自然语言翻译成另一种自然语言。简单来说,机器翻译是通过将一个自然语言的字辞取代成另一个语言的字辞。借由使用语料库的技术,可达成更加复杂的自动翻译,包含可更佳的处理不同的文法结构、词汇辨识、惯用语的对应等。
所以,我理解的是:计算机辅助翻译侧重记忆和匹配;机器翻译侧重于理解,但是毕竟不是这个领域的,理解尚浅。希望有所帮助~
Ⅶ 机器翻译的流程(原理)是怎么样的
机器翻译的原理是利用计算机将源语言(Source)转换为目标语言(Target),流程是Source→预处理→核心处理→后处理→Target。
人民生活质量不断提高,人们到处旅行。可是人们不可能每种语言都精通,这时候机器翻译就派上用场了。它可以让不同国家的人交流无障碍,可以扩张人们的人脉。虽然机器翻译还存在一些问题,但是随着科技发展,这些问题将会得到解决。
Ⅷ 怎么翻译整篇Word文档
推荐翻译狗!网页链接
很多时候,你都在想,要是世界上只有一种文字就好了。
你经历了十二年义务教育,千军万马过独木桥来到大学,英语水平随着一张张卷子不断提高。你总想着自己笔下春秋在中英文间自由切换,但现实总是打脸太快:
读原版小说,认出单词但翻译不出句子
看文献材料,读懂了导言却看不懂正文
写期末论文,写好中文可翻译不好英文
等等,你说你有翻译软件。
于是,你开始将中文,或者英文,一段段地复制到翻译器里。
你在不断地重复中,熟练掌握了Ctrl+C/V 大法,正准备得意地展现翻译成果,发现它们只是段落和段落的拼接,缺少的不仅是整体感,更糟糕的是它们还恢复成了无格式的文本。
你不得不耗费更多的时间和精力,和最熟悉的陌生语言展开新一轮的拉锯战。
一个小时过去了……
一个白天过去了……
一天就这么过去了……
你看着文档,总觉得翻译前后对不上。这个时候已经很晚了,你关上文档,不甘心地睡着了。
但这是你的翻译方式,不是我的。
都已经9012年了,你需要的是支持文档随传随意,不限格式、不限大小,不限语言,并且翻译后保持格式不乱的翻译工具。你需要抛弃繁琐而基础的翻译步骤,把做这些事浪费的大把时间,都留给享受有益的生活、学习。
你需要的翻译软件,不是你去执行每一个翻译步骤,而是帮你执行好每一个翻译步骤,节约你大量的时间和精力。
喏,如此看来,没有任何翻译工具,比【翻译狗】更适合你了。
简化所有翻译流程,带给你最好的文档翻译体验。
Step1:登陆翻译狗官网/翻译狗APP;
Step2:选择并上传你需要翻译的文档;
Step3:坐等翻译结果,并下载需要的格式。
Ⅸ 干货分享:如何看待机器翻译,它是和风细雨还是洪水猛兽
首先公开一个公开的秘密,其实很多译员都是使用机器翻译的,先用机器翻译做一遍,之后再修改,当然,也包括我在内。
机器翻译确实很有发展前景。十年前,我那时还在读研究生,各种翻译软件基本上还都是以死译为主,比如网易词典翻译、网络翻译、谷歌翻译等,给出的翻译译文不忍直视,生拉硬扯把意思翻译出来,甚至那句话本来就不正确。
当今,AI技术不断进步,语料库的不断扩充,机器翻译的质量已经逐步提升。例如原来都是死译,现在已经会切分一部分比较简单的意群了。
当然,对于比较复杂的句子,以及文学类翻译,机器翻译依然不够理想。目前,机器翻译有利于对文稿进行初步加工,起码可以减少一部分阅读时间和输入时间。
简而言之,对于实用文体的翻译,机器翻译的确做到了一部分的辅助作用。
然而,作为市场中的翻译,要有起码的职业道德。无论是什么商业化翻译,尤其是纯技术类资料,肯定不能只是机器翻译了事。尤其是政府文件和技术资料,没有谁会放心用机器翻译的译文直接来应用。
而且,在机器翻译的基础上进行修改,很多时候改动的也非常多,这个我有亲身经历。
去年,我曾经做了一个月的网络小说翻译,单价其实不高,单纯就是为了做汉译英,我喜欢汉译英。
我首先用了机器翻译,发现结果一塌糊涂,还不如自己直接写来的快。
需要提一句的是,北京大学早在几年前就开设了计算机辅助翻译专业(CAT),这个动向值得关注。因为,这正是机器翻译并非一无是处,而是前途光明的象征之一。
总之,机器翻译不可能全盘否定,当然也更不能全部依托,把它作为辅助,是唯一正确的选择。译员也不必担心自己有一天会被淘汰,这几乎是不可能的,万一等到了那一天,人类就会灭亡了。
相信我,做翻译吧,我们可以相互交流。
Ⅹ 计算机翻译程序如何把一个面向人看懂的语句组成程序变成计算机可执行的二进制代码的过程
计算机程序语言主要有两类,一种是脚本语言,另一种是需通过编译的语言。
脚本语言通过解释执行。编译语言通过编译器翻译后执行。
在纸上写好人看懂的语句组成的程序,当然是按脚本语言或编译语言的语法规定写的。
用编辑器,例如notepad,从键盘打进去,存成磁盘文件。
解释器,边读程序,边解释,边执行。例如,浏览器处理HTML网页,Shell处理“批”文件。
编译语言,由编译器读入全部程序,然后做词法分析,句法分析,语法分析,逻辑结构分析,按语句顺序及程序内容规定的条件转移次序,翻译成数据和指令码,链接嵌入必要的库的代码,作优化后把可执行码(二进制代码)存回磁盘。最后用户运行可执行码。例如,vb,vc程序。