機器翻譯時怎樣分析文件
Ⅰ 應用計算機輔助翻譯軟體的必要性有哪些
CAT(computer-assisted translation)即計算機輔助翻譯。顧名思義,是以電腦程式輔助人工翻譯以及維持詞彙的一致性
電腦輔助翻譯中最常見的工具,便是翻譯記憶庫,這是以資料庫的方式存儲原文與譯文,譯者可以在翻譯的同時利用電腦分析與搜尋翻譯記憶庫,找出相同或相似的句子,供譯者使用或者參考。使用翻譯記憶庫,對於維持文件中詞彙用法以及句型的一致型,有很大的幫助。一般而言,句型變化較少、內容重復性高的文件,諸如法律、技術或說明書等文件,比較適合使用翻譯輔助軟體。因此在國際化與本地化領域中,電腦輔助軟體是很重要的工具,正如Transmate這款國由優譯信息開發的輔助翻譯軟體一樣,可以提高翻譯速度1.32倍。
機器翻譯,指利用電腦程式對譯入語文本進行分析,然後自動將譯入語翻譯為譯出語,亦即翻譯程序本質上是由機器進行沒有經過人工潤飾,它是自然語言理解的一種應用,也是自然語言處理技術的一項主要目標。目前一些翻譯機器,例如有道翻譯、谷歌在線翻譯,有時是可以將譯入語的信息轉變成某種程度上尚可理解的譯出語(翻譯),但是想要得到較有意義的翻譯結果往往再輸入語句是要適當地編輯,以利用電腦程式分析。在僅應用有限詞彙,同時文句語法單純的領域,例如氣象報告等,機器翻譯往往會發揮較大的功能。
但機器翻譯的結果好壞,往往取決於譯入跟譯出語之間在詞彙、文法結構、語系甚至文化上的差異,例如英文與德語同為印歐語系,這兩種語言間的機器翻譯結果,通常便會比中文與英文間機器對譯的結果好很多。一般而言,大眾使用機器翻譯的目的,可能只是為了要得到原文句子或段落的要旨,而不是精確的翻譯、總的說來。機器翻譯還沒有達到可以威脅人工專業翻譯的程度
Ⅱ 筆譯的技巧和方法總結
說實話,翻譯水平特別是筆譯能力的明顯上升不是一年半載的事。
那麼,在語言基礎已經基本過關的情況下,筆譯翻譯工作如何提高自己的翻譯水平?
或者通俗一點講,如何從普通翻譯上升到高級翻譯?
一、多閱讀,尤其要讀高質量的作品
網上廣為流傳的蒙特雷國際研究學院給譯者的建議前兩條,就提到要廣泛閱讀,尤其是非母語內容,並具體列出了建議閱讀的內容,比如:
每天閱讀高質量報紙(例如:《紐約時報》、《華爾街日報》)且至少堅持一年。
Read high-quality newspapers (e.g. the New York Times, Wall Street Journal) EVERY DAY for at least a year.
逐頁閱讀高質量新聞雜志(例如:《經濟學人》)
Read high-quality news magazines (e.g. the Economist,the Financial Times), cover to cover.
閱讀感興趣的非母語內容
Read your favorite topics in your non-native language(s).
閱讀能夠擴展視野的優秀作品
Read other well-written material that will help broaden your general knowledge.
觀看多語時事新聞、收聽多語新聞廣播和音頻節目。
Watch the TV news and listen to radio news and podcasts on current events in all working languages.
跟上當前形勢,及時了解信息。
Keep abreast of current events and issues.
另外,平時要養成良好的名著閱讀習慣,無論是翻譯哪種語言都需要有一定的文學素養。的確,語言是翻譯的基礎,多讀多聽,掌握語法規則,再進行大量的練習,在提高語言能力的同時還能豐富自己的知識面,同時,還要學會對閱讀的信息進行分析,搞清相關表達的邏輯關系和相關知識點,積累自己的翻譯知識庫。如此,長期以往必然可以為筆譯打下良好的基礎。
二、GET快速學習的能力
翻譯人員需要處理的文件可能來自於各行各業,涉及到相關的行業知識、專業術語,譯者不可能是絕對的全才和通才,就難免會出現卡殼的狀況。我們的翻譯工作者要想成長,想要成為大拿,就必須堅持不斷的學習。
完全可以說,提高快速學習的能力是如何提高筆譯水平這個問題中最重要的答案。如果有資深的譯者還好,可以請教他們,但如果沒有,就必須自己去搜集資料了,就要用最短的時間把遇到的所有障礙解決。如何搜集和學習?
可以注意強化自己翻譯工作中經常碰到的領域的專業知識,在翻譯職業規劃方面往縱深方向發展,成長為這領域的佼佼者,以後但凡有這一領域的翻譯任務,首先客戶會想到你。在盡可能條件下強化自己在經濟、歷史、法律、國際政治、科學概念和原理方面的知識。技多不壓身,博聞強識總是好的。
可以手抄非母語課本和期刊中的內容,抄得多了,慢慢就會有感覺了!多看政府工作報告,領導人講話,從而學會新聞用語,甚至說官話等,熟悉「新聞體」、「聯合國體」、等等寫作風格,這樣在翻譯的時候才能熟門熟路,不至於不習慣找不著門路。
三、掌握常用的筆譯技巧
有人說,翻譯的技巧都是紙上談兵,理論搞得好翻譯水平並不一定高。還有人說,筆譯技巧其實是漢語寫作技巧。這些說話都有一定的道理。不過這是翻譯水平已經到一定程度的人說的,也就是說,有了一定的積累之後是成立的。
所以,對於初學者來說,在基礎知識的一定積累之後,筆譯技巧是還是要好好注意的。長難句,無主句等等,沒有一定的方法的引導,他們找不到重點理不不清邏輯,翻譯起來就會有一定的困難,翻譯也就達不到最好的效果。筆譯不同於口譯的即興應變能力,更看重語言各領域專業知識的積累、對中西方文化背景的把握、對詞語的錘煉等等。通用的筆譯技巧,比如,網上有很多,也都有詳細的例證和說明,這里由於篇幅原因就不多說了,各位網路吧。
在在基礎知識的一定積累之後,筆譯學習者要在模仿的基礎上學習,在學習的基礎上研究,在研究的基礎上提高,在平時的翻譯練習和翻譯工作中的多與其他高手、原著譯文進行比較,多做筆記,多進行總結,提升是自然而然的事。
四、熟練使用翻譯工具
工欲善其事,必先利其器。所以,想做翻譯,相應工具得會用!有了這些工具,就能讓譯員的翻譯更為順利。
如,Office軟體自然不用說了,另外在翻譯中經常用到的工具有計算機輔助翻譯工具(CAT)、搜索工具、查詞工具及一些版面和設計相關的軟體。
搜索工具就是各大搜索引擎。有人說,外事問谷歌,內事問網路,谷歌現在需要翻牆,不太方便,微軟應能幫上點忙。是不是有點兒道理,自己體會吧。
查詞工具很好理解,就是各種詞典,具體用哪個看自己的習慣,值得提醒的是要多查英英詞典,因為英漢詞典時常會限制對詞語的理解。
計算機輔助翻譯工具就是常說的翻譯軟體。翻譯軟體跟機器翻譯是兩碼事,翻譯軟體不會幫你翻譯(部分翻譯軟體也有機器翻譯功能),它們主要有三種功能:
第一個功能是管理和處理文件。有的大型翻譯任務涉及幾十份文件,用翻譯軟體建立一個項目,把所有文件添加到項目里,方便管理;對於每份文件,軟體又會對句子進行拆分,左邊一欄顯示源語,譯員在右邊一欄翻譯,最後生成目標翻譯。
第二個功能是建立翻譯記憶庫和術語庫,這個功能在處理重復內容多的文件時特別有用,當確定一個句子的譯文並入庫後,後面再出現相同或類似的句子時,它會自動跳出譯文。
第三個功能是質量檢查,部分翻譯軟體有這項功能,可以幫助檢查數字錯誤、譯文不一致、術語不一致等等。比如,學習TRADOS、SDLX、De javu等輔助翻譯軟體。
另外還要學習一些桌面出版和文字識別軟體,如PDF converter、ABBYY FineREADER,markup tools,acrobat等也是會用到的;現在需要翻譯的網頁文件越來越多,還學習基本的網頁製作知識。
你不會的話,總不能等你翻譯成文字了,客戶再另外找人排版吧,那樣他為什麼不直接找一次就可以搞定翻譯人選?
五、要耐得住寂寞
筆譯是一項考驗耐心和責任心的工作 。只有不斷地練習,用各種各樣的方法提高自己,才能做到與時俱進,不被時代和市場淘汰。
要保持對翻譯工作的熱情,要耐得住寂寞。如果不能從字里行間尋找樂趣,如果不能為弄清一個復雜冗長的句子結構而歡呼雀躍,如果不能為靈機一動想到的好詞而沾沾自喜,你可能也堅持不了多長時間!
相反,對翻譯感興趣的人會覺得翻譯是一門藝術,願意花時間去琢磨,翻譯完一篇文章就會很有成就感和滿足感
Ⅲ 電腦是如何識別和翻譯語言的
現在AI越來越厲害,各種語言基本上都能隨聽隨翻。但是這是如何實現的呢?
為何電影、電視中星際間的不同物種恰巧能講一口流利的英語?
答案是:沒人想看太空船員在影片中花費數年來編撰外星人字典。
但為保持一致性,「星際迷航」和其他科幻小說創作者引進「萬能翻譯器」的概念:一種攜帶式裝置,可即時翻譯任何語言。
目前傳統的語言學習,仍然會優於利用電腦程式的翻譯。
但這不是簡單的任務,世界上語言的數量,和人與人之間逐漸增加的語言互動,都會繼續激發「自動翻譯」的進步。
也許,遇到星際間的其他生物時,我們已經能夠透過小裝置來溝通,也或許最終,我們還是得著手編寫那部字典。
歡迎關注微信公眾號infoVision,更多精彩科普小動畫等著你!
Ⅳ 你可理解機器翻譯提高准確率的原理
學號:16020120050
姓名:吳言凡
轉自:https://www.leiphone.com/news/201711/tj9wqI3Mqbjis3RQ.html
【嵌牛導讀】:光靠在訓練數據集中添加雜訊,能解決誤拼等問題嗎?
【嵌牛鼻子】:機器翻譯,訓練數據
【嵌牛提問】:機器翻譯是怎麼分析語法,是怎麼排除拼寫錯誤的?
【嵌牛正文】:這是最近幾年非常流行的一個句子,試試看能不能讀懂——
「Aoccdrnig to a rscheearch at Cmabrigde Uinervtisy, it deosn』t mttaer in waht oredr the ltteers in a wrod are, the olny iprmoetnt tihng is taht the frist and lsat ltteer be at the rghit pclae.」
雖然大部分單詞都是拼寫錯誤的,但似乎並不會影響我們理解它的意思。這說明:人在理解語言時,魯棒性是很強的,文本中即使漏掉一兩個字母或者拼寫錯誤,很多時候都不會影響人的閱讀。
但對機器翻譯(MT)系統來說,這些文本就幾乎是不可理喻的了。甚至!一不小心還會造成惡劣的影響。近日在以色列就有一個案例,因為機器翻譯的錯誤,一名建築工人在他facebook上發了條狀態後,「成功」進了局子。
故事大概就是,這名建築工人10月15日在自己的facebook上發了一條狀態:「يصبحهم」(ySbHhm,阿拉伯語)並配了一張照片:
照片中他斜靠在一輛推土機上。這條狀態的原意是「good morning」,但facebook的MT 卻將它和「يؤذيهم」(y*bHhm)混淆了,兩者只差一個字母,但後者在希伯來語中的意思卻是「attack them」向阿語專家請教,用中文理解應為「宰了他們」)。
以色列警方此刻正監管網路來找一群稱為「lone-wolf」的恐怖分子,所以立馬就注意到了這條狀態。
推土機+「宰了他們」(過去曾有恐怖分子用推土機進行恐怖襲擊),警方懷疑這個人很有可能要進行恐怖襲擊,於是立即就逮捕了他。審問幾個小時後才發現原來是機器翻譯的烏龍。
一、雜訊對機器翻譯影響有多大?
在我們的文本當中,拼寫錯誤(或者稱為雜訊)是很常見的現象,而在自然語言處理的各種神經網路的訓練系統(包括翻譯系統)中卻並沒有一個明確的方案來解決這類問題。大家能夠抱希望的方式就是,通過在訓練數據中引入雜訊來減小翻譯過程中雜訊帶來的破壞。
但是在訓練數據集中引入雜訊或者不引入雜訊會帶來多大的影響呢?在不同的語言機器翻譯訓練中引入雜訊結果是否一致呢?似乎目前並沒有對這一問題嚴格的研究。
最近來自MIT的Yonatan Belinkov和來自華盛頓大學的Yonatan Bisk就此問題在arXiv上發表了一篇有意思的論文。
論文中,他們利用多種雜訊討論了目前神經網路機器翻譯的脆弱性,並提出兩種增強翻譯系統魯棒性的方法:結構不變詞表示和基於雜訊文本的魯棒性訓練。他們發現一種基於字母卷積神經網路的charCNN模型在多種雜訊中表現良好。
BLEU為機器翻譯結果與人工翻譯結果對比值(縱坐標應為%,作者忘記標注,下同)。可以看到隨著文本中加入雜訊的比例增加,機器翻譯的結果快速下降。
二、模型
作者選擇了三種不同的神經機器翻譯(NMT)模型以做對比,分別為:
1、char2char。 這是一個seq-2-seq的模型,它有一個復雜的卷積編碼器、highway、循環層以及一個標準的循環解碼器。細節參見Lee等人(2017)的研究。這個模型在德-英、捷克-英之間的語言對翻譯上表現非常好。
2、Nematus。 這也是一個seq-2-seq的模型,在去年的WMT和IWSLT上是一種較為流行的NMT工具包。
3、charCNN。 作者用詞表示訓練了一個基於character卷積神經網路(CNN)的seq-2-seq的模型。這個模型保留了一個單詞的概念,能夠學習一個依賴於字元的詞表示。因為它可以學習詞的形態信息表示,所以這個模型在形態豐富的語言上表現非常好。
三、數據
1、自然雜訊
由於上面的數據集沒有帶有自然雜訊的平行語料庫,因此作者選擇了其他的可用的語料庫,例如:
法語: Max&Wisniewski在2010年從Wikipedia的編輯歷史中收集的「維基網路更正和解釋語料庫」(WiCoPaCo),在本文中僅僅提取了單詞更正的數據。
德語: 由RWSE 維基網路修訂數據集(Zesch,2012)和MERLIN語言學習者語料庫(Wisniewski et al., 2013)。
捷克語: 數據來源於非母語者手動注釋的散文。
2、人工雜訊
作者生成人工雜訊的方法有四種,分別為交換(Swap)、中間隨機(Middle Random)、完全隨機(Fully Random)和字母錯誤(Key Typo)。
交換(Swap): 對一個字母個數大於4的單詞,除了第一個和最後一個字母不變外,隨機交換中間的任兩個字母一次。
中間隨機(Mid): 對一個字母個數大於4的單詞,除了第一個和最後一個字母不變外,隨機排列中間所有的字母。
完全隨機(Rand): 所有單詞的字母隨機排列。
字母錯誤(Key): 在單詞中隨機選取一個字母,用鍵盤中和它臨近的字母替換(例如noise-noide)
四、干凈文本訓練翻譯模型
作者首先測試了用干凈(Vanilla)文本訓練出的模型是否能夠經受住雜訊的考驗。
通過上表的結果,我們可以看出所有模型在有雜訊(不管是自然的還是合成的)BLEU值都會顯著下降。
或許通過下面這個例子,可以更明顯地感受到人類理解雜訊文本的能力與機器翻譯的能力有多大差別。
輸入文本是亂七八糟的德語文本,但人類翻譯仍然能夠根據文本猜測到意思,而目前幾個優秀的機器翻譯模型則表現很差。
五、兩種方法改進模型
1、meanChar模型
從上面的結果我們可以看到,三種NMT模型對單詞的結構都很敏感。Char2char和charCNN模型在字元序列上都有卷積層用來捕獲字元n-gram;Nematus模型則基於由BPE獲得的sub-word單元。因此所有這些模型對字元亂置(Swap、Mid、Rand)產生的雜訊都會敏感。
那麼可以通過對這樣的雜訊添加不變性來提高模型的魯棒性嗎?
最簡單的方法就是將一個單詞的embedding的平均值作為這個單詞的表示。作者將這種模型稱之為meanChar模型,也即先將單詞表示為一個平均embedding的單詞表示,然後在使用例如charCNN模型的字級編碼器。
很顯然,根據定義meanChar模型對字元亂置不再敏感,但是對其他類型的雜訊(Key和Nat)仍然敏感。
用Vanilla文本訓練meanChar模型 ,然後用雜訊文本測試(由於字元亂置不影響結果,將Swap、Mid、Rand合為Scr)。結果如下表第一行所示,可以看出的是,meanChar模型用在法語和德語中對Scrambled文本表現提高了7個百分點,但捷克語表現很糟糕,這可能是由於其語言復雜的形態。
2、黑箱對抗訓練
為了提高模型的魯棒性,作者採用了黑箱對抗訓練的方法,也即用帶雜訊文本訓練翻譯模型。
首先用如上表,用雜訊文本訓練在某些語言(例如法語)上表現良好,但是其魯棒性並不具有穩定的提高。這也很明顯,meanChar模型並不一定能解決key或者Nat雜訊的問題。
那麼如果我們用更復雜的charCNN模型就會提高模型對不同種類雜訊的魯棒性嗎?作者將用於訓練的Scr文本拆開來訓練模型——
發現:
1)盡管模型在不同的雜訊下仍然表現不一,但整體平均的表現有所提升。
2)用Rand數據訓練出的模型,對Swap和Mid文本測試結果都表現良好;而反之則不成立。這說明在訓練數據中更多的雜訊能夠提高模型的魯棒性。
3)只有用Nat數據集來訓練,才能提高Nat數據集測試的魯棒性。這個結果表明了計算模型和人類的表現之間的一個重要區別——在學習語言時,人類並沒有明確地暴露在雜訊樣本中。
4)作者將三種雜訊(Rand+Key+Nat)混合起來訓練模型,發現雖然針對每一個樣本的測試都表現略差,但整體上的魯棒性卻是最高的,而且對於多種雜訊具有普遍性。
六、對結果的分析
從上面的結果可以看出,多種雜訊同時訓練charCNN的模型的魯棒性更好。But why?
作者猜測可能是不同的卷積濾波器在不同種類的雜訊中學到了魯棒性。一個卷積濾波器原則上可以通過採用相等或接近相等的權重來捕獲平均(或總和)的操作。
為了檢驗這個猜測,他們分析了分別用Rand數據和Rand+Key+Nat數據訓練的兩個charCNN模型學習到的權重。針對每個模型,他們計算了1000個過濾器中每一個過濾器維度上的方差,然後對這些變數做以平均。結果如下圖
從圖上可以看出,Rand模型學到的權重方差要遠小於混合雜訊模型學到的權重方差。換句話說,混合雜訊訓練的模型學習了更多不同的權重,除了平均表示(meanChar)外,還有助於捕捉形態屬性。
而另一方面,混合雜訊模型中方差的變化則較大,表明不同字元嵌入維度的濾波器之間存在較大的差異。相比之下Rand模型中方差的變化就接近零。
另一方面,我們還看到合成雜訊訓練的模型沒有一個在Nat數據的測試中表現較好的。這表明自然雜訊合成雜訊有很大的不同。作者人工地檢測了德語的Nat數據集中大約40個樣本後,發現在Nat數據集中最常見的雜訊來源是語言中的語音或音韻錯誤(34%)和字母遺漏(32%)。這些在合成雜訊中並沒有,所以這表明要生成更好合成雜訊可能需要更多關於音素以及相應語言的知識。
七、總結
讓我們來看一看用Rand+key+Nat的charCNN模型來翻譯一下前面那個混亂的德語翻譯的結果吧:
「According to a study of Cambridge University, it doesn't matter which technology in a word is going to get the letters in a word that is the only important thing for the first and last letter.」
當然,其實他們的結果並不完美,但非常值得借鑒。
如作者所說:「我們的目的有二:
1)作為一個開始,讓大家去談論神經網路翻譯的魯棒性訓練和建模技巧;
2)促進大家去創造出更多更好的人工雜訊,以應用到新的語言和任務中。
Ⅳ 如何翻譯整篇的pdf文檔
因為不是專業的翻譯,所以在面對大量的英文文檔時,難免有些為難。藉助一些翻譯工具挨個短語翻譯的話,還是需要一點時間的。
在網上翻譯PDF版文獻時,如果直接復制內容粘貼,會出現換行符導致語句被拆分,翻譯效果大打折扣,那麼如何正確的翻譯英文版的PDF文件呢?本文分享一個簡單又好用的方法給大家,簡單幾個步驟就能輕松實現翻譯,快來看看吧!
推薦使用:金舟文檔翻譯軟體
操作方法:
第一步、首先,打開翻譯軟體,然後在左側選擇「文檔翻譯」功能;
Ⅵ 談談你對機器翻譯的認識,及如何利用機器翻譯
給你在網上查了一下相關的概念,說說我的理解:
概念:計算機輔助翻譯(CAT)是指在人工翻譯過程中輔助使用計算機程序的自動翻譯功能。重復的內容無需重復翻譯,而是由計算機程序自動匹配後直接從翻譯記憶庫中獲取出來,極大地減輕了譯員的工作量。
理想的CAT工具是一個具有自學習功能的軟體,它會隨著用戶的使用,記住用戶翻譯過的所有句子,並從中學習翻譯方法,發現新的單詞、語法和句型,並統統存儲為翻譯記憶庫。但是在現實中,也就是實用化的商品軟體中,還是以文本和字元串記憶為主,其餘語法特徵所用甚少。CAT工具必然還有內置的匹配率計算演算法,可將用戶需要翻譯的句子與記憶庫匹配,並給出匹配率指標方便用戶選擇使用。這樣,用戶就無需重復以前的勞動,從而提高翻譯速度和准確性,為用戶節省更多的時間。
從人為的翻譯來看機器翻譯,翻譯的過程可被細分如下:
1、解譯來源文字的文意
2、重新編譯此解析後所得的文意至目標語言。
在這看似簡單的步驟之後其實是復雜的認知操作。要能解譯來源文字的完整意義,一個譯者必須能夠分析與詮釋整段文章的所有特徵,必須能夠深度的了解其文法、語義、語法、成語等等,相當於了解來源語言的文化背景。譯者同時也必須兼備目標語言相同深度的知識。
機器翻譯(Machine Translation,經常簡寫為 MT)屬於計算語言學(Computational Linguistics)的范疇,其研究藉由計算機程序將文字或演說從一種自然語言翻譯成另一種自然語言。簡單來說,機器翻譯是通過將一個自然語言的字辭取代成另一個語言的字辭。藉由使用語料庫的技術,可達成更加復雜的自動翻譯,包含可更佳的處理不同的文法結構、詞彙辨識、慣用語的對應等。
所以,我理解的是:計算機輔助翻譯側重記憶和匹配;機器翻譯側重於理解,但是畢竟不是這個領域的,理解尚淺。希望有所幫助~
Ⅶ 機器翻譯的流程(原理)是怎麼樣的
機器翻譯的原理是利用計算機將源語言(Source)轉換為目標語言(Target),流程是Source→預處理→核心處理→後處理→Target。
人民生活質量不斷提高,人們到處旅行。可是人們不可能每種語言都精通,這時候機器翻譯就派上用場了。它可以讓不同國家的人交流無障礙,可以擴張人們的人脈。雖然機器翻譯還存在一些問題,但是隨著科技發展,這些問題將會得到解決。
Ⅷ 怎麼翻譯整篇Word文檔
推薦翻譯狗!網頁鏈接
很多時候,你都在想,要是世界上只有一種文字就好了。
你經歷了十二年義務教育,千軍萬馬過獨木橋來到大學,英語水平隨著一張張卷子不斷提高。你總想著自己筆下春秋在中英文間自由切換,但現實總是打臉太快:
讀原版小說,認出單詞但翻譯不出句子
看文獻材料,讀懂了導言卻看不懂正文
寫期末論文,寫好中文可翻譯不好英文
等等,你說你有翻譯軟體。
於是,你開始將中文,或者英文,一段段地復制到翻譯器里。
你在不斷地重復中,熟練掌握了Ctrl+C/V 大法,正准備得意地展現翻譯成果,發現它們只是段落和段落的拼接,缺少的不僅是整體感,更糟糕的是它們還恢復成了無格式的文本。
你不得不耗費更多的時間和精力,和最熟悉的陌生語言展開新一輪的拉鋸戰。
一個小時過去了……
一個白天過去了……
一天就這么過去了……
你看著文檔,總覺得翻譯前後對不上。這個時候已經很晚了,你關上文檔,不甘心地睡著了。
但這是你的翻譯方式,不是我的。
都已經9012年了,你需要的是支持文檔隨傳隨意,不限格式、不限大小,不限語言,並且翻譯後保持格式不亂的翻譯工具。你需要拋棄繁瑣而基礎的翻譯步驟,把做這些事浪費的大把時間,都留給享受有益的生活、學習。
你需要的翻譯軟體,不是你去執行每一個翻譯步驟,而是幫你執行好每一個翻譯步驟,節約你大量的時間和精力。
喏,如此看來,沒有任何翻譯工具,比【翻譯狗】更適合你了。
簡化所有翻譯流程,帶給你最好的文檔翻譯體驗。
Step1:登陸翻譯狗官網/翻譯狗APP;
Step2:選擇並上傳你需要翻譯的文檔;
Step3:坐等翻譯結果,並下載需要的格式。
Ⅸ 干貨分享:如何看待機器翻譯,它是和風細雨還是洪水猛獸
首先公開一個公開的秘密,其實很多譯員都是使用機器翻譯的,先用機器翻譯做一遍,之後再修改,當然,也包括我在內。
機器翻譯確實很有發展前景。十年前,我那時還在讀研究生,各種翻譯軟體基本上還都是以死譯為主,比如網易詞典翻譯、網路翻譯、谷歌翻譯等,給出的翻譯譯文不忍直視,生拉硬扯把意思翻譯出來,甚至那句話本來就不正確。
當今,AI技術不斷進步,語料庫的不斷擴充,機器翻譯的質量已經逐步提升。例如原來都是死譯,現在已經會切分一部分比較簡單的意群了。
當然,對於比較復雜的句子,以及文學類翻譯,機器翻譯依然不夠理想。目前,機器翻譯有利於對文稿進行初步加工,起碼可以減少一部分閱讀時間和輸入時間。
簡而言之,對於實用文體的翻譯,機器翻譯的確做到了一部分的輔助作用。
然而,作為市場中的翻譯,要有起碼的職業道德。無論是什麼商業化翻譯,尤其是純技術類資料,肯定不能只是機器翻譯了事。尤其是政府文件和技術資料,沒有誰會放心用機器翻譯的譯文直接來應用。
而且,在機器翻譯的基礎上進行修改,很多時候改動的也非常多,這個我有親身經歷。
去年,我曾經做了一個月的網路小說翻譯,單價其實不高,單純就是為了做漢譯英,我喜歡漢譯英。
我首先用了機器翻譯,發現結果一塌糊塗,還不如自己直接寫來的快。
需要提一句的是,北京大學早在幾年前就開設了計算機輔助翻譯專業(CAT),這個動向值得關注。因為,這正是機器翻譯並非一無是處,而是前途光明的象徵之一。
總之,機器翻譯不可能全盤否定,當然也更不能全部依託,把它作為輔助,是唯一正確的選擇。譯員也不必擔心自己有一天會被淘汰,這幾乎是不可能的,萬一等到了那一天,人類就會滅亡了。
相信我,做翻譯吧,我們可以相互交流。
Ⅹ 計算機翻譯程序如何把一個面向人看懂的語句組成程序變成計算機可執行的二進制代碼的過程
計算機程序語言主要有兩類,一種是腳本語言,另一種是需通過編譯的語言。
腳本語言通過解釋執行。編譯語言通過編譯器翻譯後執行。
在紙上寫好人看懂的語句組成的程序,當然是按腳本語言或編譯語言的語法規定寫的。
用編輯器,例如notepad,從鍵盤打進去,存成磁碟文件。
解釋器,邊讀程序,邊解釋,邊執行。例如,瀏覽器處理HTML網頁,Shell處理「批」文件。
編譯語言,由編譯器讀入全部程序,然後做詞法分析,句法分析,語法分析,邏輯結構分析,按語句順序及程序內容規定的條件轉移次序,翻譯成數據和指令碼,鏈接嵌入必要的庫的代碼,作優化後把可執行碼(二進制代碼)存回磁碟。最後用戶運行可執行碼。例如,vb,vc程序。