我
機器翻譯(MT)研究將(jiāng)語音或文本從一種語言翻譯成(chéng)另一種語言的軟件用法,作爲計算語言學領域。最基本的機器翻譯隻是執行從一種語言到另一種語言的單詞替換,但實際上,它不能(néng)識别完整的短語。機器翻譯提供了一種語言的單詞替代其他任何語言,忽略了文本的短語。然而,随著(zhe)IT技術的不斷發展,這個問題正在通過統計技術和語料庫,通過處理語言類型學的差異,異常的隔離和習語的翻譯來解決。這種類型的翻譯對公式化語言,法律和政府文件都(dōu)有效。通過包括人爲幹預可以改善MT輸出; MT是一個非常有用的工具,可以幫助人工翻譯,天氣報告就(jiù)是這種情況的一個很好(hǎo)的例子。
翻譯過程可以用兩個簡單的步驟來描述:
①解碼源語言文本的含義。
②重新編碼目标語言文本中的含義。
在MT中,軟件被(bèi)編程爲像人類翻譯一樣理解源語言的文本,并且需要關于語法,語法,語義和習語的深入信息。自動翻譯在幾秒鍾内産生輸出,結果非常接近人類翻譯質量。該語言規則在機器翻譯中使用; 目标語言中最合适的單詞將(jiāng)替換爲源語言文本中的單詞。通常,這種基于規則的方法給出了用于生成(chéng)目标語言中文本的符号表示,稱爲中介。根據中間人的表示,MT的方法被(bèi)稱爲基于轉移的機器翻譯或語際機器翻譯。該基于規則的MT被(bèi)用在你正在翻譯密切相關的語言。這種翻譯主要應用于語法程序和詞典的創建。它通過使用句法和形态規則以及語言的語義分析來涉及源語言和目标語言的語言學信息。
與語言間機器翻譯一樣,基于轉移的MT從模拟原始句子含義的中間表示創建翻譯。雖然語際MT是基于規則的MT方法的一個實例,其中文本是以獨立于任何其他語言的中性語言翻譯的。MT也可以使用字典中的單詞進行翻譯; 這種翻譯方法基于字典條目。MT使用統計方法基于雙語文本,從而提供了良好(hǎo)的結果。可用于統計機器翻譯的軟件是IBM的CANDIDE,谷歌也使用了SYSTRAN。MT的另一種方法是基于實例的MT,其使用已經翻譯的文本作爲類比的概念。用于翻譯的類似句子組合在一起(qǐ)形成(chéng)完整的翻譯。一種精緻的方法,稱爲Hybrid MT利用基于規則和統計翻譯方法的優勢進行翻譯。這種方法在兩個方面(miàn)有所不同,一種是在應用統計方法之前使用基于規則的技術,而在第二種方式中,應用規則來預處理統計方法的數據以便更好(hǎo)地引導引擎。
結論:
雖然機器翻譯技術存在一些主要問題,例如消歧命名實體和非标準語音,但MT程序在世界各地都(dōu)有使用。這種方法在醫學和法律領域非常成(chéng)功,因爲很少有人類翻譯。盡管有其局限性,MT通過提供幾乎準确的結果爲公司節省了大量的時間和金錢。