我
機器翻譯的翻譯記憶(TM)實際上允許存儲和針對大量的檢索條件檢索所述對齊的多語言文本段。TM系統與原始文本和檢索方法存儲的信息不同。翻譯記憶庫的功能(néng)主要分爲兩大類,離線和在線功能(néng)。離線功能(néng)包括分析,導入和導出,而在線功能(néng)包括翻譯功能(néng)。這就(jiù)像數據庫在其管理和數據庫中的運行一樣。
①離線功能(néng)
離線功能(néng)主要包括導入,分析和導出詳細信息。導入:導入功能(néng)將(jiāng)文本及其翻譯從文本文件傳輸到翻譯記憶庫。外部源可用的原始格式數據及其轉換在TM中導入。這種數據導入需要系統外的用戶對文本進行預處理,并且還要對系統内的文本進行交互式編輯。本案例涉及的清單是輸入格式,預處理和後期編輯。本機格式也被(bèi)用在以舊換新導入和翻譯記憶保存在文件中。此格式保留分段,對齊和控制信息。其核對表包括本機格式,TM組合中使用的格式。
分析:在提交到翻譯之前,在導入TM或單語源文本之前處理多語言文本,同時在每種情況下定義輸入和輸出。它涉及對源文本和目标文本的解析,該過程中涉及的步驟如0下所述。文本解析:識别标點符号對于區分标點符号非常重要。标記組成(chéng)了某種預編輯,它包含在翻譯的輔助程序中。不同的格式約定和标記語言是良好(hǎo)分析的符号。其他特殊文本元素,如代碼,名稱,數字,日期,貨币,無需翻譯。
語言分析:單詞和文本列表由基本形式縮減(也稱爲詞形還原)來準備,用于從術語庫中檢索術語。詞組識别用于從源文本中提取多詞術語。語言分析是對術語的詞序變化進行歸一化所必需的。分割:分割的目的是選擇有用的翻譯單元。它是一種解析,通過使用表面(miàn)解析單一地完成(chéng)。分段過程中涉及的核對表是輸入格式,分段定義,輸出格式和用戶幹預的可能(néng)性。一個句子的翻譯取決于被(bèi)包圍的翻譯; 然而,翻譯在翻譯過程中逐句進行。對齊:源對象和目标文本之間的轉換對應關系在對齊中定義。它爲分段提供反饋,理想情況下它可以糾正初始分段。
術語提取:它是自動分析階段,也稱爲詞彙。它還估算了翻譯工作所涉及的工作量,通常稱爲文本統計。導出:它涉及將(jiāng)文本從内存傳輸到外部文本文件。
②在線功能(néng)
TM的實際目的是爲用戶提供最佳的翻譯選擇。TM的在線功能(néng)包括下面(miàn)提到的先決條件;
必須顯示響應的源文本和目标文本。
必須指出查詢和響應的差異和身份。
必須根據偏好(hǎo)評估響應的替代方案。
必須在響應中輕松插入響應。
但是,在線翻譯記憶庫的功能(néng)是;
檢索不同類型的比賽。當源和存儲的段按字符匹配時,將(jiāng)出現完全匹配。範圍從0到100%的模糊匹配出現在未找到完全匹配的位置。當翻譯者接受新翻譯時,完成(chéng)TM數據庫的更新。可以通過删除和更改TM中可用的條目來修改它。在某些情況下,會爲一個段保存多個翻譯。自動翻譯是TM工具中的自動檢索和替換。當翻譯器在文檔中移動時,結果會自動顯示。如果找到完全匹配,則完成(chéng)自動替換。網絡允許翻譯團隊聚在一起(qǐ),通過將(jiāng)一個翻譯者的短語和句子提供給另一個翻譯者來更快地翻譯文本。然而,TM的共享開辟了更多的機會和選擇。
上一篇:翻譯行業人性化翻譯的重要性 下一篇:翻譯中的創造力