Zubnet AI學習Wiki › Machine Translation
使用AI

Machine Translation

別名:MT、神經機器翻譯、NMT
自動將文字從一種語言翻譯成另一種語言。現代神經機器翻譯(NMT)使用在平行語料庫(文字及其翻譯)上訓練的編碼器-解碼器 Transformer。Google 翻譯、DeepL 和基於 LLM 的翻譯都使用這種方法的變體。品質已經大幅提升——對於常見語言對,MT 在例行內容上已接近專業人工翻譯。

為什麼重要

機器翻譯大規模地打破語言障礙。它促進全球商務、跨語言搜尋、即時通訊,以及跨語言的資訊取得。對於 AI 而言,MT 是讓主要在英語上訓練的模型能夠服務 100 多種語言的使用者的方式——這也是為什麼多語言分詞器效率對成本很重要。

深度解析

現代 NMT 使用編碼器-解碼器 Transformer 架構:編碼器處理來源句子,解碼器透過交叉注意力關注編碼後的來源,逐 token 生成目標句子。訓練需要平行語料庫——兩種語言各數百萬句對。資料品質和領域匹配至關重要:在歐盟議會文件上訓練的模型能很好地翻譯法律文字,但對非正式聊天就差了。

LLM 作為翻譯器

大型語言模型已成為有競爭力的翻譯器,有時在高資源語言對上甚至超越專用的 MT 系統。它們的優勢:因為在多樣化的語境中接觸過語言使用,所以更能理解上下文、慣用語和文化細微差異。它們的劣勢:每個句子的速度更慢、成本更高。對於數百萬句的即時翻譯,專用模型(如 Google 翻譯背後的模型)是必需的。對於較小量的高品質翻譯,LLM 通常能產出更自然的結果。

語言的長尾

MT 品質在不同語言對之間差異巨大。英法、英西和英中翻譯服務完善(訓練資料充足)。但對於世界上 7,000 多種語言,大多數語言對幾乎沒有平行訓練資料。低資源翻譯仍是活躍的研究領域,方法包括:透過多語言模型進行零樣本翻譯、反向翻譯(使用 MT 系統本身生成合成訓練資料),以及從相關語言進行遷移學習。

相關概念

← 所有術語
ESC
Start typing to search...