Machine Translation（機器翻譯）：定義與含義 — AI 維基

自動將文字從一種語言翻譯成另一種語言。現代神經機器翻譯（NMT）使用在平行語料庫（文字及其翻譯）上訓練的編碼器-解碼器 Transformer。Google 翻譯、DeepL 和基於 LLM 的翻譯都使用這種方法的變體。品質已經大幅提升——對於常見語言對，MT 在例行內容上已接近專業人工翻譯。

為什麼重要

機器翻譯大規模地打破語言障礙。它促進全球商務、跨語言搜尋、即時通訊，以及跨語言的資訊取得。對於 AI 而言，MT 是讓主要在英語上訓練的模型能夠服務 100 多種語言的使用者的方式——這也是為什麼多語言分詞器效率對成本很重要。

深度解析

現代 NMT 使用編碼器-解碼器 Transformer 架構：編碼器處理來源句子，解碼器透過交叉注意力關注編碼後的來源，逐 token 生成目標句子。訓練需要平行語料庫——兩種語言各數百萬句對。資料品質和領域匹配至關重要：在歐盟議會文件上訓練的模型能很好地翻譯法律文字，但對非正式聊天就差了。

LLM 作為翻譯器

大型語言模型已成為有競爭力的翻譯器，有時在高資源語言對上甚至超越專用的 MT 系統。它們的優勢：因為在多樣化的語境中接觸過語言使用，所以更能理解上下文、慣用語和文化細微差異。它們的劣勢：每個句子的速度更慢、成本更高。對於數百萬句的即時翻譯，專用模型（如 Google 翻譯背後的模型）是必需的。對於較小量的高品質翻譯，LLM 通常能產出更自然的結果。

語言的長尾

MT 品質在不同語言對之間差異巨大。英法、英西和英中翻譯服務完善（訓練資料充足）。但對於世界上 7,000 多種語言，大多數語言對幾乎沒有平行訓練資料。低資源翻譯仍是活躍的研究領域，方法包括：透過多語言模型進行零樣本翻譯、反向翻譯（使用 MT 系統本身生成合成訓練資料），以及從相關語言進行遷移學習。

Machine Translation

為什麼重要

深度解析

LLM 作為翻譯器

語言的長尾

相關概念