Facebook 的動態消息自動翻譯功能,每天為全球用戶翻譯約 200 億條內容,無論貼文是用什麼語言發出,Facebook 基本上都能夠翻譯,只是翻譯結果可能會詞不達意或出現謬誤。原因之一是自動翻譯功能以英語作為中介,例如法語內容先要翻譯成英語,再翻譯成我們常用的中文。
以英語作為中介是因為英語的翻譯資料集非常龐大,不過亦因為經過了中介,翻譯誤差的機會因此增加。翻譯的準確性減低之餘,整個翻譯過程亦變得複雜繁瑣。Facebook AI 開發新的機器翻譯模型,希望能夠解決上述問題。要創建翻譯數據資料庫,以往是要找同時懂得兩種語言的人,但這種做法相當困難,同時亦難以擴張規模。
Facebook AI 開發的機器翻譯模型,能夠在不使用英語的情況下,直接進行雙語雙向翻譯,而翻譯結果將會基於 BLEU 指標,一個為了評估機器翻譯而開發的指標,表現將會較利用英語作為中介的模型更佳。Facebook 這個做法要克服的問題不少,例如使用人數較少的語言,是否能夠收集到足夠的文本數據,就會影響機器學習的資源量。為此 Facebook 正在將資料集、模型訓練等資料改為開源,而協助這項技術能有更進一步發展。
來源:buzzorange
相關文章:
【教學】ChatGPT 視像隔空教你養魚 用相機攝取現場環境 實時 AI 回應用家問題 【教學】MacWhisper 語音轉錄文字 AI 工具 本地 AI 模型處理 + 支援廣東話、多國語言 + 輸出字幕檔 【實測】OpenAI Sora 生成影片 真人影片都得 + 像真度極高