Meta 最近宣佈與聯合國教科文組織(UNESCO)合作推出「語言技術合作夥伴計劃」,致力收集語音錄音和文字記錄,以支援未來開源人工智能的發展。計劃目前正在尋找能夠提供超過 10 小時語音錄音及相應文字記錄的合作夥伴。
Meta 表示,合作夥伴將與公司的人工智能團隊合作,將這些語言整合到語音識別和翻譯模型中。加拿大北部人口稀少的努納武特地區政府已成為首批合作夥伴之一,該地區部分居民使用統稱為 Inuktut 的因紐特語。
除了收集語言數據外,Meta 還發表了一個開源機器翻譯基準測試工具,用於評估語言翻譯模型的性能。這個由語言學家精心設計的基準測試支援七種語言,可通過 Hugging Face 人工智能開發平台使用和參與開發。
然而,雖然 Meta 將這些計劃定位為慈善項目,但他們本身也將從升級的語音識別和翻譯模型中受益。之前有報導指 Facebook 在處理非英語內容方面一直備受批評,例如在新冠疫情期間,意大利語和西班牙語的錯誤資訊標記率遠低於英語內容。Meta 表示正在採取措施改進其翻譯和內容審核技術。
來源:TechCrunch
相關文章:
Meta 前高層兼紐西蘭外交官爆料 曾考慮分享香港用戶資料換取入華、擬聘 300 內容審查員 FB Messenger 圖示突變回藍色 回歸最早設計 Meta 未解釋背後原因 Meta 並不擔心 DeepSeek 競爭 將參考 DeepSeek 提升 Llama 效能
分享到 :
最新影片
