有消息指 OpenAI 將推出多模態 AI 助理,並已向部分客戶展示其成果。據悉該 AI 助理既能與用戶對話亦能辨識物體,並將於周一的發布會上發布。
根據外媒 The Information 報道,與單獨轉錄和文字轉語音模型相比,OpenAI 的 AI 助理能更快、更準確地解讀影像和音訊。OpenAI AI 助理甚至能幫助客服人員更好地理解來電者的語調或他們是否在諷刺,更能幫助學生學數學或翻譯現實世界的標誌。OpenAI AI 助理在回答某些問題的能力可超越 GPT-4 Turbo,但仍會自信地答錯。
開發者 Ananay Arora 表示 OpenAI 或在準備於 ChatGPT 建立打電話功能,並發布相關程式碼截圖,稱有證據表明 OpenAI 已為即時音訊及視訊通訊配置伺服器。
OpenAI seems to be working on having phone calls inside of chatGPT. This is probably going to be a small part of the event announced on Monday.
(1/n) pic.twitter.com/KT8Hb54DwA— Ananay (@ananayarora) May 11, 2024
OpenAI 總裁 Sam Altman 表示周一的發布會不會公布新的 AI 搜尋引擎,但若 The Information 的報道屬實,AI 助理或會於 Google的 I/O 開發者大會發布。據聞 Google 一直在測試 AI 打電話功能,並將推出取代 Google Assistant 的 Pixie,能透過裝置鏡頭觀察物體,並提供購買方式或使用說明。
資料來源:The Verge
相關文章:
傳 OpenAI 準備明年推出 AI 助理 可控制電腦自主行動 Elon Musk 與 OpenAI 官司繼續 Microsoft 被納入為新被告 OpenAI 成立廿人開發團隊 自研晶片減少第三方依賴