人工智能

OpenAI Voice Engine 模仿真人聲音 顧及安全問題暫不對外公開

Published by
Lawton
Share

OpenAI 宣布開發出一款創新的生成式人工智能,名為「Voice Engine」,能夠精準模仿人類的聲音。這項技術僅需短短 15 秒的語音樣本,便能合成極為相似的聲音,並支援多語言轉換。OpenAI 強調對此技術的安全應用抱持謹慎態度,並未立即公開,而是選擇先進行試驗性應用以確保安全。

 

OpenAI 在推出開發對話型 AI 「ChatGPT」後再次推出能夠復刻人聲的「Voice Engine」。只需要 15 秒的語音樣本和文字輸入,即能製作出與原聲極為相似的語音輸出,甚至能轉換成非母語的外語發音。

 

「Voice Engine」技術不僅能實現更真實的人聲復刻,而且還能應用於各種場景,如為孩童朗讀故事、企業產品介紹、醫療諮詢服務,以及為語言障礙者提供幫助,支援多種語言,且能模仿語調和情感。

 

合成語音技術同樣會擔心會被濫用。為此 OpenAI 決定不急於完全公開「Voice Engine」。公司強調生成逼真人聲帶來的風險巨大,尤其在選舉期間,需要格外小心。OpenAI 正與政府和外部企業合作,並採取必要的安全措施。

 

OpenAI 於 2 月推出了視頻生成 AI 「Sora」,該技術同樣未對外公開。面對生成型 AI 技術日益普及所引發的濫用風險,OpenAI 對商用化明顯採取較審慎態度,以確保安全和負責任的使用。

 

官方網站上展示了詳細應用方式。

 

資料來源:APNews, OpenAI

 


相關文章:
  • OpenAI 成立廿人開發團隊 自研晶片減少第三方依賴
  • Meta 或將開發 AI 搜尋引擎  減少依賴 Google、微軟
  • OpenAI 語音轉文字工具 幻覺問題嚴重醫療機構記錄或受影響

  • Published by
    Lawton