OpenAI Voice Engine 模仿真人聲音顧及安全問題暫不對外公開

OpenAI 宣布開發出一款創新的生成式人工智能，名為「Voice Engine」，能夠精準模仿人類的聲音。這項技術僅需短短 15 秒的語音樣本，便能合成極為相似的聲音，並支援多語言轉換。OpenAI 強調對此技術的安全應用抱持謹慎態度，並未立即公開，而是選擇先進行試驗性應用以確保安全。

OpenAI 在推出開發對話型 AI 「ChatGPT」後再次推出能夠復刻人聲的「Voice Engine」。只需要 15 秒的語音樣本和文字輸入，即能製作出與原聲極為相似的語音輸出，甚至能轉換成非母語的外語發音。

「Voice Engine」技術不僅能實現更真實的人聲復刻，而且還能應用於各種場景，如為孩童朗讀故事、企業產品介紹、醫療諮詢服務，以及為語言障礙者提供幫助，支援多種語言，且能模仿語調和情感。

合成語音技術同樣會擔心會被濫用。為此 OpenAI 決定不急於完全公開「Voice Engine」。公司強調生成逼真人聲帶來的風險巨大，尤其在選舉期間，需要格外小心。OpenAI 正與政府和外部企業合作，並採取必要的安全措施。

OpenAI 於 2 月推出了視頻生成 AI 「Sora」，該技術同樣未對外公開。面對生成型 AI 技術日益普及所引發的濫用風險，OpenAI 對商用化明顯採取較審慎態度，以確保安全和負責任的使用。

官方網站上展示了詳細應用方式。

資料來源：APNews, OpenAI