智能助手應用普及,對於文字轉語音的要求也逐漸提升。Google 近年有推出雲端人工智能機器學習服務,最近就公佈推出新的文字轉語音 API,可以把文字變成自然的發音,支援各種語音應用需求。
這個雲端文字轉語音(Text-to-speech)API 可以,支援 12 種語言並轉變成 32 種自然語言,把電腦中的書面內容,變成口語形式讀出。而這個 API 亦配合新的 WaveNet 發音模型,令讀音變得更加自然而準確,運算速度比原先快 1,000 倍,只需要 50 毫秒就可以運算出 1 秒鐘的語音訊息,而且讀音樣本的解析度亦由 8 位元提升到 16 位元。Google 表示在美式英文 WaveNet 的測試中,有超過 20% 的人認為電腦讀音比真人讀音要好。
現時不同的物聯網或者智能助手,也需要用到文字轉語音服務,Google 自家的服務例如地圖、搜尋等都有內置文字轉語音服務,而現在推出了 API 之後,第三方的物聯網應用例如電視、汽車等都可以受惠於這個技術,令電腦與用家之間的互動可以更加自然流暢。
來源:Google
【教學】ChatGPT 視像隔空教你養魚 用相機攝取現場環境 實時 AI 回應用家問題 【教學】MacWhisper 語音轉錄文字 AI 工具 本地 AI 模型處理 + 支援廣東話、多國語言 + 輸出字幕檔 【教學】iOS 18.2 香港如何用 ChatGPT 詳細方法 + 機種限定