智能助手應用普及,對於文字轉語音的要求也逐漸提升。Google 近年有推出雲端人工智能機器學習服務,最近就公佈推出新的文字轉語音 API,可以把文字變成自然的發音,支援各種語音應用需求。
這個雲端文字轉語音(Text-to-speech)API 可以,支援 12 種語言並轉變成 32 種自然語言,把電腦中的書面內容,變成口語形式讀出。而這個 API 亦配合新的 WaveNet 發音模型,令讀音變得更加自然而準確,運算速度比原先快 1,000 倍,只需要 50 毫秒就可以運算出 1 秒鐘的語音訊息,而且讀音樣本的解析度亦由 8 位元提升到 16 位元。Google 表示在美式英文 WaveNet 的測試中,有超過 20% 的人認為電腦讀音比真人讀音要好。
現時不同的物聯網或者智能助手,也需要用到文字轉語音服務,Google 自家的服務例如地圖、搜尋等都有內置文字轉語音服務,而現在推出了 API 之後,第三方的物聯網應用例如電視、汽車等都可以受惠於這個技術,令電腦與用家之間的互動可以更加自然流暢。
來源:Google
相關文章:
【評測】Google Pixel 9 Pro Fold 詳細評測 機身偏闊手感一般 + 雙熒幕表現出色 + 終原生支援香港 5G + 定價偏貴不夠抵玩 【教學】iOS 18.1 AI 一鍵清相片路人雜物 旅遊景點不再人頭湧湧 可口可樂聖誕廣告用 AI 生成 網民批評 AI 味濃毀掉傳統