科技新聞

Google 推出雲端文字轉語音 API 讓讀音更自然

Published by
藍骨
Share

智能助手應用普及,對於文字轉語音的要求也逐漸提升。Google 近年有推出雲端人工智能機器學習服務,最近就公佈推出新的文字轉語音 API,可以把文字變成自然的發音,支援各種語音應用需求。

這個雲端文字轉語音(Text-to-speech)API 可以,支援 12 種語言並轉變成 32 種自然語言,把電腦中的書面內容,變成口語形式讀出。而這個 API 亦配合新的 WaveNet 發音模型,令讀音變得更加自然而準確,運算速度比原先快 1,000 倍,只需要 50 毫秒就可以運算出 1 秒鐘的語音訊息,而且讀音樣本的解析度亦由 8 位元提升到 16 位元。Google 表示在美式英文 WaveNet 的測試中,有超過 20% 的人認為電腦讀音比真人讀音要好。

現時不同的物聯網或者智能助手,也需要用到文字轉語音服務,Google 自家的服務例如地圖、搜尋等都有內置文字轉語音服務,而現在推出了 API 之後,第三方的物聯網應用例如電視、汽車等都可以受惠於這個技術,令電腦與用家之間的互動可以更加自然流暢。

來源:Google


相關文章:
  • 【教學】「ImageFX」Google AI 繪圖工具教學 免費使用、一鍵生成旅行/食物圖片
  • AI 同聲傳譯 20人對話    免 APP 翻譯機 Timekettle X1
  • 商湯稱 AI 大模型稱勁過 GPT-4 Turbo 股價急升 3 成後停牌

  • Published by
    藍骨