Google 推出雲端文字轉語音 API 讓讀音更自然

2018-04-02

Published by

藍骨

智能助手應用普及，對於文字轉語音的要求也逐漸提升。Google 近年有推出雲端人工智能機器學習服務，最近就公佈推出新的文字轉語音 API，可以把文字變成自然的發音，支援各種語音應用需求。

這個雲端文字轉語音（Text-to-speech）API 可以，支援 12 種語言並轉變成 32 種自然語言，把電腦中的書面內容，變成口語形式讀出。而這個 API 亦配合新的 WaveNet 發音模型，令讀音變得更加自然而準確，運算速度比原先快 1,000 倍，只需要 50 毫秒就可以運算出 1 秒鐘的語音訊息，而且讀音樣本的解析度亦由 8 位元提升到 16 位元。Google 表示在美式英文 WaveNet 的測試中，有超過 20% 的人認為電腦讀音比真人讀音要好。

現時不同的物聯網或者智能助手，也需要用到文字轉語音服務，Google 自家的服務例如地圖、搜尋等都有內置文字轉語音服務，而現在推出了 API 之後，第三方的物聯網應用例如電視、汽車等都可以受惠於這個技術，令電腦與用家之間的互動可以更加自然流暢。

來源：Google