國內互聯網巨頭百度日前發表了最新論文,介紹他們在語音生成方面的最新發展。這個最新研發的系統能夠模仿數千種不同說話者的聲音,而且只需要不到 1.5 小時的聲音作為機器學習系統的訓練數據。以百度正在掌握和研發的技術看來,人們的聲音和說話特徵都能夠輕易模仿。
百度解釋指技術理念背後,就是從不同說話者中獨立學習共同的和存在差異性的信息。在此基礎上,百度的研究人員還打算嘗試從短短幾秒的短句中,學習說話者的聲音特質,簡單而言就是將語音複製。人員將研究方式、樣本和模型等,透過論文和在 Github 公開,有興趣的讀者可以百度的科研網站閱讀他們的文章。
如何將語音複製技術應用,相信是一般人最關心的地方,美國人工智能協會(AAAI)主席 Subbarao Kambhampati 分享百度這項技術時,以晚間為小孩子說故事作例子,表示有了這技術,只要事先設置好自己的聲音,就可以由有聲讀書裝置代替爸爸媽媽為孩子說故事。
來源:Baidu