百度機器學習技術個半鐘複製你把聲

國內互聯網巨頭百度日前發表了最新論文，介紹他們在語音生成方面的最新發展。這個最新研發的系統能夠模仿數千種不同說話者的聲音，而且只需要不到 1.5 小時的聲音作為機器學習系統的訓練數據。以百度正在掌握和研發的技術看來，人們的聲音和說話特徵都能夠輕易模仿。

百度解釋指技術理念背後，就是從不同說話者中獨立學習共同的和存在差異性的信息。在此基礎上，百度的研究人員還打算嘗試從短短幾秒的短句中，學習說話者的聲音特質，簡單而言就是將語音複製。人員將研究方式、樣本和模型等，透過論文和在 Github 公開，有興趣的讀者可以百度的科研網站閱讀他們的文章。

如何將語音複製技術應用，相信是一般人最關心的地方，美國人工智能協會（AAAI）主席 Subbarao Kambhampati 分享百度這項技術時，以晚間為小孩子說故事作例子，表示有了這技術，只要事先設置好自己的聲音，就可以由有聲讀書裝置代替爸爸媽媽為孩子說故事。

來源：Baidu