百度的語音識別系統超越 Apple 和 Google?

作者

依莉詩
發佈日期

2014-12-19
閱讀時間

2分鐘
字體大小

自今年 5月，前 Google 研究員吳恩達（Andrew Ng）加盟百度，並擔任首席科學家後，百度的發展一直受外界關注。近日百度突然向外界揭曉，他們已經開發出一種比 Apple 及 Google 等對手更準確的語音識別系統 — 百度 Deep Speech。

跟其他語音識別系統一樣，百度 Deep Speech 是一種深度學習的人工智能技術。系統就能夠識別出數字形式的聲音、圖片等數據。百度的研究團隊收集了 9600人共 7000小時的語音，並使用了疊加的物理學原理在語音樣本中增加了15 類噪音，使百度 Deep Speech 在噪音環境中更加準確。測試顯示該系統的出錯率比 Google Speech API，Wit.AI，微軟Bing Speech，以及 Apple Dictation 低 10%。另外，Deep Speech 比目前的語音識別系統亦更簡單。外界估計百度可能會在明年把 Deep Speech 技術整合到 Cool Box 使用。

資料來源: forbes