自今年 5月,前 Google 研究員吳恩達(Andrew Ng)加盟百度,並擔任首席科學家後,百度的發展一直受外界關注。近日百度突然向外界揭曉,他們已經開發出一種比 Apple 及 Google 等對手更準確的語音識別系統 — 百度 Deep Speech。
跟其他語音識別系統一樣,百度 Deep Speech 是一種深度學習的人工智能技術。系統就能夠識別出數字形式的聲音、圖片等數據。百度的研究團隊收集了 9600人共 7000小時的語音,並使用了疊加的物理學原理在語音樣本中增加了15 類噪音,使百度 Deep Speech 在噪音環境中更加準確。測試顯示該系統的出錯率比 Google Speech API,Wit.AI,微軟Bing Speech,以及 Apple Dictation 低 10%。另外,Deep Speech 比目前的語音識別系統亦更簡單。外界估計百度可能會在明年把 Deep Speech 技術整合到 Cool Box 使用。
資料來源: forbes
相關文章:
【教學】iOS 18.1 如何用 Apple Intelligence 只需 2 個設定 + 香港免 VPN 也可用 M4 MacBook Pro 開箱影片流出 3 個 USB-C + 標準 16 GB RAM + 跑分結果 【教學】iOS 18 延長電池壽命幫到手 一個設定保養電池