自今年 5月,前 Google 研究員吳恩達(Andrew Ng)加盟百度,並擔任首席科學家後,百度的發展一直受外界關注。近日百度突然向外界揭曉,他們已經開發出一種比 Apple 及 Google 等對手更準確的語音識別系統 — 百度 Deep Speech。
跟其他語音識別系統一樣,百度 Deep Speech 是一種深度學習的人工智能技術。系統就能夠識別出數字形式的聲音、圖片等數據。百度的研究團隊收集了 9600人共 7000小時的語音,並使用了疊加的物理學原理在語音樣本中增加了15 類噪音,使百度 Deep Speech 在噪音環境中更加準確。測試顯示該系統的出錯率比 Google Speech API,Wit.AI,微軟Bing Speech,以及 Apple Dictation 低 10%。另外,Deep Speech 比目前的語音識別系統亦更簡單。外界估計百度可能會在明年把 Deep Speech 技術整合到 Cool Box 使用。
資料來源: forbes
相關文章:
【評測】SonarPen 2 : Apple Pencil 平替之選 支援側轉 低延遲筆觸 【教學】iOS 18.2 香港如何用 ChatGPT 詳細方法 + 機種限定 【教學】iPhone 連 Wi-Fi 自動關流動數據 離開 Wi-Fi 自動啟動 、不怕誤用數據