除了娛樂和獲取資訊,原來睇電視都能夠學習新知識。Google AI 項目 DeepMind 和牛津大學的科研人員,利用人工智能技術製作了史上準確度最高的唇讀軟件。透過使用超過 5,000 小時,2010 年至 2015 年間播出的 BBC 電視節目,科學家訓練神經網絡去為影片加入註解,令 DeepMind 變成唇讀專家。
在隨機抽樣的 200 條片段中,人工智能唇讀的準確度達 46.8%,人類唇讀專家解讀同一片段,準確度則只有 12.4%。唇讀除了可以讓失聰人士明白我們的談話內容,科技公司例如 Google 亦可以用於消費者應用軟件,改善聲音辨識系統和靜音聽寫功能。這次牛津大學和 DeepMind 合作的科研成果,未來或會用於語音助理功能,用戶就毋須對著手機大大聲說出指令,只需口郁郁就可以。
來源:cnet
相關文章:
【教學】免費圖片變影片 AI 免 VPN、電腦手機都玩到 【教學】AI speaker 免費 AI 生成語音工具 AI 代你講嘢、支援廣東話語音 自帶 AI 的 PDF 文件工具《UPDF》教學 必用 9 大功能:AI 總結內容、翻譯、PDF 編輯、加簽名、轉TXT檔
分享到 :
最新影片
