除了娛樂和獲取資訊,原來睇電視都能夠學習新知識。Google AI 項目 DeepMind 和牛津大學的科研人員,利用人工智能技術製作了史上準確度最高的唇讀軟件。透過使用超過 5,000 小時,2010 年至 2015 年間播出的 BBC 電視節目,科學家訓練神經網絡去為影片加入註解,令 DeepMind 變成唇讀專家。
在隨機抽樣的 200 條片段中,人工智能唇讀的準確度達 46.8%,人類唇讀專家解讀同一片段,準確度則只有 12.4%。唇讀除了可以讓失聰人士明白我們的談話內容,科技公司例如 Google 亦可以用於消費者應用軟件,改善聲音辨識系統和靜音聽寫功能。這次牛津大學和 DeepMind 合作的科研成果,未來或會用於語音助理功能,用戶就毋須對著手機大大聲說出指令,只需口郁郁就可以。
來源:cnet
相關文章:
WhatsApp 直接加入 Copilot 教學 輕鬆與 Microsoft AI 助理對話 【評測】Google Pixel 9 Pro Fold 詳細評測 機身偏闊手感一般 + 雙熒幕表現出色 + 終原生支援香港 5G + 定價偏貴不夠抵玩 【教學】Midjourney 網頁版免費試玩 無須再連 Discord + 生成圖片全部有紀錄