隨着人工智能技術的發展,對於圖像分析和自然語言表達能力已經有相當的突破。Microsoft 就正在開發一套視覺認知服務,協助視障人士聆聽文件上的影像。
今次 Microsoft 開發的「電腦視覺認知服務」,就是利用神經網絡人工智能配合深度學習技術,提升對於圖像的文字描述能力。當用家在文件插入圖像的時候,就可以自動得到建議的文字描述。當越多用家使用這個功能,就會自動從中學習,改善準確度。而這樣的功能,將可以令用家輕鬆令文件變得適合視障人士閱讀。
這個功能將會在明年推出至 PC 版本的 Office 365,另外也會提供適合視障人士的文件範本,確保文件排版和字型等方便視障人士閱讀。Office 已經有一個工具可以檢查文件是否無障礙設計,並針對問題建議改善方式。有了這樣的功能,未來視障人士要閱讀這類文件也變得更加方便,如果未來可以增加中文方面的支援就好了。
來源:Venture Beat
【教學】ChatGPT 視像隔空教你養魚 用相機攝取現場環境 實時 AI 回應用家問題 【教學】MacWhisper 語音轉錄文字 AI 工具 本地 AI 模型處理 + 支援廣東話、多國語言 + 輸出字幕檔 【實測】OpenAI Sora 生成影片 真人影片都得 + 像真度極高