圖像辨識一向是人工智能的重要技術之一,要準確地描述圖片的內容,就算是真人可能也要想一想,要由電腦算法推算,就更加困難,不過 Google 看來已經對此技術有一定的突破。
Google 最近向開發者開放了一個「Show and Tell」算法,可以在經過訓練之後,辨認出圖片上的物件並自動寫下標題,準確到高達 93.9%,這比上一代算法只有 89.6% 準確度已經改善了不少。這個新技術採用 Google 的第三代「Inception」模式,可以更有效的辨認出照片內的不同物件,而且可以用庚子演的方式表達,例如描述草皮的顏色和小狗與飛碟之間的關係。
Google 表示,這個系統可以提供更加深層的圖片認知,例如就算是幾張小狗在海灘上的照片,都可以看出各自的分別,從而計算出相近但不同的標題。這樣的技術可以有很廣泛的應用,例如自動製作為弱視人士的輔助文字、協助歷史學家研究文獻、改善人工智能技術等等。要得到這個算法的原始碼,需要使用 Google 的 TensorFlow 系統,而且人工智能的訓練需要自行處理,相信要看到實際可用的應用,仍然需要等上一段時間。
來源:Google Research
相關文章:
【評測】Google Pixel 9 Pro Fold 詳細評測 機身偏闊手感一般 + 雙熒幕表現出色 + 終原生支援香港 5G + 定價偏貴不夠抵玩 【教學】iOS 18.1 AI 一鍵清相片路人雜物 旅遊景點不再人頭湧湧 Pokémon GO 數據將被用作訓練 AI 開發自家地理空間模型