超過 9 成準確度，Google 推出新版本照片標題辨識技術

2016-09-24

Published by

藍骨

圖像辨識一向是人工智能的重要技術之一，要準確地描述圖片的內容，就算是真人可能也要想一想，要由電腦算法推算，就更加困難，不過 Google 看來已經對此技術有一定的突破。

Google 最近向開發者開放了一個「Show and Tell」算法，可以在經過訓練之後，辨認出圖片上的物件並自動寫下標題，準確到高達 93.9%，這比上一代算法只有 89.6% 準確度已經改善了不少。這個新技術採用 Google 的第三代「Inception」模式，可以更有效的辨認出照片內的不同物件，而且可以用庚子演的方式表達，例如描述草皮的顏色和小狗與飛碟之間的關係。

Google 表示，這個系統可以提供更加深層的圖片認知，例如就算是幾張小狗在海灘上的照片，都可以看出各自的分別，從而計算出相近但不同的標題。這樣的技術可以有很廣泛的應用，例如自動製作為弱視人士的輔助文字、協助歷史學家研究文獻、改善人工智能技術等等。要得到這個算法的原始碼，需要使用 Google 的 TensorFlow 系統，而且人工智能的訓練需要自行處理，相信要看到實際可用的應用，仍然需要等上一段時間。

來源：Google Research

Published by

藍骨

10 年前 ago

日本推 FK YOU 小鍵盤預購專門輸入「嗰幾隻字」復古造型成發洩神物

9 小時前 ago

生活科技

釜山直擊 LG 2026 新家電一機可洗衣+低溫烘乾自家掃拖機械人首現身

9 小時前 ago

資訊保安

超過 9 成準確度，Google 推出新版本照片標題辨識技術

Recent Posts

日本推 FK YOU 小鍵盤預購專門輸入「嗰幾隻字」復古造型成發洩神物

釜山直擊 LG 2026 新家電一機可洗衣+低溫烘乾自家掃拖機械人首現身

水務署遺失抄錶電子手帳　炮台山 495 戶受影響載有住址、用戶姓名等資料

微信全面封殺 AI 內容禁止以 AI 替代真人創作違規帳號永久封鎖

深圳現 40 米「巨型枕頭」封閉氣膜降低噪音兼隔粉塵無懼 14 級颱風及暴雨干擾

Sony 開拍 Metal Gear Solid 真人電影由《死神來了：血脈》導演拍檔執導

macOS 驚爆「計時炸彈」漏洞運作近 49.7 天網絡即癱瘓必須重啟 Mac 機復原

港大 DeepTutor 開源登場將 PDF 教材轉化為互動個人化教學變身 AI 個人補習老師

iPhone 暢順行 82 億參數模型 1 bit LLM Bonsai 8B 登場記憶體佔用僅 1.15 GB