Microsoft 開源公佈新 AI 模型　針對視覺分析應用而設

2024-06-20

Published by

藍骨

Microsoft 的 Azure AI 團隊最近在 Hugging Face 上發表了新的基礎 AI 模型 Florence-2，支援各種視覺分析應用，可以配合大量使用場景，使企業無需針對單一應用開發各自的模型。

Florence-2 有兩個版本（232M 和 771M 參數），可以處理製作字幕、物件偵測、視覺分析和分割等應用，Microsoft 表示，其性能與許多較大規模的視覺模型相當或更好。這個模型的特別之處在於可以同時支援各種視覺相關的功能，類似於大型語言模型，企業可以用它來一站式解決各種需要。

為了發展 Florence-2，Microsoft 建立了一個名為 FLD-5B 的視覺資料集，其中包含 1.26 億張圖像的 54 億個註釋，並使用序列到序列架構訓練 Florence-2。這個設計整合了圖像編碼器和多模態編碼解碼器，使模型能夠管理各種視覺應用，而無需針對特定應用進行修改。

Florence-2 的表現也相當理想，在 COCO 資料集上的零鏡頭字幕測試中，優於 Deepmind 的 80B 參數 Flamingo 模型和 Microsoft 的 Kosmos-2。 Florence-2 的預訓練和微調版本現已在 Hugging Face 上提供，而且採用寬鬆 MIT 授權，也就是可以不受限制地用於一般或商用用途。

來源：VentureBeat

Published by

藍骨

2 年前 ago

房屋署試行智能門禁系統可用智方便掃碼, 八達通拍卡訪客免卻登記身份證手續

8 分鐘前 ago

電子支付

遊戲情報

Faker 登上韓國政府紀念郵票電競史上首位獲此殊榮選手

3 小時前 ago

評測

【評測】Huawei WATCH GT Runner 2 評測佩戴感舒適 + 馬拉松跑手必備

4 小時前 ago

Claude Code 更新後變蠢？AMD 總監批 AI 偷懶費用急增逾百倍

5 小時前 ago

科技新聞

Yoke 軚盤 10 年爭議落幕？ Mercedes-Benz 線控轉向獲外媒好評

6 小時前 ago

人工智能

OpenAI 提出 AI 時代「新政」藍圖　倡議機械人稅+四天工作週+全民財富基金

17 小時前 ago

Microsoft 開源公佈新 AI 模型　針對視覺分析應用而設

Recent Posts

房屋署試行智能門禁系統可用智方便掃碼, 八達通拍卡訪客免卻登記身份證手續

掃的士車身 QR 碼付款後的士竟說該 QR 不對要求乘客多付一次車費

傳 iPhone Fold 已試產但同時遇到重要問題 9 月發布但或要下年才出貨

的士強制電子支付不足一週有司機疑誤導乘客拍卡兩次收多 $63 蚊

Faker 登上韓國政府紀念郵票電競史上首位獲此殊榮選手

【評測】Huawei WATCH GT Runner 2 評測佩戴感舒適 + 馬拉松跑手必備

Claude Code 更新後變蠢？AMD 總監批 AI 偷懶費用急增逾百倍

Yoke 軚盤 10 年爭議落幕？ Mercedes-Benz 線控轉向獲外媒好評

OpenAI 提出 AI 時代「新政」藍圖　倡議機械人稅+四天工作週+全民財富基金

Microsoft 開源公佈新 AI 模型 針對視覺分析應用而設

Recent Posts

Microsoft 開源公佈新 AI 模型　針對視覺分析應用而設