權威評測平台 SuperCLUE-VLM 公布 2025 年 12 月多模態視覺語言基準評測總榜。Google Gemini 3 Pro 以 83.64 分大幅領先並奪冠,展現壓倒性優勢。中國陣營表現亦出色,商湯科技 SenseNova V6.5 Pro 以 75.35 分位居第二,字節跳動豆包視覺版則以 73.15 分緊隨其後,成為首款進入全球三甲的中國多模態大模型。
三大維度全面評測視覺能力
SuperCLUE-VLM 從基礎認知、視覺推理及視覺應用 3 個核心維度,評估大模型真實視覺理解能力。基礎認知測試模型識別物件、文本及場景等基本元素能力;視覺推理考核模型理解圖像中的邏輯、因果關係及隱含資訊表現;視覺應用則評估模型完成圖文生成、跨模態問答及工具調用等實際任務表現。
Gemini 3 Pro 各項指標全面領先
榜首 Gemini 3 Pro 在 3 個細項指標中均表現突出。其基礎認知得分 89.01、視覺推理 82.82、視覺應用 79.09,全面領先其他模型。Google 於 12 月初發布 Gemini 3 Pro 時,強調這是該公司最強大的多模態模型,在檔案理解、空間推理、螢幕識別及影片理解等領域均創下領先表現。該模型在複雜視覺推理基準測試 MMMU Pro 及 Video MMMU 上創下新紀錄,並支援高達 256K token 語境視窗,能處理長達 2 小時影片內容。
中國模型競爭力提升
商湯科技 SenseNova V6.5 Pro 以 75.35 分穩居第二位,顯示中國企業在多模態領域技術實力。字節跳動豆包視覺版在基礎認知環節得分 82.70,甚至超越部分國際競爭對手,僅在視覺推理環節稍顯弱項。字節跳動於今年 9 月發布豆包大模型 1.6-vision,這是豆包家族首款具備工具調用能力的視覺深度思考模型,擁有更強通用多模態理解和推理能力。
百度 ERNIE-5.0-Preview 及阿里巴巴 Qwen3-VL 等中國模型同樣進入前 5 名。Qwen3-VL 是排名榜中首款開源且總分超過 70 分的模型,展現開源社群在多模態領域進步。
國際頂尖模型排名較後
國際頂尖模型在此次評測中表現出乎意料。Anthropic Claude Opus 4.5 得分 71.44,OpenAI GPT-5.2(high) 僅獲 69.16 分,排名相對較後。這反映全球多模態大模型競爭格局正在重塑,技術領先優勢不再絕對集中於少數企業。
| 排名 | 模型名稱 | 機構 | 總分 | 基礎認知 | 視覺推理 | 視覺應用 | 開 / 閉源 |
|---|---|---|---|---|---|---|---|
| – | Gemini-3-pro | 83.64 | 89.01 | 82.82 | 79.09 | 閉源 | |
| 🥇 | SenseNova V6.5 Pro-20251215 | 商湯科技 | 75.35 | 81.66 | 74.31 | 70.08 | 閉源 |
| 🥈 | Doubao-seed-1-6-vision-250815 | 字節跳動 | 73.15 | 82.70 | 64.27 | 72.48 | 閉源 |
| 🥉 | ERNIE-5.0-Preview | 百度 | 72.21 | 82.05 | 70.86 | 63.71 | 閉源 |
| 🏅 | Qwen3-vl-235b-a22b-thinking | 阿里巴巴 | 71.95 | 79.66 | 71.26 | 64.92 | 開源 |
| – | Claude-opus-4-5-20251101 | Anthropic | 71.44 | 82.07 | 65.81 | 66.43 | 閉源 |
| – | GPT-5.2(high) | OpenAI | 69.16 | 75.18 | 67.35 | 64.96 | 閉源 |
| 4 | Doubao-seed-1-6-251015 | 字節跳動 | 68.02 | 77.86 | 62.01 | 64.19 | 閉源 |
| 4 | GLM-4.6v | 智譜 AI | 67.68 | 81.74 | 60.83 | 60.48 | 開源 |
| 5 | step-3 | 階躍星辰 | 62.94 | 77.16 | 49.81 | 61.87 | 開源 |
| 6 | Qwen3-vl-8b-instruct | 阿里巴巴 | 61.64 | 74.66 | 52.77 | 57.50 | 開源 |
| 7 | MiniCPM-V4.5 | 面壁智能 | 49.38 | 68.76 | 24.83 | 54.56 | 開源 |
| 8 | InternVL3.5-8B | 上海 AI Lab | 47.89 | 64.21 | 24.49 | 54.98 | 開源 |
| – | Grok-4.1-fast-non-reasoning | X.AI | 45.57 | 63.96 | 23.62 | 49.13 | 閉源 |
數據來源: SuperCLUE ,2025 年 12 月 29 日。
注:考慮到波動影響,本排行榜將相差 1 分以內的模型視為並列名次。
資料來源:快科技






















▲規格特色
▲GTBOX T1 內部加入環繞聲喇叭單元,提供不俗娛樂音效體驗。
▲頂部設有三色呼吸燈
▲內部結構透視圖
▲機背有齊全連接埠
▲內置AMD Ryzen 7 8745HS 八核心處理器效能出色
▲顯示核心為 Radeon 780M,可滿足輕度娛樂需求
▲設有全功能 USB 4.0 Type-C 埠,可作為顯示輸出或電源供應,以及外接USB4的顯示卡擴充座等。
▲設DP、HDMI及USB4支援最多三屏顯示輸出
▲變速智能散熱設計保持寧靜運行