中國人工智能(AI)市場競爭日趨激烈,Alibaba 阿里雲於大年初一於微信公眾號發表全新旗艦級大型語言模型「通義千問」旗艦版模型 Qwen2.5-Max,並聲稱其在多項指令模型性能測試中,全面壓倒當前全球最強的開源 Mixture-of-Experts(MoE)模型 DeepSeek V3,以及最大型的開源稠密模型 Llama-3.1-405B。
其團隊指出,這款新一代 AI 模型的預訓練數據超過 20 兆 tokens,並於多個全球權威測試基準中錄得優異成績。在測試 大學程度知識的 MMLU-Pro、程式設計能力的 LiveCodeBench、綜合能力評估的 LiveBench,以及 模擬人類偏好的 Arena-Hard 等評測中,該模型的表現與 OpenAI GPT-4、Anthropic Claude-3.5-Sonnet 及 DeepSeek V3 旗鼓相當,甚至更勝一籌。為進一步驗證 Qwen2.5-Max 的能力,阿里雲將其與 DeepSeek V3、Llama-3.1-405B,以及阿里自家開源的 Qwen2.5-72B 進行對比測試。在 11 項關鍵基準測試 中,Qwen2.5-Max 於所有項目均超越對手,足見其在 AI 領域的技術實力。
據外媒報導指出,阿里雲選擇在農曆新年大多數人在休假期間發表 Qwen2.5-Max,突顯出中國人工智慧(AI)新創公司 DeepSeek 在過去數週急速崛起,不僅對海外競爭對手造成壓力,也使其國內對手壓力大增。
來源: wsj
相關文章:
YouTube 免費 AI 中文總結 + AI 繁中字幕教學 「DeepSRT」香港用免 VPN、外語片輕鬆中文睇 DeepSeek 初心教學 + 懶人包 AI 人工智能幫你解決生活難題 【教學】fullmoon AI 模型整個裝到 iPhone 免費即用、毋須連網 VPN、模型參數 3b
分享到 :
最新影片
