Meta 宣布推出全新一代大型自然語言處理模型 Llama 4,並將推出兩款主要版本:Llama 4 Scout 和 Llama 4 Maverick,並預告即將推出更大規模的 Llama 4 Behemoth 及提高推論效能的 Llama 4 Reasoning。
Llama 4 Scout 與 Llama 4 Maverick 兩個版本
Llama 4 Scout 配備了 170 億個參數 (109B 總參數, 17B 活躍參數),對應 16 種專業領域推論,主要針對文件內容摘要、使用者行為分析及個性化互動等場景進行優化。相比之下,Llama 4 Maverick 同樣擁有 170 億個參數 (400B 總參數, 17B 活躍參數),且對應 128 種專業領域推論,進一步強化了多語言理解、推論及長文內容分析的能力,適用於數位助理服務及聊天機器人等應用。兩者都提供高效的推論速度,支持單 GPU 部署,並能在不同網絡架構下靈活運行。
Llama 4 Maverick 在編碼、推論及圖像基準測試的表現上,甚至能與 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0 競爭,並且在推論及編碼處理方面,表現接近 DeepSeek v3.1。
Llama 4 新模型採用了混合專家架構(Mixture of Experts, MoE)及早期融合技術,使 Llama 4 具備處理多模態的能力,不只能理解文字,還能處理圖像,為用戶帶來更全面的 AI 服務。MoE 架構通過智能選擇啟用少量參數來進行推論,從而實現更快的反應速度和更低的運算成本。例如 Llama 4 Scout 在處理請求時,可能只會啟用 17 億參數中的一部分,而不會啟動整個 170 億參數的模型,這樣可以大大提升計算效率。MoE 模型能夠有效地分配不同專家來處理不同類型的問題,無論是編程、創意寫作還是其他複雜任務,這使得 Llama 4 在應對各種挑戰時表現出色。
Llama 4 目前已經在 Cloudflare Workers AI 平台推出,用戶亦可透過 LLama 官網、Hugging Face託管網站使用。開發者可以立即使用 Llama 4 Scout 進行各種應用開發。這樣的平台支持使開發者無需擔心基礎設施、硬體或記憶體問題,直接通過 API 調用即可實現 Llama 4 的強大功能。
Llama 4 Behemoth 預告,推論效能進一步提升
Meta 同時宣布,未來將推出參數規模更為龐大的 Llama 4 Behemoth,這款模型將擁有高達 2880 億個參數,將與其他大型 AI 模型競爭,推動更多高效能應用的實現。Meta 還將在 5 月推出 Llama 4 Reasoning,這將進一步提升推論效能,具體細節預計會在首屆 LlamaCon 開發者活動中公布。
資料來源:Cloudflare
分享到 :
最新影片
