Anthropic 於 2 月 17 日正式推出 Claude Sonnet 4.6,並將其設定為 Free 及 Pro 方案用戶在 claude.ai 與 Claude Cowork 應用程式中的預設模型。新版本在編程、電腦操控、長文本推理及知識型工作等範疇均有顯著提升,API 定價則與上代 Sonnet 4.5 維持一致。
性能突破 媲美 Opus
Sonnet 4.6 以 Sonnet 級別定價提供 Opus 級智能,是新版本最受矚目的賣點。過去需要 Opus 系列才能完成的辦公室任務,如分析複雜試算表或填寫多步驟網頁表單,Sonnet 4.6 已達人類操作水平。第三方評測機構 Vals AI 測試顯示 Sonnet 4.6 在 Vals Index 及 Vals Multimodal Index 兩大指標均排名第一。它在財務代理評測得分 63.3%,稅務評測 v2 得分 77.1%,均超越同期推出的 Opus 4.6。它亦在 AIME 數學評測取得 92.3% 高分。

編程能力大幅提升
Sonnet 4.6 於 SWE-bench 評測取得 76.2% 得分,在程式碼除錯範疇較 Sonnet 4.5 提升超過 10 個百分點。Anthropic 表示早期獲試用資格的開發者大多傾向選用 Sonnet 4.6,而非前代甚至 2025 年 11 月推出的 Claude Opus 4.5,反映市場認可度相當高。新版本亦帶來 1,000,000 token 上下文視窗,有助處理大型企業檔案及複雜長文本分析任務。
電腦操控達業界新高
Sonnet 4.6 在 Computer Use 功能方面,於複雜保險業電腦操控評測取得 94% 高分,是所有 Claude 系列模型中歷來最高成績。新版本能主動分析操作失誤並自行修正,大幅提升自主工作流程的可靠性。Anthropic 形容其性格溫暖誠實和親社會並偶爾帶幽默感,同時具備強勁安全行為,未有出現高風險錯位跡象。
定價維持不變
Sonnet 4.6 的 API 定價與 Sonnet 4.5 相同。每 1,000,000 input tokens 收費 3 美元(約 HK$23.4),outputtokens則為每 1,000,000 收費 15 美元(約 HK$117)。Free 方案用戶可直接使用新版預設模型。Pro 方案月費維持 20 美元(約 HK$156)。Opus 4.6 仍是代理編程、自主程式操控及多學科推理的首選,適合定位更高階的專業用戶。Anthropic 近日完成 300 億美元融資,公司估值達 3,800 億美元,較去年 9 月估值增倍。
來源:Anthropic
分享到 :
最新影片