人工智能初創 Anthropic 發表 Claude 3 聲稱表現較 Google Gemini 和 ChatGPT 優勝

2024-03-06

Published by

唐美鳳

人工智能初創 Anthropic 日前發表 Claude 3 系列，提供 3 個大型語言模型，聲稱在多項基準測試中超越 Google Gemini 和 OpenAI 的 ChatGPT。Claude 3 提供 Haiku、Sonnet 和 Opus 三個版本，Anthropic 強調 Claude 3 在多方面都有出色表現，包括多模態能處理不同數據類型、準確性提升、上文下理的理解能力和反應時間。

早期 Claude 版本的其中一個限制，有時會迴避被認為有風險的指令，在新版本則獲得解決，新模型更願意解決具有挑戰性的問題。Claude 3 的三款模型中以 Opus 最為強大，非常適合處理大型操作。Anthropic 聲稱它在複雜任務中表現「理解以接近人類水平」，並通過「大海撈針」評估進一步展示其能力。在該評估中它以接近完美的準確性回憶信息。Opus 還擅長處理數學問題，能夠生成電腦代碼，其推理能力表現更比 GPT-4 優勝。

Claude 3 亦有其缺點，雖然 Anthropic 強調提高了準確性，但模型生成的事實錯誤信息，即「幻覺」的問題仍然存在，不過發生率比之前的版本顯著降低。此外，Opus 在回應查詢時會遇到一些延遲，表現出與早期 Claude 2 模型相若的速度。至於另外兩個版本則各有優勢，Haiku 在快速響應和從非結構化數據中提取信息方面表現出色，但面對複雜的數學問題時可能會遇到困難。Sonnet 是一個更大規模的模型，能夠協助用戶完成日常任務，甚至可以解析圖像中的文字。

目前，Sonnet 和 Opus 已經可供購買，而 Claude 的免費版本仍可在 Anthropic 的網站上使用。Haiku 的發佈日期尚未公布，但 Anthropic 表示很快就會發表。Claude 3 的主要目標受眾似乎是希望將工作流程自動化的企業，一般用戶可能會在網上聊天機械人中遇到這些模型。

資料及圖片來源：gizmochina