Amazon Web Service(AWS)早前與 AI 企業 Anthropic 合作,在旗下全託管 AI 平台 Amazon Bedrock 支援最新推出的 Claude 3 Sonnet 模型,為使用者帶來更靈活、更快的生成式 AI 效能。
Claude3 三個模型各有不同
Claude3 系列設有三個模型,分別名為「Haiku」、「Sonnet」及「Opus」,三者之間在效能、適用場景及使用成本方面有一定的差異,能夠適用於不同場景的需求。其中位列中等級別的 Sonnet 在效能、智能性、推理速度及成本達致平衡,適合大部分日常及商業應用場景。
配備 200k 超長上下文視窗,以及全面而強大的檢索及生成功能(RAG),Claude 3 系列能夠有效處理長文件及進行分析與生成,有利於需要利用生成式 AI 進行創意寫作或市場營銷的企業。
有測試分別要求 Claude 3 三個模型以同樣的故事前提設計角色,並為他們賦予名字及細節,並以指定風格寫出 14 個場景,以測試三者之間在創意方面的表現。測試結果發現,無論是 Haiku、Sonnet 或 Opus,都能夠生成高品質的場景大綱,在寫作質量上未見太大差異。然而,當涉及更細緻的創作要求,例如為角色命名,Sonnet 及 Opus 就能生成更具一致性的答案,並建立更多細節,對於需要豐富層次的創作更為有利。此外,相較於 Opus 注重故事的複雜程度,Sonnet 在創造具情感變化及現代感的對話上則更具優勢。這亦體現於創作具感染力廣告標語的效果,在另一項測試中,Sonnet 的生成結果比 Haiku 及 Opus 更能理解市場營銷策略背後的複雜性,創作更吸引及具效果的標語。
編程及多媒體處理能力優異
另一方面,編程能力同樣是衡量 AI 模型效能的關鍵指標之一。透過專為生成式 AI 編程能力而設的基準測試 HumanEval,不論 Haiku(75.9%)、Sonnet(73%)或 Opus(84.9%)的效能都比 GPT-4(67%)為高。
有測試使用 Claude 3 的三個模型進行編寫 Python 貪食蛇遊戲,結果發現儘管 Opus 能夠在基本遊戲以外,生成額外遊戲機制及互動元素等複雜編碼,Sonnet 卻能夠以平均每秒 56.68 個 Token 的高速度完成基本編程任務,比起平均每秒 21.875 個 Token 的 Opus 高出兩倍,而且生成的程式碼易於複製和直接使用,在成本更低的前提下,同樣能夠為用戶提供流暢及可靠的編程體驗,在速度及輸出品質上達致更佳平衡。
除創作及編程能力外,Claude 3 亦進一步加強影像理解效能。三個模型在 ANLS(文件影像對答)、AI2D(科學圖表)及 Relaxed Accuracy(圖表對答)等基準測試上,都錄得比 GPT-4 及 Gemini 1.0 Pro 更出色的表現,其中 Sonnet 在科學圖表測試上的結果更在眾多模型中首屈一指,足以應對使用者大量處理圖表、分析報告等視覺數據的需求。
有專家曾對 Amazon Bedrock 上的 Sonnet 進行視覺測試,其中透過展示兩張近乎相同的圖片,讓模型描述當中的差異,結果 Sonnet 能夠準確描述相異之處的位置、形狀和大小,效果令人滿意。專家亦進行工藝流程圖(P&ID)與 AWS 參考架構圖測試,結果在了解過相關文件的上下文資訊後,Sonnet 同樣能夠作出快速而準確的解讀。
配合需求選用合適模型
在坊間眾多生成式 AI 的測試與比較中,Claude 3 三個模型的表現同樣可圈可點,當中尤以功能最強大的 Opus 更適用於處理複雜的流程,然而其每百萬 Tokens 的輸入和輸出成本分別為 15 美元和 75 美元,對於資金有限的使用者無疑較大負擔。相比之下,擁有比 Haiku 更佳效能、與 GPT-4 智能水平相若的 Sonnet,每百萬 Tokens 輸入和輸出成本僅為 3 美元和 15 美元,在效能及成本之間取得平衡,適合大規模 AI 部署。
受惠於 AWS 雲端技術的完善的運算能力,Claude 3 Sonnet 在 Amazon Bedrock 上的應用將具備更快、更流暢的效能,同時透過 VPC 網路隔離、數據加密等嚴格的安全機制,將有助企業保護數據及機密資料,消除隱私外洩疑慮,讓企業更無後顧之憂地部署及應用生成式 AI,帶來無窮無盡的可能性。
相關文章:
AWS 推出基於機器學習的 EC2 容量區塊 多種預訂方式便利企業 AI 開發 Amazon EC2 釋放 UltraClusters 與 P5e 實例潛能 企業實現 AI 轉型更輕鬆 AWS 與 NVIDIA 兩強聯手 共同邁向 AI 研發競賽之路