AI 發展一日千里,在科創公司互相競爭下儼如進入了「AI 戰國時代」。不久前 AI 創新公司 Anthropic 才推出創作、數理邏輯、圖像處理等能力均有卓越表現的 Claude 3,不足半年,Anthropic 旋即推出了新一代 Claude 3.5 Sonnet,該模型除進一步提升速度與效能,更大減八成使用成本,有外國評論試用後更直言 Claude 3.5 Sonnet 已「擊敗」ChatGPT,成為最出色的 AI 模型。
由 OpenAI 前員工成立的 Anthropic 公司,早於本年 3 月推出 AI 模型 Claude 3,當時 Claude 3 分為三個子模型,分別為 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,其中又以 Opus 能力最高、Sonnet 僅隨其後。怎料,未夠半年,Anthropic 即宣佈推出 Claude 3.5 Sonnet,其效能更比前一代最高效能的 Claude 3 Opus 更高,甚至比主要競爭對手 GPT-4 有著更出色的表現。
例如,在程式編寫能力(HumanEval)測試、研究生級專家推理(GPQA)、多語言小學數學問題(MGSM)、文本推理(reasoning over text)方面, Claude 3.5 Sonnet 的表現均較前一代 Claude 3 Opus 及主要競爭對手 GPT-4 更好。在圖像處理方面,Claude 3.5 Sonnet 亦是 Anthropic 至今最強大的 AI 模型,在大多數視覺基準測試之中,表現平均較 Claude 3 Opus 高出 10%,亦幾乎在各個與圖像相關的測試之中優於其他「生成式 AI」模型。此外,Claude 3.5 Sonnet 能支援更長文本,輸出能達每秒 80 Token,輸出速度較其他競爭對手如 GPT-4、Gemini 1.5 Pro 更高。最難得的是,在如此高效的表現下,Claude 3.5 Sonnet 的成本只需以往 Claude 3 的五分之一,成本大減 80%,變相等於低成本、高效益,自然就吸引了不少用家的青睞。
有外國專評 AI 及發掘各類「生成式 AI」使用方法的 Youtube 頻道「AI Advantage」,早前就直言 Claude 3.5 Sonnet 已毫無疑問的「擊敗」了 GPT-4。他更於片中列舉了多個 Claude 3.5 能輕鬆完成(而 GPT 4.0 暫未能做到)的用法,例如,片主透過提詞賦予 Claude 3.5 作為「資料視覺化專家」(Data visualization expert)的身份,一鍵輸入,即讓 AI 整理數據並設計出一個可以呈現各個國家病毒傳播速度的實時儀表板(dashboard),他亦強調用家可隨意以提詞調整及設計樣式,輕鬆呈現 Claude 3.5 在大數據時代下「資料視覺化」(Data visualization)的強大整理、分析及製圖能力。
另外,該片主亦分享了現在已可透過 Claude 3.5,直接把 PDF 檔製成網站。例如,片中他向 Claude 3.5 輸入一個與製作動畫、使用綠幕相關的 PDF 檔,並要求 Claude 3.5 據 PDF 檔創作出一個以敘事驅動為主軸的網站。不消一刻,Claude 3.5 隨即成功將 PDF 檔內有關 Midjourney 及綠幕的內容轉換成一個網站,內容則是以文字重新演繹及逐步介紹製作動畫的流程。片主指 Claude 3.5 的強大在於它並不是簡單生成一個網站,而是在於它已能將各類型的 PDF 檔轉換成如文字、圖像、動畫、網頁等不同媒介,盡顯 Claude 3.5 的高速運算能力。
片段中亦有提及其他 Claude 3.5 的使用方法,例如使用模型來製作遊戲、設計旅行規劃程式、製作互動測試網站等等,其餘新用法會留在下篇與大家分享,但要記住一點:過往這些在其他 AI 模型之中需分階段處理的工作,Claude 3.5 現已能一步到位。而在 Claude 3.5 面世後,其低廉的使用成本亦降低了用家的入門門檻,相信往後亦會有更多用家投入 Claude 模型的懷抱。有需要的企業或個人用家亦可訂閱 AWS Amazon Bedrock 服務,同樣能享受雲端 AI 的方便快捷,讓 AI 更快捷地完成繁重工作。
資料來源:YouTube
AIRSIDE 與 Neuron 的「可持續發展」智能方案 以 AI 建設更符合現代需求的物業管理模式 Claude 3.5 Sonnet 升級版登陸 AWS 以更強能力解拆複雜邏輯問題 東南亞時裝電商 Pomelo Fashion 用 AI 提供個人化體驗 採 Amazon Personalize 增 8% 總營收