Claude 升級 3.5 效能更高成本更低　評論指表現力壓 ChatGPT

2024-07-19

Published by

藍骨

AI 發展一日千里，在科創公司互相競爭下儼如進入了「AI 戰國時代」。不久前 AI 創新公司 Anthropic 才推出創作、數理邏輯、圖像處理等能力均有卓越表現的 Claude 3，不足半年，Anthropic 旋即推出了新一代 Claude 3.5 Sonnet，該模型除進一步提升速度與效能，更大減八成使用成本，有外國評論試用後更直言 Claude 3.5 Sonnet 已「擊敗」ChatGPT，成為最出色的 AI 模型。

由 OpenAI 前員工成立的 Anthropic 公司，早於本年 3 月推出 AI 模型 Claude 3，當時 Claude 3 分為三個子模型，分別為 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus，其中又以 Opus 能力最高、Sonnet 僅隨其後。怎料，未夠半年，Anthropic 即宣佈推出 Claude 3.5 Sonnet，其效能更比前一代最高效能的 Claude 3 Opus 更高，甚至比主要競爭對手 GPT-4 有著更出色的表現。

例如，在程式編寫能力（HumanEval）測試、研究生級專家推理（GPQA）、多語言小學數學問題（MGSM）、文本推理（reasoning over text）方面， Claude 3.5 Sonnet 的表現均較前一代 Claude 3 Opus 及主要競爭對手 GPT-4 更好。在圖像處理方面，Claude 3.5 Sonnet 亦是 Anthropic 至今最強大的 AI 模型，在大多數視覺基準測試之中，表現平均較 Claude 3 Opus 高出 10%，亦幾乎在各個與圖像相關的測試之中優於其他「生成式 AI」模型。此外，Claude 3.5 Sonnet 能支援更長文本，輸出能達每秒 80 Token，輸出速度較其他競爭對手如 GPT-4、Gemini 1.5 Pro 更高。最難得的是，在如此高效的表現下，Claude 3.5 Sonnet 的成本只需以往 Claude 3 的五分之一，成本大減 80%，變相等於低成本、高效益，自然就吸引了不少用家的青睞。

PDF一鍵變網頁數據輕鬆圖像化

有外國專評 AI 及發掘各類「生成式 AI」使用方法的 Youtube 頻道「AI Advantage」，早前就直言 Claude 3.5 Sonnet 已毫無疑問的「擊敗」了 GPT-4。他更於片中列舉了多個 Claude 3.5 能輕鬆完成（而 GPT 4.0 暫未能做到）的用法，例如，片主透過提詞賦予 Claude 3.5 作為「資料視覺化專家」（Data visualization expert）的身份，一鍵輸入，即讓 AI 整理數據並設計出一個可以呈現各個國家病毒傳播速度的實時儀表板（dashboard），他亦強調用家可隨意以提詞調整及設計樣式，輕鬆呈現 Claude 3.5 在大數據時代下「資料視覺化」（Data visualization）的強大整理、分析及製圖能力。

另外，該片主亦分享了現在已可透過 Claude 3.5，直接把 PDF 檔製成網站。例如，片中他向 Claude 3.5 輸入一個與製作動畫、使用綠幕相關的 PDF 檔，並要求 Claude 3.5 據 PDF 檔創作出一個以敘事驅動為主軸的網站。不消一刻，Claude 3.5 隨即成功將 PDF 檔內有關 Midjourney 及綠幕的內容轉換成一個網站，內容則是以文字重新演繹及逐步介紹製作動畫的流程。片主指 Claude 3.5 的強大在於它並不是簡單生成一個網站，而是在於它已能將各類型的 PDF 檔轉換成如文字、圖像、動畫、網頁等不同媒介，盡顯 Claude 3.5 的高速運算能力。

片段中亦有提及其他 Claude 3.5 的使用方法，例如使用模型來製作遊戲、設計旅行規劃程式、製作互動測試網站等等，其餘新用法會留在下篇與大家分享，但要記住一點：過往這些在其他 AI 模型之中需分階段處理的工作，Claude 3.5 現已能一步到位。而在 Claude 3.5 面世後，其低廉的使用成本亦降低了用家的入門門檻，相信往後亦會有更多用家投入 Claude 模型的懷抱。有需要的企業或個人用家亦可訂閱 AWS Amazon Bedrock 服務，同樣能享受雲端 AI 的方便快捷，讓 AI 更快捷地完成繁重工作。

資料來源：YouTube

Published by

藍骨

2 年前 ago

手提電話

3DMark 不再忍中國手機跑分作弊除名努比亞 RedMagic 手機手機廠: 只是全力發揮效能

2 小時前 ago

科技新聞

八達通 Call 車易 4 月下旬登場！整合 5 大車隊司機免手續費轉賬上限增至 4 萬元

2 小時前 ago

生活科技

Dyson HushJet Mini Cool 首款手提風扇登場無葉設計風速驚人海外售價要HK$770

2 小時前 ago

電子支付

終於可以一App叫齊5隊的士八達通推「Call車易」 App內直接Call車及付款

3 小時前 ago

Robomaster 2026 高校聯盟賽（江蘇站）落幕：三項冠軍誕生，場上對抗場下工程同樣精彩

3 小時前 ago

汽車科技

傳 Tesla 研發全新小型純電 SUV 定價低於 Model 3 上海廠率先生產

4 小時前 ago

Claude 升級 3.5 效能更高成本更低　評論指表現力壓 ChatGPT

PDF一鍵變網頁數據輕鬆圖像化

Recent Posts

macOS 驚爆「計時炸彈」漏洞運作近 49.7 天網絡即癱瘓必須重啟 Mac 機復原

港大 DeepTutor 開源登場將 PDF 教材轉化為互動個人化教學變身 AI 個人補習老師

iPhone 暢順行 82 億參數模型 1 bit LLM Bonsai 8B 登場記憶體佔用僅 1.15 GB

3DMark 不再忍中國手機跑分作弊除名努比亞 RedMagic 手機手機廠: 只是全力發揮效能

八達通 Call 車易 4 月下旬登場！整合 5 大車隊司機免手續費轉賬上限增至 4 萬元

Dyson HushJet Mini Cool 首款手提風扇登場無葉設計風速驚人海外售價要HK$770

終於可以一App叫齊5隊的士八達通推「Call車易」 App內直接Call車及付款

Robomaster 2026 高校聯盟賽（江蘇站）落幕：三項冠軍誕生，場上對抗場下工程同樣精彩

傳 Tesla 研發全新小型純電 SUV 定價低於 Model 3 上海廠率先生產

Claude 升級 3.5 效能更高成本更低 評論指表現力壓 ChatGPT

PDF一鍵變網頁 數據輕鬆圖像化

Recent Posts

Claude 升級 3.5 效能更高成本更低　評論指表現力壓 ChatGPT

PDF一鍵變網頁數據輕鬆圖像化