Categories: 人工智能評測

【評測】Mac Studio 2025 M3 Ultra 版本 實測本地 LLM 大型語言模型 + AI 繪圖效能

Published by
Lawton

Apple 剛剛推出最新 Mac Studio 2025 版本,用上 M4 Max 處理器以及最新發表的 M3 Ultra 處理器。今次 Mac Studio 沿用上代的機殼以及散熱系統,並將硬件升級。除了 M4 Max, M3 Ultra 處理器本身增多了 CPU、GPU 的核心數量之外,其實 Apple 將可搭載的統一記憶體 RAM 容量加大到最多 512GB、記憶體頻寬升到 819GB/s,而且將最多可配置 SSD 儲存空間加大到 16TB。連接方面,M4 Max 版用上 4 個 Thunderbolt 5 插口、M3 Ultra 版搭載 6 個 Thunderbolt 5 插口。

 

 

 

 

相關評測影片:

 

Mac Studio 除了適合有錢買快電腦的進階用家之外,其實真正面向的消費者是需要大量記憶體去處理複雜架構的影片、3D 模型等影像製作範疇,而現在 AI 盛行,這類工作站級電腦更適用於在本地運行 AI 大模型,我們就嘗試運行 70b 大模型都迎刃有餘,Mac Studio 的統一記憶體特性,更讓 AI 應用能盡情發揮速度。

 

 

對於進階用家來說,M4 Max 型號會是非常不錯的選擇,基本款配備 14 核心 CPU、32 核心 GPU、16 核心神經網絡引擎以及 36GB 統一記憶體;而面向專業人士的 M3 Ultra 基本款則擁有 28 核心 CPU、60 核心 GPU、32 核心神經網絡引擎以及 96GB 統一記憶體。

 

對於好多個人影片工作室而言,選擇基本款的 M3 Ultra,亦足以應付一般影音剪輯、廣告設計及 3D 渲染等需求,比起 MacBook Pro 擁有非常顯著優勢的散熱能力。

 

 

機身外觀與介面:維持方正設計 + Thunderbolt 5 升級

Mac Studio 2025 與前一代大致相同,維持小巧方正的外型,機身頂部鋁製外殼手感扎實,底部與背面仍有大面積散熱孔。機面提供 2 個 USB-C 或 Thunderbolt 5 連接埠(視你選擇的晶片型號而定),以及一個 SDXC 讀卡機。機背則設有:

4 個 Thunderbolt 5 連接埠

2 個 USB-A

1 個 HDMI

1 個 10Gb Ethernet

1 個 3.5mm 耳筒插孔

Thunderbolt 5 是今次更新主要特點之一,可支援理論上最高 120Gb/s 傳輸速度,方便外接高速硬碟陣列或 8K 以上高解析度顯示器。同時也支援多台顯示器並行輸出,M3 Ultra 配置下最多可驅動 8 部 6K 熒幕,對於專業級工作者或工作室來說,應付龐大的螢幕需求更加游刃有餘。

 

 

專業應用實測 AI 模型推理

M3 Ultra 内建 32 核心神經網絡引擎,搭配 256GB 統一記憶體,能在本機進行部分中大型 AI 模型推理。如執行 Stable Diffusion 生成影像、運行 AI 大模型,甚至用 Whisper 將聲音檔案轉換成文字,都可大大加速。

 

 

實試 1:本地運行 DeepSeek-R1 70b 人工智能引擎

今次我們就安裝了 DeepSeek-R1 70b 模型進行推理測試,包括進行推理運算、文章寫作等運用較多資源的任務。結果對比起上代 M2 Max 型號,有非常顯著的效能增長。

誠實者與騙子邏輯題

測試首先要求 DeepSeek R1 70B Q4 在兩部電腦上同時解答一題複雜邏輯推理題(需包含推理步驟,並限制在 2800-3000 字)。結果顯示:

 

  • M2 Max 完成整個生成約需 7 分 24 秒,初次輸出耗時 0.65 秒,Token 生成速度為 6.41 token/s,總共生成 2819 個 Token。
  • M3 Ultra 僅需 3 分 59 秒即可完成,初次輸出耗時 1.53 秒,Token 生成速度為 11.62 token/s,總共生成 2752 個 Token。

 

 

綜合而論,M3 Ultra 完成總時間比 M2 Max 快近一倍,Token 生成速度亦較前代高出約 1.8 倍。

 

 

關於誠實者與騙子邏輯題:

在一個村莊裡,所有居民要麼只說真話(誠實者),要麼只說謊話(騙子)。一天,你遇到三個人——A、B 和 C。他們分別說了以下的話: A 說:「B 是誠實者。」 B 說:「C 是騙子。」 C 說:「A 是騙子。」 已知至少有一人是誠實者,請判斷誰是誠實者,誰是騙子。

 

三神問題

接著以著名邏輯難題「三神問題」作為測試,依然要求模型提供推理過程,字數限制相同。結果如下:

 

  • M2 Max:完成耗時 12 分 14 秒,初次輸出 3.10 秒,Token 生成速度 6.32 token/s,最終生成 4604 個 Token。
  • M3 Ultra:完成耗時 6 分 48 秒,初次輸出 1.30 秒,Token 生成速度 11.33 token/s,最終生成 4592 個 Token。

 

M3 Ultra 的整體效能依然快上一代約一倍,而且未出現明顯的降頻現象。測試期間,兩部電腦的 GPU 利用率均到達 100%,但 CPU 部分尚有餘裕;其中,M3 Ultra 的 E-CPU 利用率通常維持在 50% 以下,顯示 Mac Studio 本身在電源及散熱方面仍有充分空間。此外,將 M3 Ultra 的上下文長度(context length)限制提高至 130,000 亦可穩定運作,最終花費約 4 分 47 秒完成,Token 生成速度與預設 4096 context length 基本相當,可見 256GB

統一記憶體 的優勢非常明顯。

 

 

關於三神問題:
有代號 A, B, C 的三位神祇,只知祂們名為「真實、虛謊、任性」,但不知哪個代號屬哪個名字。真實之神只說真話,虛謊之神只說假話,而任性之神會隨意說真話或假話。你的任務需找出 A, B, C 的身份,但每次只能向一位神祇發問。神祇們都懂得你的語言,但只會用祂們的語言回答 “da” 或 “ja”。這兩種回答,一個解「是」,一個解「否」,但你不知道哪個回答是哪個意思。你該如何確定每個神的身份?

文字生成題

而最後我們也實試利用兩部電腦運作 LLM 書寫文章的效果。我們發現 M3 Ultra 擁有 12.75 token/s 的運算效能,在更少時間內做出更豐富的輸出。

 

 

推向極限:在 Q8 模式下,M3 Ultra 表現依然優秀

為進一步測試新一代機型極限,我們在 M3 Ultra 上改用 DeepSeek R1 70BQ8 模式。整體 Token 生成速度與 Q4 相比約下降 40%,但仍快於 M2 Max 跑 Q4 的速度;儘管兩者並非完全可一條線比較,但足以證明 M3 Ultra 有能力在高精度模式下,依舊負擔龐大的運算量。此外運行過程中並未出現降頻,但 CPU 與 E-CPU 利用率相較 Q4 模式有所提高,大約達到 50% 左右。

 

 

實試 2:AI 繪圖 Stable Diffusion 差距更加明顯

在完成大參數 LLM 測試後,我們也利用 Stable Diffusion 進行影像生成測試。經多種解析度與 Sampling steps 設定,可以觀察到新舊型號之間的顯著差距。

 

 

  1. 512 × 512Sampling 20、生成 4 張圖:
    • M2 Max:28 秒
    • M3 Ultra:11 秒
  2. 1024 × 1024Sampling 60、生成 4 張圖:
    • M2 Max:9 分 54 秒
    • M3 Ultra:2 分 14 秒
  3. 1680 × 1680Sampling 80、生成 4 張圖:
    • M2 Max:約 1 小時 43 分鐘
    • M3 Ultra:21 分 47 秒

在最高解析度 1680 × 1680 測試中,M2 Max 甚至出現不穩定停頓,而 M3 Ultra 過程則一直維持流暢。由此可見,Stable Diffusion 上的新一代 Mac Studio 更能顯示出性能的跨代進步。

 

 

散熱效能超強

我們在 M3 Ultra 電腦即使進行效能測試,但在完整效能運作之下,機面溫度只約為 35 度,而電腦通風輸出口的溫度亦只有 39 度。

 

實試處理器效能

至於較多用到處理器的測試,我們還是交給眾多效能評測軟件。在 Geekbench 6 上面 M3 Ultra 處理器獲得了 3256 分單核效能測試與 27991 分多核效能測試。如果比起我們早前「入門版」M2 Max 的多核心 15325 分,今次所測試的 M3 Ultra Mac Studio 足有 183% 的處理能力。

 

▲在 Cinebench R23 測試,多核心分數為 46137 分,而單核分數為 2012 分。

▲而這個就是 M2 Max 的結果

 

新款 Mac Studio 更適合本地 LLM AI 工作的原因

  1. 統一記憶體(Unified Memory)設計
    Apple Silicon 將 CPU、GPU 及 Neural Engine 共享同一個記憶體池,大幅提升資料傳輸效率。傳統 PC 若僅插一張顯示卡,因 VRAM 限制可能無法運行參數較高的模型。Mac Studio 最高可配備 512GB 統一記憶體,一次解決了 CPU 與 GPU 分離記憶體配置的問題。今次我們就體驗到 256GB 記憶體的電腦,在運行大規模語言模型時的優勢。
  2. 高效能比與節能,不易降頻
    Apple Silicon 以 Performance per Watt 見長,加上 Mac Studio 機身體積較大、具備更完善散熱設計,長時間滿載運行 LLM 也不易發生過熱及降頻。對於追求高負載、長時間穩定運作的專業用戶或企業而言,是相當理想的選擇。
  3. 效能或不及高階 PC 旗艦卡,但兼具穩定與相容性
    若單純比較運算速度,配置高階顯示卡的 PC 主機仍可能在峰值性能上領先。然而新 Mac Studio 擁有更簡潔的部署方式、無需擔心 VRAM 不足,以及在散熱與功耗管理上擁有明顯優勢,對於部署規模適中的 AI 或 LLM 工作流程,能提供相對穩定且相容性良好的解決方案。

 

 

總結:一個餅乾罐大小的巨型工作站

從今次的測試可見,M3 Ultra Mac Studio 可搭載最大 512GB 統一記憶體,比起上代的最大 192GB 記憶體可以有更寬裕的空間,去支援更大規模的影片剪輯、影像創作,還有今次測試的本地大模型運行。到了專業領域,大家不是沒錢去升級,而是嫌記憶體上限不足,今次 Apple 就一次過拉到 512GB,在實際應用上提升了不少。

 

M3 Ultra 亦在運算力上有大幅提升。雖然今次測試對象是 M2 Max 處理器,似乎有欠公平,但今次測試特別想顯示出這部體積只有一個餅乾罐的電腦,效能相等於一部工作站級電腦,而且是有本地運行 AI 大模型的能力。今次測試的樣本,256GB 記憶體 + 4TB 儲存售價為 HK$62,749,價位、效能都非常貼合中小企業創作室、設計行業的需要。

 

 

Published by
Lawton