人工智能

Google Gemma 3n 小型 AI 模型推出可裝進 2GB 記憶體智能電話

作者

Lawton
發佈日期

2025-06-29
閱讀時間

4分鐘
字體大小

Google 推出全新多模態開源 AI 模型 Gemma 3n，最大賣點是僅需 2GB 記憶體便能在智能電話上本地運行。Gemma 3n 不但支援文字輸入，亦兼容聲音、圖像與影片資料處理，讓開發者可在流動裝置上實現完整 AI 應用體驗。

Gemma 3n 屬 Google Gemma 模型家族一員，開發方針一貫強調開放與自訂性。今次正式發布的 E4B 主模型與 E2B 子模型，均已上架 Hugging Face 及 Kaggle 平台，開發者可隨時下載應用。Gemma 3n 以「MatFormer」技術訓練模型架構，實現如俄羅斯套娃般的結構，E2B 作為 E4B 的小型副本，可獨立運行。

主打流動平台的 E2B 模型擁有 5B 參數，記憶體使用量壓縮至僅 2GB，記憶體壓縮關鍵在於使用稱為「Per-Layer Embeddings（PLE）」的設計。這種方式大幅減低模型執行時所需資料存取負擔，令原本記憶體需求高的模型亦可在智能電話內順暢運行。

Gemma 3n E4B 模型則擁有 8B 參數，實測顯示其記憶體消耗與傳統 4B 模型相約，運行時只需 3GB 記憶體。即使在效能方面，Gemma 3n E4B 亦超越 GPT 4.1-nano，並壓倒 Llama 4 Maverick 17B-128E 及 Phi-4 等體積較大模型。

Gemma 3n 現時支援多個執行環境，包括 Hugging Face Transformers、llama.cpp、Google AI Edge、Ollama、MLX 等，還可透過 Pixel 8 Pro 等流動裝置安裝「Google AI Edge Gallery」應用程式作本地運行。用戶更可於 Google AI Studio 測試其聊天功能。

Google 透過 Gemma 3n 展示 AI 模型與硬件門檻不再掛鉤，開放下載配合低記憶體門檻，有望推動智能電話與物聯網裝置加速導入多模態 AI 應用。

資料來源：Google

Gemma 3n