Google 推出全新多模態開源 AI 模型 Gemma 3n,最大賣點是僅需 2GB 記憶體便能在智能電話上本地運行。Gemma 3n 不但支援文字輸入,亦兼容聲音、圖像與影片資料處理,讓開發者可在流動裝置上實現完整 AI 應用體驗。
Gemma 3n 屬 Google Gemma 模型家族一員,開發方針一貫強調開放與自訂性。今次正式發布的 E4B 主模型與 E2B 子模型,均已上架 Hugging Face 及 Kaggle 平台,開發者可隨時下載應用。Gemma 3n 以「MatFormer」技術訓練模型架構,實現如俄羅斯套娃般的結構,E2B 作為 E4B 的小型副本,可獨立運行。
主打流動平台的 E2B 模型擁有 5B 參數,記憶體使用量壓縮至僅 2GB,記憶體壓縮關鍵在於使用稱為「Per-Layer Embeddings(PLE)」的設計。這種方式大幅減低模型執行時所需資料存取負擔,令原本記憶體需求高的模型亦可在智能電話內順暢運行。
Gemma 3n E4B 模型則擁有 8B 參數,實測顯示其記憶體消耗與傳統 4B 模型相約,運行時只需 3GB 記憶體。即使在效能方面,Gemma 3n E4B 亦超越 GPT 4.1-nano,並壓倒 Llama 4 Maverick 17B-128E 及 Phi-4 等體積較大模型。
Gemma 3n 現時支援多個執行環境,包括 Hugging Face Transformers、llama.cpp、Google AI Edge、Ollama、MLX 等,還可透過 Pixel 8 Pro 等流動裝置安裝「Google AI Edge Gallery」應用程式作本地運行。用戶更可於 Google AI Studio 測試其聊天功能。
Google 透過 Gemma 3n 展示 AI 模型與硬件門檻不再掛鉤,開放下載配合低記憶體門檻,有望推動智能電話與物聯網裝置加速導入多模態 AI 應用。
資料來源:Google
分享到 :
最新影片