AI 製圖又有新突破。AI 開發公司 PrismML 近日推出了全新開源圖像生成模型「Bonsai Image 4B」,特點是可離線操作,代表不用像使用 Gemini 或 ChatGPT 般要上網生圖,而且整個模型只佔 3.6 GB,單憑手機晶片在十多秒內生成高質素圖片。而離線AI的最大好處,除了確保資料不會留下任何雲端紀錄,更沒有每天的生成限額,因為全程是在手機本地運算。
Bonsai Image 4B 下載連結 : https://apps.apple.com/app/bonsai-studio-by-prismml/id6767042620

三簡單步驟 免費玩 Bonsai Studio
想在 iOS 裝置上親自體驗這款 Local AI 威力,請跟隨以下步驟進行部署與設定。整個過程非常直覺,完全不需要任何編碼基礎。
第一步:下載應用程式
打開 iPhone App Store,搜尋關鍵字「Bonsai Studio by PrismML」並進行免費下載。安裝完成後直接啟動程式,在歡迎介面上點擊「Continue」進入下一步。

▲ 在 App Store 搜尋「Bonsai Studio by PrismML」,好消息是香港地區也能下載

▲安裝完成後直接啟動程式,在歡迎介面上點擊「Continue」
第二步:下載核心 AI 模型
由於應用程式本體不內含龐大資料庫,首次啟動時系統會彈出提示,要求用戶下載模型。此時請點擊畫面中的「Open Settings」按鈕,畫面上會顯示可供下載的模型列表。我們強烈建議選擇畫質還原度高達 95% 「Bonsai Ternary」版本,點擊下方的下載圖示。雖然模型經過高度壓縮,但檔案大小仍有約 3.89GB,建議連接穩定的 Wi-Fi 網絡進行下載。下載完成後,點擊「Done」即可返回主畫面。

▲首次啟動時系統會彈出「No Model Downloaded 提示,點擊畫面中的「Open Settings」便可下載模型

▲我們建議選擇畫質還原度高達 95% 「Bonsai Ternary」模型,模型佔 3.89 GB
第三步:輸入提示詞並離線生圖
回到 Bonsai Studio 主介面後,中央會出現一個文字輸入欄。

▲Bonsai Studio 主介面中央會出現一個文字輸入欄
此模型內置了先進文字編碼器,對自然語言理解力極高。你可以直接在欄位內輸入想要呈現的畫面描述(提示詞)。輸入完畢後,點擊右側「Generate」按鈕,手機處理器便會即時開始構圖。稍等片刻,生成的圖片就會展現在畫面上。如果對成品感到滿意,點擊右下角「Save」按鈕,即可將成品直接儲存至手機內置相簿。
今次評測工具: iPhone Air 實測
我們使用了 iPhone Air 實測,測試電話會否因為生成圖片的運算而過熱。讀者看我們實測時,也可以採用以下精心設計的四個中文 Prompt 橋段,分別考驗文字渲染、質感細節、本土文化及複雜人像。
實測一:英文字母渲染
傳統輕量化 AI 最容易將文字變成亂碼。這個提示詞期望能考驗 Bonsai 模型在經過壓縮後,能否在霓虹燈招牌上精準串出我們網站的名字。

▲ 直接在欄位內輸入想要呈現的提示詞,輸入完畢後,點擊右側「Generate」按鈕

▲測試期間,我們沒有任何網絡連接
中文實測指令:
「在一個下雨的街角,有一個cyberpunk風格的霓虹燈招牌,上面閃爍著發光的英文字母「UNWIRE」,相片級寫實風格,電影感光影。」
結果:
我們選擇了 1024 x 1024 尺寸的圖片,是模型提供的最大比例,總共使用 93.4 秒生成,即大約分半鐘生成一張圖。

▲在完全沒有連網的情況下,iPhone 美生出了帶有正宗『UNWIRE』字樣的霓虹燈招牌,字體沒有亂碼,雨天的地面反光、牆身的光影過渡亦極具層次感

▲滿意生成結果的話,便可下滑到 Library 下載圖片
實測二:創意微距與植物質感
光影表現是圖片重要指標,考驗微距攝影細節還原度。
中文實測指令:
「在一間傳統的日式木屋內,有一個用綠色仙人掌做成的迷你盆景,柔和的電影感柔光從窗外灑落,微距攝影風格。」
結果:

從成品來看,光影處理亦很到位,右側和室窗戶灑進來的逆光,在仙人掌邊緣形成了一層很自然的輪廓光,配合木桌的紋理與恰到好處的背景虛化,整體達到了相片級的微距攝影質素,證明模型在處理自然物件的材質與光影上非常成熟。
實測三:多語言與文化理解測試
本環節特別嘗試測試模型的理解能力與構圖美感。對於香港特有文化物件,如霓虹燈招牌、的士在沒有網絡連結下的認知。
中文實測指令:
「一個科幻風的香港旺角夜市街頭,空中有飛行的士,霓虹燈閃爍,寫實照片風格。」
結果:
結果這項測試並不合格。首先,模型雖然在測試一處理英文非常完美,但對繁體中文招牌仍有難度。兩旁招牌上的文字全部變成了無法辨認的『偽中文亂碼』,沒有一個漢字能真正讀通。其次,街頭看起來亦與香港有出入,指令要求的『飛行的士』,AI 只是粗糙地將一輛藍色舊款私家車生硬地懸掛在半空,街景整體風格偏向亞洲綜合夜市,反映出 Bonsai 4B 目前的資料庫對本地素材認知不足,如果需要製作本地化的 AI 圖,最好使用 Gemini 或 ChatGPT 等線上 AI。
測試四:複雜人像與衣物細節
最後,人像面部五官與衣物紋理最容易暴露出 AI 破綻。利用這個提示詞,可以在同一部手機上分別切換 1-bit 與 Ternary 模型,細心觀察眼鏡反光、背景虛化以及五官細緻度分別。
中文實測指令:
一個時尚女士的特寫肖像,她戴著有 25% 灰色漸變鏡片的波士頓框太陽眼鏡,穿著復古日本工裝外套,走在繁華的東京街頭,背景虛化,柔和的日光。
結果:

在最後的測試四中,Bonsai 4B 筆下的亞洲女性五官非常自然,完全沒有以往開源 AI 常見的僵硬塑膠感。最讓我們佩服的是細節還原度:黑色的波士頓眼鏡框線條流暢,鏡片更完美呈現出上深下淺的 25% 灰色漸變效果,甚至能隱約看見墨鏡後方的眼神。此外,軍綠色工裝外套的粗糙布料織紋與車線都清晰可見,配合自然的大光圈背景虛化。證明了模型雖然在中文文字上表現一般,但在處理亞洲人像、潮流服飾與複雜光影時仍有優勢。
解鎖高清與比例設定:1024 畫質最清、512 速度最快
在操作主介面時,大家千萬不要錯過右上角的隱藏設定。只要輕觸右上角的圖標,用戶就能自由調校畫幅的輸出比例(Aspect Ratio),亦可以選擇解像度 ( Size)。

▲輕觸右上角的圖標

▲可以選擇解像度、格式
程式現時提供了 1:1、3:2、2:3 以及 1:2 等多種主流格式,方便大家直接創作出適合 Instagram 貼文或手機 Wallpaper 的相片。更重要的是,這裡還可以選擇 1024 x 1024 的超高清解像度。經過我們實測,選擇 1024 比例生出來的畫面細節最精細、線條最扎實,不過代價是極之考驗手機晶片,平均需要大約 90 秒,即大約分半鐘,才能完成一張圖;相反,如果追求速度,將解像度設為 512 x 512 的話,最快大約 12 秒就能成功過關出圖。大家可以根據自己需要,在畫質與時間之間取得平衡。
生成圖片的限制
雖然 Bonsai Studio 屬於完全離線、不經任何雲端伺服器審查的 Local AI 模型,但這並不代表用戶可以毫無限制地生成所有種類的圖像。經過我們實測,模型在底層開源受訓時,已經內置了相當嚴格的合規性安全過濾器。例如,當嘗試輸入「性感女性穿著內衣在床上」這類涉及感官刺激或稍微敏感的提示詞時,系統同樣會拒絕執行並無法生成圖片。因此讀者需要留意,即使此工具具備極高的私隱度與自由度,但在日常創作時,依然必須遵守模型本身的內容安全規範。

▲當嘗試輸入「性感女性穿著內衣在床上」, 系統同樣會拒絕執行並無法生成圖
總結
以往在手機玩離線 AI,最怕就是機身過熱。不過,我們這次特別選用了主打極致輕薄、散熱空間相對有限的 iPhone Air 連環製圖。令人驚喜的是,在連續生成了十多張高精細圖片之後,iPhone Air 表現相當穩健,機身全程維持在微溫狀態,完全沒有出現任何預期中的過熱或燙手情況。證明了 Bonsai 在運算時的硬件負載減至最低,即使是 iPhone Air 這種輕薄機身,亦能在不犧牲核心效能的前提下輕鬆應付本地 AI 的密集運算。
由於是離線,所以它是很不錯的「隨身靈感生產器」;加上數據不需上傳雲端,非常適合商務大眾處理高度敏感、涉及商業私隱的隨身概念草圖。
不過,如果你的生圖情景需要大量精準中文、或者需要繪製香港本土特色街景的話,現階段這款輕量化模型就完全派不上用場。面對這種需要強大亞洲文化數據庫的創作,大家還是乖乖連網、轉用大型雲端 AI 吧。

▲如果你的生圖情景需要大量精準中文,現階段這款輕量化模型就完全派不上用場
溫馨提示:雖然本地生圖完全免費且不耗流量,但由於生圖過程會令處理器神經網絡引擎(NPU)處於全負載狀態,連續生圖時機身出現微溫屬於正常現象。建議用戶在進行大量創作時,注意手機散熱情況,以免影響晶片極限輸出效能。

