Google 上星期宣布旗下的AI 語言模型 Gemini 正式支援香港,港人從此告別 VPN,可以直接瀏覽 gemini.google.com 或透過 App 使用。雖然過去一星期有部分網民反映「時靈時不靈」,甚至要不斷更換 Gmail 帳號才能連接,不過今日起已全面支援網絡應用程式。Google 今日亦宣布,現正將 Gemini 流動應用程式體驗擴展至全港所有用戶。大家最關心的問題必然是:香港版功能與外國版有分別嗎? 本文將為你逐一拆解,看看 Google Gemini 如何徹底改變你的日常工作。
Gemini 網頁連結:gemini.google.com
Android Play Store 下載連結:https://play.google.com/store/apps/details?id=com.google.android.apps.bard
如找不到,可在系統設定中將「數位助理」設定為 Gemini,然後依照指示安裝
iOS App Store 下載連結:https://apps.apple.com/app/google-gemini/id6477489729
現時港人已經可以直接連接 Gemini 網頁版,我們實試後發現 iOS App Store 以及 Android Play Store 已上架 Google Gemini 手機應用程式。
1)網頁版:gemini.google.com
▲ 現時港人已經可以直接連接 Gemini 網頁版
2)Android版:https://play.google.com/store/apps/details?id=com.google.android.apps.bard
▲ 在沒有使用VPN和在香港區的情況下,可以在 PlayStore 找到 Google Gemini 手機應用程式
如找不到,可在系統設定中將「數位助理」設定為 Gemini,然後依照指示安裝
3)iOS 版:App Store 下載連結:https://apps.apple.com/app/google-gemini/id6477489729
▲ iOS 版手機應用程式亦已上架
如果你是初次接觸 Gemini 的讀者,可以簡單將它想像成一個由 Google 研發、具備超強邏輯與記憶力的「超級助手」。它不單是一個像 ChatGPT 般的聊天機械人,更是一個「多模態」人工智能。用人話講就是它「瓣瓣掂」,除了能讀懂文字,還能看圖、看影片、聽聲音,甚至幫你寫程式碼。它不再只是單純的搜尋工具,而是能協助你處理文書處理、深度學習,甚至進行專業級影音創作的全能工具,讓你的生產力大幅提升。
▲ Gemini 使用界面,在畫面上的文字欄位中,直接輸入你想問的問題,或想 AI 為你解決的事情
進入 Gemini 的介面,你會發現它可以切換三種不同的運算模式。但在講解模式之前,我們要先搞清楚什麼是「語言模型」。簡單來說,你可以想像它是一個讀過全世界所有書本、網頁和文章的超級機器人。它不只是死背資料,而是學會了人類說話的規律和邏輯,所以它能像真人一樣跟你聊天、替你寫信或創作。而 Gemini 提供的三種模式,其實就是根據你任務的難度,決定要動用這個大腦多少的「腦力」。
第一種模式是「快捷(Fast)」,顧名思義它反應極快,適合處理生活碎事,例如快速寫一封回郵,或者可以問即時資訊摘要,例如 「用三句說話幫我總結一下今日香港最重要嘅財經新聞係咩?」,或者快速「度橋」,例如「幫我諗 5 個送畀女仔朋友嘅生日禮物 Idea,預算 $500 左右。」同時,它也可以快速為你總結網頁大意或是做即時翻譯,節省大量時間。
▲ 即使是快捷模式,已經可以快速為你總結網頁大意或是做即時翻譯
▲ 即使是「快捷(Fast)」也可以寫遊戲,下文詳細解釋
如果你遇到需要「動腦筋」的高難度問題,例如複雜的數學證明、科學研究或精密程式開發,就可以切換到「思考型模式」。這個模式的特別之處在於它具備「內心獨白」,會像真人一樣先在腦中拆解問題、自我糾錯,最後才給出答案。雖然生成速度較慢,但邏輯極之嚴密。
▲
▲ 在「思考型」模式,Gemini 會展示它的「思路」(Chain of Thought),在給出答案前進行反覆推敲與邏輯驗證,雖然生成速度較慢,但能提供極具深度推理分析。
▲ 大概使用了 5 秒解答問題,提供解決方案和建議
在道德悖論與深度分析方面,思考型會展現更強的批判性思維,來回推敲論點
▲使用思考型討論哲學與科技倫理命題
最後,Pro 模式便是最強大的選擇,能同時處理數百頁專業檔案或海量程式碼庫。雖然 Pro 模式的生成速度最慢,但它能夠處理複雜要求,例如編寫複雜的程式碼。
▲ 我們使用Pro 模型分析問題,再編寫複雜的程式碼
除了處理文字,Gemini 在創意領域同樣驚人。它內置了最新的 Nano Banana 2 圖像生成引擎,用家可以輸入文字或者提供現有圖片去生成圖片。而且以往 AI 最怕處理的「精準手指結構」和「文字標誌」都能生成得自然真實。
我們用「 快捷(Fast)」模式嘗試一個比較天馬行空的要求:「生成一張香港人在維港觀看煙花的圖片,但時間是下午十二點正,另外,有人著清朝衫,有人著現代衫」,Gemini 同樣做到。
▲連以往 AI 最難處理文字標誌與精準手指結構都能自然呈現,而且只是使用「 快捷(Fast)」模式
▲ 現時Nano Banana 2 更可以選擇不同圖片模式
▲ 在工具按建立圖像便能使用Nano Banana 2
如果不滿足於圖片,內置的 Veo 影片引擎就幫到你。只需輸入簡單文字,AI 就能生成具電影感的 7 秒高清影片,連環境音效都幫你配好。現在更有不同的範本選擇,不用非常詳細地描述畫面也可生成不同風格影片。
▲ Veo 界面可以選擇不同風格的影片
如果你需要配樂,Lyria 3 功能則能根據你要求的氣氛,即時創作出 30 秒的專業樂曲,由旋律到人聲演繹都一步到位。目前香港版已確認支援這些強大的多媒體生成功能,與外國版幾乎同步。
要開啟 Gemini 的「Canvas」畫布功能,用家只要在工具列開啟「Canvas」,再輸入寫文章或編寫程式等指令,系統便會自動在對話視窗旁彈出一個獨立的工作空間。對於經常要處理長文章、製作企劃或寫 Code 的讀者而言極之實用,因為它讓你與 AI 進行「並排協作」。以往用 AI 寫文章,要手動複製 AI 生成的文字,貼到 Word 又要慢慢排版。使用「Canvas」你可以直接匯出文字到 Google Doc,又可以 Highlight 某段文字要求 AI 加強語氣或縮短篇幅,甚至直接在上面手動修改,流程非常順暢。。
▲Canvas 將提供一個獨立空間,根據你後續指令繼續修正文章
以撰寫文章如做功課為例,受惠於 Google 的生態圈,只要開啟了「Canvas」,文章便可以連同格式排版直接匯出到 Google Doc,大大提升效率。我們要求 Gemini 寫「小學生都睇得明」的 Gemini 介紹文章,隨即在對話視窗旁彈出獨立工作空間。
▲ 在 工具列打開 「Canvas」 功能
▲ 以往在 Chatgpt 撰寫文章,往往需手動複製 AI 生成的文字
▲系統會在對話視窗旁彈出獨立工作空間,你更可以直接在空間選取( Highlight )你想改的句子,它便直接幫你調整,連寫詳細指令的時間也可節省
▲在獨立工作空間,可以按分享,直接把文件匯出到 Google 文件,即是文書工作常見的 Word 檔 ( doc 格式)
由於「Canvas」擁有獨立工作空間,你可以輸入指令要求它寫一個網頁遊戲,例如「用一個帶眼鏡嘅香港男仔樣,整一個好似 Super Mario 嘅 8 Bit 遊戲」。Gemini 會即時在「Canvas」寫 Code,完成後你只需按一下「預覽(Preview)」即可直接試玩。整個過程不足一分鐘,讓 AI 從問答機械人進化成你的程式開發隊友。
▲右邊便是 Canvas 獨立工作空間
▲ Canvas 獨立工作空間可以選擇 Preview 以閱讀 Gemini 生成的 code,按 Preview 則可看到遊戲畫面
▲ 輪入指令:「寫Code: 用一個帶眼鏡嘅香港男仔樣,整一個好似 Super Mario 嘅 8 Bit 遊戲」所生成的遊戲
針對日常應用,Gemini Live 的語音對話體驗非常震撼,只要在電話版 Gemini 的右下角按「Gemini Live」按鈕便用到。
它支援廣東話對答,反應速度與真人聊天無異,你可以隨時打斷它。最厲害的功能是結合手機鏡頭,當你在現實生活中遇到不懂修理的電器,或是在組裝電腦時對著一堆電線發愁,只需開啟鏡頭給 Gemini 看,它就能即時用語音指示你:「藍色那條線應該插在左邊」,變身成你的隨身私人家教。
以記者實試所知,雖然 Gemini 能夠說廣東話,但未能完全辦識用家的廣東話,相信之後理解力會更進一步。
對於需要進行市場調查或學術研究的用戶,「Deep Research」 不只是單次搜尋,而是會根據用戶的要求,自動制定多步研究計劃,並深入瀏覽數百個網站、甚至連結用戶授權的 Gmail 和雲端硬碟。Deep Research 會自動判斷資訊的可靠性,並在幾分鐘內生成一份結構完整、附有精確引注的多頁研究報告。它甚至能提供「語音綜述」(Audio Overview),將繁瑣的研究成果,轉化為像 Podcast 的簡短精煉語音導讀,極大地節省了研究人員篩選與整理資料的時間。
▲ 在正式開始研究之前,Gemini 會先詢問研究方向,當你確認方向無誤,方開始研究
針對學生與教育工作者,Gemini 內置了基於 LearnLM 技術的 「引導式學習」(Guided Learning) 模式。不同於一般 AI 直接提供標準答案,該模式採用蘇格拉底式的教學法,透過啟發式的問題引導用戶逐步思考,協助用戶建立真正的理解。它能將複雜的學術概念拆解為易於理解的小步驟,並配合互動式測驗、圖表與 YouTube 影片教學來鞏固知識點。這種教學方式能讓用戶在學習編程語言、科學原理或歷史脈絡時,不再只是被動接收訊息,而是與 AI 共同進行一場深度的互動學習。
目前 Gemini 在香港主要提供免費版供用戶體驗,雖然暫時未像海外地區般正式推出針對個人用戶的付費訂閱方案,但現有的功能已足以應付大部份日常任務,如資料查詢及基本文件摘要。對於追求極致效能的專業玩家,大家都在期待 Google 能盡快在香港開通如「Google One AI Premium」般的付費服務。
▲ 暫時未像海外地區般正式推出針對個人用戶的付費訂閱方案
參考鄰近地區,台灣與日本目前已提供多層次的訂閱方案。以台灣為例,包含 2TB 空間與完整 AI 協作能力的 AI Pro 方案約為每月 650 元新台幣(折合約 160 港元),而日本的同類方案定價則約為每月 2,900 日圓(折合約 150 港元左右)。如果日後香港引入相關方案,預計用戶將能解鎖運算力最強的 Gemini 3 Pro 模型、獲得更高級的影像與影片生成配額,並能直接在 Gmail 或 Google 文件中使用 AI 協作。在付費版正式登陸香港前,港人不妨先熟習免費版各項強大功能,體驗 AI 如何融入生活。