議員提議引入雙層列車 港鐵回應技術限制難執行 一原因香港不適合

港鐵多條路綫車廂擠迫問題持續,在立法會鐵路事宜小組委員會,多名議員要求增加班次或擴大載客量。當中有議員提出引入雙層列車,惟港鐵香港客運服務總監鄺永銓表示,雙層列車會令停泊時間延長,影響整條路綫容量,暫時不在考慮範圍內。

屯馬綫加卡、雙層車卡均有人提

民建聯陳學鋒直指,南港島綫班次密度需再提升,並形容上班繁忙時間黃竹坑站與利東站均「頂到爆」。新社聯譚鎮國則表示,非繁忙時間車廂同樣擠迫,而古雋邨與鳳凰嶺邨陸續入伙後,新界北將迎來更多新增人口,情況只會更嚴峻。民建聯周浩鼎關注屯馬綫目前 8 卡車載客量是否足夠,詢問有否條件再加一卡。

 

選委會界別議員陳恒鑌就說,多次提出引入雙層車卡建議,認為兩層式設計可進一步提升載客率。港鐵曾投入服務的雙層列車為九廣鐵路直通列車「九廣通(Ktt)」,但已全面退役,港鐵曾於 2025 年在紅磡站「站見」鐵路展展出相關車廂。

 

▲選委會界別議員陳恒鑌說,多次提出引入雙層車卡建議,認為兩層式設計可進一步提升載客率 (AI示意圖)

 

▲港鐵曾投入服務的雙層列車為九廣鐵路直通列車「九廣通(Ktt)」,但已全面退役

港鐵籲乘客留意顯示屏

鄺永銓回應時表示,港鐵會持續密切留意營運情況及出行模式,同時呼籲乘客上車前留意月台顯示屏,選擇相對鬆動車卡上車,以分散人流。另外,有議員關注旅客佔用港鐵職員專用插座充電問題,港鐵表示已在旅客車站增設充電設施,並將與便利店合作推出流動充電器租借服務。

雙層列車為何不適合地鐵系統

雙層列車在技術上並非新鮮事,法國、澳洲等地均有應用於城際鐵路,但用於高密度城市地鐵系統卻幾乎絕無僅有。原因在於地鐵運作講求「快上快落」,雙層設計令乘客上落時間大幅增加,直接拖慢班次頻率。以港鐵繁忙時段每隔約 2 分鐘一班計算,只要每站停泊時間多出數十秒,整條綫運載能力反而會下降。

 

同時,現有港鐵隧道及月台淨空高度,均按單層列車標準興建,引入雙層列車需大規模改建基建,涉及龐大工程費用及長時間停運,代價遠超效益。

 

資料來源:立法會

Google Pics 超強 AI 改圖工具登場 改圖改字,一句指令即可 毋須任何 Photoshop 知識

Google 在 2026 年 Google I/O 開發者大會上正式推出全新 AI 修圖應用程式 Google Pics。應用程式採用 Nano Banana 框架開發,支援物件分割(object segmentation)精細編輯,讓用戶無需重新生成整張相片,即可針對相中特定元素作出修改。其定位與 Canva 相近,目標成為市場上最具競爭力的 AI 設計工具之一。

 

 

精細物件編輯

Google Pics 的核心功能是物件分割技術。用戶只需點選相片中想修改的特定元素,輸入文字指令即可完成修改,過程中不會影響相片其餘部分。Google 官方示例包括更改相中人物毛衣顏色,以及直接將相片中的狗換成貓。用戶亦可移動或縮放相片中的個別物件,無論相片是由 AI 生成還是真實拍攝皆適用,系統完成後提供 4 個候選版本供選擇。

 

▲用戶只需點選相片中想修改的特定元素,輸入文字指令即可完成修改

 

翻譯相片文字 完美保留字體

Google Pics 另一項亮眼功能是直接在相片內修改或翻譯外語文字,無需重新生成整張圖片。Google 明確表示,系統翻譯時會完整保留原有字體風格與版面設計,確保視覺效果一致。這功能對商業用戶尤其實用,製作多語言海報或活動邀請函時,無需另行重新排版設計。

 

 ▲ 不用重新生成整張圖片,直接在相片內修改或翻譯外語文字

 

協作功能與 Workspace 整合

Google Pics 以網頁版形式率先推出,並以協作為核心,支援共享畫布(shared canvas)及多人同時編輯功能。應用程式已直接整合至 Google Slides 及 Drive,用戶無需離開正在使用的 Workspace 應用程式即可完成圖片編輯。Google 亦計劃日後將更多功能內置於其他 Workspace 應用程式中。圖片編輯完成後可匯出 JPG 或 PNG 格式,亦支援列印及分享。

 

推出時間與訂閱要求

Google Pics 目前已向一批「可信測試用戶(Trusted Testers)」開放,預計今個夏季向全球 Google AI Pro 及 Ultra 訂閱用戶正式推出。Google Workspace 企業用戶屆時亦可搶先以預覽模式使用此工具。

 

 

黃仁勳:中國市場始終會開放 Nvidia H200 輸華前景仍充滿變數

Nvidia 行政總裁黃仁勳隨特朗普總統訪華後,5月18日接受彭博電視訪問時表示,中國當局最終會允許美國 AI 晶片進口。

 

黃仁勳上週最後一刻加入美國商界代表團,隨特朗普赴北京,出席5月14至15日與國家主席習近平的峰會。他其後在拉斯維加斯舉行的 Dell 年度全球技術峰會期間表示,中國政府必須決定在多大程度上保護國內市場,他感覺隨着時間推移,中國市場終將開放。他同時透露,他本人並未直接與中方官員討論向中國客戶銷售 H200 晶片的計劃,但承認雙方在會談中確實提及這一話題,並稱特朗普總統與中方領導人進行了交流,他期待他們的決定。

 

 

特朗普亦在返回華盛頓後回應稱,H200 晶片確實被提及,他認為可能會有進展,惟補充指中方目前尚未批准採購,因為他們選擇不這麼做,他們想自己開發。

 

H200 輸華的曲折歷程

特朗普於 2025 年 12 月 8 日宣布,允許 Nvidia 向中國「經核准」客戶出售 H200 AI 晶片,條件包括美國政府抽取 25% 收益、出貨量不超過美國客戶總量的 50%,以及晶片須在美國完成第三方安全測試及客戶盡職審查。美國商務部隨後於今年 1 月 15 日正式調整出口政策,並於 2 月底批出 Nvidia 具體出口許可證。

 

今年 3 月,黃仁勳在加州聖荷西舉行的 GTC 大會上宣布,Nvidia 已獲兩國政府批准、收到中國客戶訂單,並重啟 H200 生產線。然而中企其後通知 Nvidia 無法履行採購,在北京指引下轉而支持包括華為在內的本土晶片製造商。

 

中美科技角力持續

Nvidia 早前已將中國視為 500 億美元(約港幣 3,900 億元)的潛在商機,但在2026年初仍維持對中國 AI 晶片銷售的預測為零。Nvidia 將於5月20日公布業績,投資者屆時會密切關注 AI 晶片輸華前景的最新進展。

 

資料來源:The Business TimesCNBC

 

這次輪到被中國拒之門外 NVIDIA RTX 5090 D v2  中國海關拒絕發出入口通行證

 

NVIDIA 專為中國市場設計的 GeForce RTX 5090 D v2 顯示卡,近日遭中國海關拒絕發出入口通行證,令這款中國特供產品無法進入中國市場,禁令之突然令 NVIDIA 完全措手不及。

 

RTX 5090 D v2 的誕生背景

NVIDIA 早於去年推出面向中國市場的 GeForce RTX 5090 D,但該顯示卡隨即因美國出口管制規定而遭全面禁售。為此,NVIDIA 推出規格再度縮減的 RTX 5090 D v2,採用 GB202-240 核心,VRAM 由原本的 32GB 削減至 24GB,記憶體匯流排亦由 512-bit 收窄至 384-bit,目標是符合美國對中國的出口限制門檻,讓中國玩家仍可購得 GeForce 旗艦產品。

 

中國主動出手,並非美方施壓

今次禁令罕見地來自中方,而非美國。中國板卡業者透露,近日已收到中國海關通知,表明 RTX 5090 D v2 不會獲批入口,物流公司亦無法為該顯示卡取得任何清關許可。原本外界預期總統特朗普與黃仁勳訪華後中美科技緊張關係將有所緩和,但 CNBC 確認黃仁勳實際上並未隨同特朗普出訪中國,而 NVIDIA H200 AI 晶片亦未有獲批全面進入中國市場。

 

業界猜測禁令動機

有中國板卡業者指出,目前業界對中國海關的禁令動機感到困惑。由於 RTX 5090 D v2 的 AI 算力已被鎖定至 2,375 AI TOPS,禁止此卡進口實際上無助扶植中國本土 AI 晶片產業。業界推測,中國政府或將 RTX 5090 D v2 視為帶有侮辱性的降格產品,不願讓一款規格被刻意削減的「二等品」在中國市場公開銷售。

 

庫存無處可去,市場影響浮現

由於 RTX 5090 D v2 屬中國特供產品,規格不符其他國家市場需求,亦無法在中國以外地區正式銷售,現有庫存頓時陷入進退兩難的局面。部分業界人士估計,這批顯示卡最終或會經由非正規渠道流入市場,或直接售予有需要的 AI 企業。目前中國玩家的最高選擇已降至 RTX 5080,而本土 GPU 廠商雖在加速研發,仍遠未能追上 NVIDIA 旗艦水準,市場上 NVIDIA 及 AMD 現有產品的價格亦持續上漲。

 

資料來源:Wccftech

 

中國 AI 寵物翻譯器 售 918 元被指智商檢測器 官方:收集逾 100 萬條寵物聲紋訓練

杭州初創公司萌小譯推出一款售價 799 元人民幣(約港幣 HK$918)的 AI 寵物翻譯器。該產品宣稱能將貓狗叫聲實時翻譯成文字,情緒識別準確率高達 94.6%。產品在網上推出後引起網民激烈討論,不少網民直斥其為「人類智商檢測器」。

 

▲ 產品宣稱能將貓狗叫聲實時翻譯成文字,情緒識別準確率高達 94.6% ( 極目新聞

產品功能與技術

該裝置重僅 27 克,比 AirPods 還輕,可夾在寵物項圈上使用,並在手機端同步生成語音聊天記錄。官方表示,萌小譯寵物翻譯器依託阿里雲通義千問大模型技術,研發團隊來自前阿里通義團隊,並以逾 100 萬條寵物聲紋樣本作為訓練基礎,可識別寵物叫聲、情緒及行為語言,將貓狗叫聲轉化成文字。宣傳影片中,貓咪叫聲被翻譯成「離我遠點行不行,本來就煩」等字句。同時該裝置具備自學習進化能力,在使用過程中能逐步適應寵物獨特的「口音」和情緒表達習慣。

 

▲官方表示,以逾 100 萬條寵物聲紋樣本作為訓練基礎

 

94.6% 準確率惹質疑

對於該產品宣稱的高準確率,大批網民持懷疑態度,直問「準確率是怎麼算出來的,怎麼驗證的」。有網民更直言:「這個 799 元的盒子,當玩具買沒問題,當翻譯器?做不到,這是妥妥的人類智商檢測器。」一名經驗豐富的貓行為諮詢師受訪時亦表示,對該產品持觀望態度。

 

對此,萌小譯相關負責人於 5 月 16 日晚回應,94.6% 指的是情緒識別率,數據屬實。負責人強調「任何新生事物都會有疑問、有爭論,只有自己體驗過,才會知道這個產品並不是智商稅。」該名負責人補充,產品目前仍處預售階段,此前已有寵物主人進行過體驗。

 

科學界:情緒分類與真正翻譯仍有距離

AI 寵物語言翻譯近年在業界受關注。由華人團隊開發的犬隻翻譯 App Traini,透過聲音、影片與圖像多模態分析,宣稱犬隻行為翻譯準確率達 81.5%,曾獲 CNBC 報道為「全球首個多模態 AI 犬隻翻譯應用」。不過,現有研究普遍聚焦於情緒分類,例如判斷狗叫中的焦慮、警戒或興奮情緒,而非直接翻譯成具體語義,距離真正的「跨物種對話」仍有明顯距離。

 

資料來源:極目新聞

Whoscall 與香港警務處合作 啟動「反詐介入來電」  關鍵時刻主動介入保護市民

 

香港每年詐騙損失高達 53 億港元(約港幣 53 億元),人均受騙損失達 6,798 港元。面對嚴峻形勢,科技服務商 Gogolook 旗下防詐應用程式 Whoscall,在今日(5 月 20 日)正式宣布與香港警務處反詐騙協調中心(ADCC)合作,授權將 Whoscall 認證商家號碼用於警方針對懷疑詐騙個案緊急聯絡,建立「反詐介入來電」機制,於關鍵時刻主動介入保護市民。

以科技築起數碼防護網

當警方偵測到有市民疑似誤墮騙局,反詐騙協調中心人員可即時透過 Whoscall 認證商家號碼撥出緊急認證來電,對方來電顯示畫面將即時顯示官方警徽及「香港警務處反詐騙協調中心」名稱,讓當事人一眼識別真正執人員身份,在資金轉出前及時截停損失。

冒充官方號碼一向是詐騙集團慣用手法。Whoscall 以即時驗證機制確保只有獲批機構方能顯示認證身份,相關視覺識別身份經嚴格審核後無法被複製或偽冒,從技術層面封堵冒充漏洞,加強市民對官方來電信任。

 

Gogolook 共同創辦人暨行政總裁郭建甫表示:「在數碼騙案愈發猖狂、逐步侵蝕公眾信任之際,我們使命是重建電話通訊公信力。這項計劃在香港市民最脆弱、最需要支援關鍵時刻,透過清晰且可核實警方認證來電,帶來實質保障。Whoscall 認證商家號碼結合 ADCC 實時行動,有助迅速釋除用戶疑慮,有效保護市民。」

建立公私營合作新典範

是次合作整合三方力量——香港警務處 ADCC 執法權威、Whoscall 認證技術,以及 HKJunkCall 社群協作數據,建立全新公私營防詐合作典範。非應邀來電回報網站 HKJunkCall 於 2026 年 3 月獲頒香港警務處「好市民獎」(好機構獎),表揚其作為民間防騙數據貢獻;HKJunkCall 與 Whoscall 合作,為系統提供數據支援,使其能準確顯示認證來電方名稱,並即時標記可疑活動。

 

除了緊急介入機制外,Whoscall 應用程式亦為用戶提供免費日常防護,涵蓋來電顯示、詐騙電話攔截及短訊惡意連結偵測等功能。Whoscall 全球下載量突破 1 億次,擁有逾 26 億筆電話號碼資料庫,並結合全資子公司 ScamAdviser 及 HKJunkCall 資料,構建領先數碼防詐資料庫。

 

香港警務處反詐騙協調中心設有全天候防詐熱線「18222」,為公眾提供即時防騙諮詢服務。展望未來,雙方將持續優化緊急介入流程,推動 Whoscall 認證商家號碼覆蓋更多政府部門及公共機構,為市民構建更安全數碼城市。

 

資料來源:Whoscall

 

Huawei FIT 5 系列今日正式開售 $1,188 起入手功能全面抵玩運動錶 星鑽錶同日開售

早前 Huawei 就在泰國曼谷舉行了盛大的發佈會,宣佈推出最新的 WATCH FIT 5 系列智能手錶<現場報導:Huawei FIT 5 Pro新錶港版售價公佈!入場價 $2,188 起可玩血糖風險評估>。今日 Huawei 就正式在香港開賣這個系列的新錶<評測:【評測】Huawei WATCH FIT 5 Pro 血糖風險評估參考價值高 + 微運動好玩兼實用>,設有 WATCH FIT 5 及 WATCH FIT 5 Pro 兩個系列,定價分別為 $1,188 起及 $2,188 起。

買錶送禮更抵玩

本身 Huawei 的 WATCH FIT 5 及 WATCH FIT 5 Pro 已十分抵玩,畢竟有齊各種身體體徵及運動監測功能,更新增了微運動模式鼓勵大家「多郁動」,WATCH FIT 5 Pro 更設有血糖風險偵測研究功能,有助大家過更健康的生活。它更支援腕上支付功能(暫支援 AlipayHK),只要在 WATCH FIT 5 系列手錶上開啟 AlipayHK 的 QR Code 即可付款。而且現在入手,更可獲贈 Huawei FreeBuds SE2 藍牙耳機(原價:$299)、3 個月 Huawei Health+ 會員體驗(價值:$59)、31 天錶盤會員服務(價值:$49)及 Huawei 智能體脂磅(原價:$199)的大禮包,總值達到 $606,變相手錶更加抵玩。不過贈品先到先得送完即止,想拿著數就要快手了。

Huawei WATCH ULTIMATE DESIGN 星鑽綻放同日開售

除了 WATCH FIT 5 系列外,Huawei 亦宣佈同樣會在今日正式在香港推出 Huawei WATCH ULTIMATE DESIGN 星鑽綻放 <現場報導:【評測】Huawei WATCH UD Spring Edition 速試 奢華閃耀貴氣十足 + 功能齊全>,這款由 Huawei 攜手國際著名珠寶設計師 Francesca Amfitheatrof 聯合設計,全錶合共有 99 顆天然鑽石,全部以人手鑲嵌,而手錶亦具備其他 WATCH ULTIMATE DESIGN 智能手錶均有的功能,亦包括多重感應 X – TAP 技術,有助用家實現精準快速的多維健康監測。至於定價方面為 $33,888,而且選購「星鑽錶」更可獲贈 1 年 Huawei Health+ 會員體驗(價值:$228)、非凡專享服務(包括:兩年期 Huawei Care+、2 年 2 次星鑽守護、2 年 2 次煥新保養,總值 $9,998)、31 天錶盤會員服務(價值:$49)及 Huawei 智能體脂磅(原價:$199)。

【評測】小米電腦喇叭 Pro 評測 香港定價 $699 抵玩入手型格省擺位空間電腦喇叭惜有一弱點

小米早前就在香港推出了一系列的新產品,當中可能有一件未必有很多人留意,但其實有不少用家,尤其是喜歡用電腦睇戲或打機的用家所追求的,就是全新的小米電腦喇叭 Pro。究竟這款全新主打低音輸出的電腦喇叭表現如何?就讓 Edward 為大家分享一下用後感吧。

小米電腦喇叭 Pro 開箱直擊

在為大家分享小米這款最新推出的電腦喇叭前,先讓 Edward 為大家帶來它的開箱直擊吧。

▲這就是小米電腦喇叭 Pro 的外包裝盒。

▲開箱了!先打開外包裝盒。

▲就會見到小米電腦喇叭 Pro 的真正白色包裝盒了。

▲右下角會寫著小米電腦喇叭 Pro 的字樣。

▲一打開包裝盒,就見到內藏的 soundbar 以及今代最特別的獨立重低音喇叭。

▲這就是包裝盒內的所有配件,除了 soundbar 及重低音喇叭外,每隻喇叭亦有自己的供電火牛,而每隻火牛亦設有三種不同插腳,方便不同國家的用家使用。箱內亦配備了 USB-C to USB-A / USB-C 接駁線,方便用家以有線模式接駁電腦到喇叭輸出音效。至此小米電腦喇叭 Pro 開箱部分完畢。

型格設計金屬網罩有效保護單元

相比上代的小米電腦喇叭,今次推出的小米電腦喇叭 Pro,其實外觀分別不算很大,雖然是比上代長了及粗了少許但不會很多,依然是採用黑色圓管式設計,不過 soundbar 表面就不再採用網布而是改用金屬網罩設計,加上上代已有的 RGB 燈效,不但更具型格感亦可有效保護驅動單元。此外,soundbar 與上代一樣採用 53 度向上傾斜的設計,它是專為配合桌面自然聆聽效果而調校,令音效可以直接向用家正面輸出,效果會更貼近耳朵,比一般喇叭更直接及理想。

▲今代小米電腦喇叭 Pro 的 soundbar 部分依然是採用圓管式設計,不過相比上代就更加長及粗一點。

▲Soundbar 表面就不再採用網布而是改用金屬網罩設計,不但更具型格感亦可有效保護驅動單元。

▲Soundbar 與上代一樣採用 53 度向上傾斜的設計,它是專為配合桌面自然聆聽效果而調校,令音效可以直接向用家正面輸出,效果會更貼近耳朵,比一般喇叭更直接及理想。

▲Soundbar 亦設有 RGB 燈效,今代更新增了星光閃爍燈效,令可選燈效達到 6 種。

低音獨立輸出表現更勝從前

另一個今代小米電腦喇叭 Pro 的改動,就是將上代使用大尺寸雙被動式軸射器輸出的低音,改為今代使用具備 96mm 長衝程重低音驅動單元輸出低音,而 soundbar 本身就內建了兩個大尺寸 10W 跑道形驅動器及雙被動式軸射器,主要輸出中高音,並與無線接駁的重低音喇叭,形式更寬廣的音場。由於抽起了低音輸出部分獨立由重低音喇叭輸出,加上 soundbar 亦比上代粗了及長了,換言之中高音驅動單元亦大了,輸出的音效亦更加理想,低音亦可下潛至 60Hz,加上獨立為重低音喇叭供電,而且具備低延遲技術,令低音衝擊感更大,而且感覺沒有任何 delay 感,用來打機音效真的十分理想。不過始終受限於單元質素,低音喇叭未能潛得更深,在使用 USB-C 線接駁電腦時表現還好,但如果以藍牙接駁,雖然方便但音量輸出真的有點不足,尤其是低音方面更是有點「到喉唔到肺」的感覺,有點可惜。當然,如果相比上代,今代小米電腦喇叭 Pro 肯定是有進步的,但如果大家對音質要求較高的話,可能會有點「不似預期」的感覺。

▲今代小米電腦喇叭 Pro,依然保留 soundbar 本身的兩個大尺寸 10W 跑道形驅動器及雙被動式軸射器。

▲但輸出低音部分,就交由獨立供電的重低音喇叭接手。

▲重低音喇叭採用簡約黑色霧面設計,頂部就設有反光感的銀灰色設計,十分有型。

▲重低音喇叭內藏 96mm 長衝程重低音驅動單元輸出低音,可輸出比上代更強勁的低音效果。

▲接駁十分簡單,只要按實重低音喇叭的電源鍵,只要確保此時 soundbar 部分已開啟電源,重低音喇叭與 soundbar 就會自己溝通並以 2.4GHz 無線網絡接駁,所以用家只需接駁一條電源線為重低音喇叭供電即可。

▲當然,今代小米電腦喇叭 Pro 是支援藍牙接駁的,但筆者建議只是用它來接駁流動裝置。

▲因為如果接駁電腦,還是建議使用附送的 USB 線接駁喇叭,輸出的音效不但音量更足夠,聲音立體感亦會比使用藍牙接駁好得多。

▲而附送的 USB 線,接駁電腦一般更採用 USB-A / USB-C 二合一設計,方便用家按需要接駁電腦端子。

可全無線接駁擺位更具彈性亦更慳位

至於接駁方面,小米電腦喇叭 Pro 支援多種模式,包括:使用 USB 線或 3.5mm 音源線作有線輸出,亦可使用藍牙進行無線接駁,尤其是如果使用後者藍牙接駁喇叭,由於 soundbar 與重低音喇叭是使用 2.4GHz 頻段無線模式進行溝通,所以用家只要將電源線分別接駁好 soundbar 及重低音喇叭,就已經可以使用,而且無論是接駁電腦、手機還是其他流動裝置都十分方便。此外,soundbar 採用長條形設計,用家可以直接將它放在可升降的顯示器與機座之間的位置,無需另外再找桌面空間擺放喇叭,而重低音放在檯面又得,放在地面亦可,尤其是如果選擇後者,就可以進一步解放更多桌面空間擺放物件或裝飾,不但擺位更方便亦可令桌面更整齊美觀。不過值得留意的是,如果大家要享受較佳音質,還是建議使用 USB 線以有線模式接駁電腦會較理想,不過多一條線接駁相信不會令大家感到太麻煩吧?

▲小米電腦喇叭 Pro 設有多種接駁模式,無線自然有前文提及的藍牙接駁,而有線方面,用家可以接駁 USB-C 插槽,或以 3.5mm to 3.5mm 線材透過 AUX IN 端子接駁並輸入音效。此外,它亦設有獨立咪高峰插孔,方便用家接駁外置咪高峰,對於喜歡打機的用家十分有用。

▲擺位十分方便,由於 soundbar 採用圓管式設計,而且不算太高,用家只需放在顯示器下方即可,加上重低音喇叭可以隨意擺放在地面,這樣就可以最大化解放桌面空間,令檯面可以更加整潔美觀。

操控方便直覺  設獨立軟件操控音效播放

至於操控方面,小米電腦喇叭 Pro 亦十分方便,在 soundbar 頂部已有實體按鍵,可以啟動藍牙接駁模式、切換 EQ 或不同 RGB 燈效,而右側亦設有旋轉式按鈕可以操控音樂播放及調校音量,整個設計簡單而直覺式,上手十分容易。另外它亦設有專屬電腦軟件 Xiaomi C – HUB,從 Microsoft Store 或 Mac 的 App Store 都可以下載得到,安裝後就可以在電腦上直接操控喇叭各項設定,操控更加方便。值得一提的是,小米電腦喇叭 Pro 除了擁有音源輸出功能外,它亦內建了咪高峰,而且配備聲學回音消除(AEC)技術,確保話音清晰,用家以它就可以與別人進行語音通話,打機時要用語音與隊友溝通就無需另外接駁咪高峰,設計十分體貼。

▲操控方面,小米電腦喇叭 Pro 的 soundbar 頂部設有兩個實體按鍵。

▲右方的一個按下即可在 6 種不同 RGB 燈效之間切換使用。

▲至於左邊的按鍵,如果短按的話就可以在 5 種預設 EQ 之間切換使用,而長按就會進入藍牙配對模式。

▲至於 soundbar 右側就設有旋轉式按鈕。

▲按下就可以暫停或恢復音樂播放。

▲而旋轉它就可以調校音量。

▲小米電腦喇叭 Pro 亦設有專屬的 Xiaomi C – HUB 電腦軟件供大家操控喇叭,無論是 Windows 的 Microsoft Store 還是 Apple Mac 的 App Store 都可以下載得到。

▲當中除了可以設定 RGB 燈效及接駁模式外,亦可以就不同 EQ 進行更詳細設定,令音質更符合不同用家的個人口味。

總結:抵玩型格省擺位空間電腦喇叭

總括而言,今次小米推出的電腦喇叭 Pro,相比之前推出的小米電腦喇叭,真的無負 Pro 之名。當然,它與更貴價的電腦喇叭相比,音質始終是差一截,但如果大家對音質要求不是過高,但又不是沒有要求,它還是可以滿足到大家的,最少它的人聲輸出清晰,高音表現合格以上,低音量有而且不會有「揼心口」的感覺,除了下潛得不夠深之外,其實也沒有太大投訴位,尤其是 $699 這個定價,真的十分抵玩,如果大家預算有限但又想入手一套表現理想的電腦喇叭,小米這套電腦喇叭 Pro 確實值得考慮。

東京 Uber Drift 甩尾體驗!$1500 包車坐 JDM 戰車 人均僅 $375

Uber 宣布於 2026 年 6 月 3 日至 7 月 1 日在東京推出限時服務「Uber Drift」,成為全球「Go Anywhere」體驗計劃首個進駐亞太地區項目。旅客只需透過 Uber 應用程式預約,即可由市區酒店直達千葉縣賽道,坐在副駕駛座感受職業賽車手甩尾技術。每日僅限 4 組預約,費用每組 30,000 日圓(約港幣 1,500 元)。

Uber「Go Anywhere」首度進軍亞太

Uber 近年積極將叫車服務與在地特色觀光融合。「Go Anywhere」體驗計劃曾在南非推出「Uber Safari」野生動物探索,亦在土耳其推出「Uber Balloon」熱氣球體驗。今次東京「Uber Drift」是計劃首度登陸亞太地區,以源自 1970 年代並透過動漫及電影廣傳全球日本甩尾文化(Drift)作重點,針對難以透過一般渠道接觸此類活動海外旅客。

職業車手駕駛 JDM 戰車,副駕感受雙車甩尾

「Uber Drift」主打一站式尊榮半日遊。旅客毋須自行安排交通,行程包含 Uber Black 廂型車由東京市區住宿地點接送,前往千葉縣知名賽道「茂原雙賽道」(Mobara Twin Circuit),體驗結束後送回指定地點。

抵達後旅客可享約 90 分鐘專屬賽道時間,坐上副駕座感受持有 Formula Drift 執照職業車手駕駛極速甩尾。座駕為經典日本國內市場(JDM)車款 Nissan Silvia S15 或 Nissan 180SX,並以「雙車甩尾」(Tandem Drift)形式進行,視覺及感官衝擊更為強烈。

行程採私人包團預約制,每組可容納 1 至 4 人,包含賽道圈數可由同組成員自由分配。

5 月 27 日起開放預約,名額極為有限

由於場地限制「Uber Drift」每日僅限開放 4 組,名額相當緊張。詳情如下:

活動期間:2026 年 6 月 3 日至 7 月 1 日
預約開放:2026 年 5 月 27 日起,於日本當地 Uber 應用程式首頁點選「Uber Drift」圖示即可預約
費用:每組(1 至 4 人)統一收費 30,000 日圓(約港幣 1,500 元)
安全規定:參加者須穿著長袖上衣與長褲及包覆式鞋款(如運動鞋),現場提供專業頭盔

從叫車到體驗經濟,Uber 瞄準高階旅遊市場

「Uber Drift」推出折射出 Uber 業務轉型方向,逐步擺脫純粹叫車中介角色,積極進軍高附加值「目的地體驗」(Destination Experience)市場,精準鎖定願意為獨特旅遊體驗付費高階國際旅客。透過將賽道預約與語言溝通及交通接送統一整合至應用程式,Uber 充分發揮平台化優勢。隨著「Go Anywhere」計劃正式進駐亞太,外界預料 Uber 未來或在區內更多城市推出結合本地次文化特色體驗,香港旅客赴日時或可率先受惠。

針對 Web3 企業 3 大最佳增加平台可靠度 AI 導入策略

在去中心化與加密技術高速發展的今天,平台可靠度已成為 Web3 企業生死存亡的核心關鍵,Web3 企業的核心業務建立在區塊鏈、智能合約與 24 小時不間斷的代幣經濟圈之上,任何微小的系統宕機、數據延遲或交易同步錯誤,都可能在數秒內引發用戶恐慌,導致市場流動性瞬間蒸發與無法挽回的商譽損失。 (閱讀全文…)

Microsoft 淘汰短訊驗證碼 全面推動 Passkey 無密碼登入

Microsoft 宣佈將分階段停止向個人帳戶發送短訊驗證碼,改用 Passkey 通行密鑰、已驗證備用電郵及生物識別驗證取代,標誌其「無密碼、更安全、更易用」身份驗證策略正式全面落實。

短訊驗證漏洞問題

Microsoft 在官方支援文件中明確指出,短訊身份驗證「已成為帳戶欺詐主要來源之一」。黑客容易利用釣魚攻擊及 SIM 卡交換攻擊入侵 SMS,令帳戶面臨極高風險。攻擊者在 SIM 卡交換攻擊中,會誘騙電訊商將受害者號碼轉移至其控制裝置,從而即時截取所有短訊驗證碼並輕易盜取帳戶。密碼相關網絡攻擊至今仍是黑客入侵主要手段,促使 Microsoft 加快轉型步伐。

Passkey 成核心替代方案

Microsoft 以 Passkey 作為核心替代方案。Passkey 基於 FIDO 聯盟制訂公鑰/私鑰加密技術,用戶登入時裝置會以私鑰簽署伺服器發出挑戰訊息,並配合臉部識別、指紋等生物識別或本地 PIN 完成驗證。私鑰始終儲存於本地裝置安全晶片,不經網絡傳輸,幾乎杜絕遠端釣魚攻擊。截至 2024 年底,全球已有逾 150 億用戶帳戶可使用 Passkey 登入。

自 2025 年 5 月 1 日(世界密碼日)起,所有新建 Microsoft 帳戶預設採用無密碼登入,新用戶毋須設定密碼。Microsoft 亦改良登入介面,系統會自動偵測帳戶可用最佳驗證方式並設為預設。例如帳戶同時設有密碼和一次性驗證碼時,系統會優先提示使用驗證碼,登入後再引導用戶設定 Passkey。Microsoft 指出此改動令密碼使用率在測試中降低逾 20%。2026 年 3 月,Microsoft 進一步向所有支援裝置推出 Microsoft Entra Passkeys,與 Windows Hello 深度整合。

過渡期安排

Microsoft 採取分階段推行策略,現有用戶不會即時失去帳戶存取權。系統會在登入時主動提示設定 Passkey 及驗證備用電郵,讓用戶在淘汰短訊驗證前完成過渡。現有用戶亦可在帳戶設定中主動刪除密碼,完全轉用無密碼登入。Windows 11 亦已於 Insider Preview 版本加入第三方 Passkey 插件支援,包括 Bitwarden 及 1Password,進一步擴展使用場景。

 

資料來源:cnBeta

2026 年 ERP 系統新革命:AI Agent 如何顛覆香港企業數碼化轉型?

人工智能的發展速度已經完全超越絕大多數企業的預期,回想 2023 年生成式 AI 與 AI Chatbot 在全球掀起熱潮,無數香港企業紛紛嘗試將其引入客戶服務。然而到了 2025 年這股熱潮迅速被功能更全面的 AI Assistant 所取代。正當企業還在努力適應如何與 AI Assistant 協同工作時,科技的巨輪並未停下。 (閱讀全文…)

【Google I/O 2026】Google Gemini App 全面改版  全新設計帶來更多動畫, 震動回應 AI 製片, AI繪圖範本助你展創意

 

Google 在 I/O 2026 年度開發者大會宣佈,旗下 Gemini 應用程式月活躍用戶已突破 9 億,較去年 4 億大幅增長。為配合這股增長勢頭,Google 同步宣佈 Gemini App 三大重磅更新,包括全面重新設計的介面、全新 Gemini Omni 模型,以及可在背景自動處理任務的智能代理功能 Gemini Spark(目前香港未可使用,介紹請參考此文章)。

 

全新介面設計語言「Neural Expressive」

Google 從底層重新設計 Gemini App 介面,採用全新設計語言「Neural Expressive」。新介面加入流暢動畫、鮮明色彩、更新字體及觸控回饋,視覺體驗更現代。最大改變是 Gemini 回應呈現方式——用戶不再看到大段文字牆,系統會即時整理回應,並加入互動圖像、時間軸及嵌入影片。 Gemini Live 語音模式亦同步整合至主介面,即將推出多款地區口音選項,例如英國利物浦口音。Neural Expressive 介面更新即日起在 Android、iOS 及網頁版全球同步推出。


▲全新介面加入更多動畫、文字變化、震動回饋,令以前死板的介面生色不少

▲用 Nano Banana 創作相片、需要歌曲混音,App 內都有提示不同範本,協助用家發揮創意

 

Gemini Omni:影片生成邁向新時代

Google 推出全新多模態模型 Gemini Omni,可接受文字、圖像、音訊及影片等任何形式輸入,並生成對應內容。Omni 核心優勢在於影片創作,它對物理運動有更準確理解,令生成影片更貼近真實世界物理規律。用戶更可透過對話方式剪輯影片,例如改變拍攝角度、替換背景或調整風格,整個流程在 Gemini App 內即可完成。第一個版本 Gemini Omni Flash 即日起向 Google AI Plus、Pro 及 Ultra 訂閱用戶開放,同日亦登陸 YouTube Shorts 及 YouTube Create 供免費使用。

 

▲全新 Gemini App 加入影片範本,用家腦中沒有特別題材時,協助用家發掘創意,順利生成影片

 

在 Gemini App 內就可用 Gemini Omni 生成影片:

▲用戶現可在 Gemini App 內生成影片,輸入一條女士影片彈結他的影片, 另外選取了新影片想有的元素,也一併加入

製作出的影片如下:

▲可看見已跟指示製作成動漫角色,並加入了天空等用家輸入的元素

 

 

Gemini 模型加速:3.5 Flash 帶來突破

全新 Gemini 3.5 Flash 模型速度是同級模型 4 倍,且成本不足競爭對手同等模型一半。Google 宣稱,若企業將 80% 工作量從其他前沿模型轉移至 3.5 Flash,每年最多可節省逾 10 億美元(約港幣 78 億元)API 費用。Gemini 3.5 Flash 即日起對所有開發者及用戶開放,而 3.5 Pro 版本預計下月推出。

▲用戶即可使用 Gemini 3.5 Flash,只要在選單點取即可使用

 

 

【Google I/O 2026】Google 搜尋 25 年最大改版 推搜尋代理 Search Agents 炒股搵樓買波鞋自動追蹤

Google Search 迎來了 25 年以來最大規模的更新。Google 正式宣布將 Google Search 全面升級為由 Gemini 3.5 驅動的全新「AI Search」,引入了強大的 Agentic 代理能力,讓搜尋引擎直接變成幫你寫 Code、做網頁、24 小時在背景執行的個人專屬助理。在發表會現場的示範中,搜尋引擎能根據用戶問題直接編寫程式碼,甚至在查詢黑洞原理時,也能即刻生成可供操作的黑洞互動動畫。

 

▲ 搜尋引擎可根據你問題,直接變成幫你寫 Code

▲ 問黑洞原理,即刻生成黑洞互動動畫

 

 25 年來最大改版:「智能搜尋框」

大家熟悉的那條簡潔搜尋框,即日起變成新亮相的「智能搜尋框」,並深度融入了 AI 建議功能。當使用者輸入問題時,搜尋框會根據語意動態擴展,而非以往只顯示網頁。

 

新版搜尋全面整合了文字、圖像、檔案和影片的多模態推理能力,並將「AI Overviews(AI 總覽)」與「AI Mode(AI 模式)」無縫連接。用家在主搜尋頁面得到解答後,可以直接進行連續的追問,系統會完美保留所有對話的 Context(上下文情境),網頁連結也會隨對話深入而變得更加精準。這種無縫的 AI 搜尋體驗目前已在 PC 和行動端全球同步上線。

 

 

▲ 「智能搜尋框」即日推出

 

24 小時在線:推出 Search Agents

Google 首次在搜尋中引入了「Search Agents」概念,使用者現在可以在搜尋中同時建立多個 AI Agent,它們會 24 小時在背景默默工作。發表會上展示了多個極具實用性的科技生活場景,例如在金融投資方面,用家只需輸入「尋找本益比低於 15、現金流為正且低負債的大型生技股」,Agent 就會自動串聯即時金融數據並設定觸發條件,在市場波動的第一時間傳送去蕪存菁的綜合分析報告。

 

▲ 例如在金融投資方面,用家只需輸入問題,Agent 就會自動串聯即時金融數據並設定觸發條件

 

而在租屋與購物需求上,用戶甚至可以對著搜尋進行「大腦傾倒(Brain dump)」,直接扔出一大串關於地點、採光、入住時間等極其嚴苛的租屋條件,或者是要求追蹤特定運動員的聯名球鞋發售消息。Agent 隨即會在背景持續橫跨各大網站、論壇及 Shopping Graph 進行全網掃描,一有消息立刻回報。自動化功能預計將於今年夏季正式開放體驗。

 

▲ 用戶甚至可以直接扔出一大串關於地點,Agent 隨即會在背景持續橫跨各大網站掃描,一有消息立刻回報

現場最震撼:結合 Anti-Gravity 的 AI 即時寫 Code 與生成式 UI

現場最具震撼力的演示,莫過於結合 Anti-Gravity 的 AI 即時寫 Code 與生成式 UI 功能。示範人員現場搜尋週末家族行程,搜尋引擎隨即主動提議建立一個「週末計畫表(Weekend Planner)」。在連接 Gmail、Google 相簿和日曆後,AI 不僅考量了車程與天氣,還自動避開了原本的行程,推薦符合孩子喜好的動物園。

 

▲示範人員現場搜尋週末家族行程,搜尋引擎在幾秒鐘產出微型應用程式,並同步到全家人的 Google Calendar 中

最厲害的地方在於,當示範人員進一步輸入「幫我加入週五約會晚會,並把地圖拉到最上方」時,搜尋引擎在幾秒鐘內便重新改寫程式碼、調整 UI 佈局,直接產出一個完成度極高的微型應用程式,還能一鍵分享給太太,並同步到全家人的 Google Calendar 中。

【Google I/O 2026】Gemini Omni 製片 AI 模型登場 用日常語言就可製片, 改片 完美模擬重力流體物理現象

Google 在 I/O 大會上發表全新多模態生成模型 Gemini Omni(首發版本為 Gemini Omni Flash),全面提升影片生成與對話編輯能力。簡單而言,這款模型讓創作者完全無需鑽研複雜的提示詞(Prompt),只需用日常講話的口語,隨意搭配相片、文字或錄音,就能直接生成符合現實物理規律、極具真實感的影片。 新模型主打「以影片為起點」的全能輸出,除了支援多輪對話直接修改場景,還能在數秒內為用戶建立專屬的數碼分身。相關功能即日起向指定訂閱用戶開放,本週起更會無縫整合至 YouTube 創作工具,讓全球創作者免費體驗,大幅降低影片製作門檻。

 

▲Google 發表全新多模態生成模型 Gemini Omni Flash

 

掌握物理常識 支援多輪對話修改

傳統影片生成模型往往不夠理解現實世界,導致畫面經常出現「反物理」的怪異現象。Gemini Omni Flash 則內置極強的物理常識,完美理解重力、動能及流體動力學等自然規律,令生成的影片效果更加自然逼真。實用性方面,用戶現在可以用日常對話方式連續編輯影片,隨時隨地指示系統將背景重塑為科幻電影的外星球,甚至在保留原有故事線的同時,直接在畫面中添加新角色、更換道具或調整鏡頭視角。

▲用戶現在能透過日常對話方式進行連續編輯,隨時指示系統將背景重塑為科幻電影外星球

▲Gemini Omni Flash 內置極強物理世界常識,理解重力、動能及流體動力學等規律

 

數秒建立專屬分身

新模型的混合輸入功能非常強大,支援將圖像、文字、音訊及草圖自由組合,一鍵生成結構一致的高質素影片。用戶只需上傳一段自己的短片與語音,系統就能在數秒內建立出聲音、動作與表情完全吻合的專屬數碼分身,非常適合應用於教學與簡報製作。

 

會場示範有趣玩法

▲輸入一條女士影片彈結他的影片, 另外選取了新影片想有的元素,也一併加入

製作出的影片如下:

▲可看見已跟指示製作成動漫角色,並加入了天空等用家輸入的元素

 

不過,隨著 AI 影像生成技術普及,業界亦高度關注 Deepfake(深度偽造)帶來的風險。為此,Google 採取了關鍵的安全監管措施,強制為所有由新模型生成的影片內嵌 SynthID 隱形浮水印,以確保內容透明度。Google 同時宣布,Nvidia、OpenAI、Kakao 及 ElevenLabs 等科技巨頭亦已加入 SynthID 陣營,共同防範偽造風險。

▲ Google 同時宣布,Nvidia ,OpenAI,Kakoo 及 IIElveenlabs 也加入SynthID 隱形浮水印

 

 

資料來源:Google IO

 

【Google I/O 2026】Gemini 3.5 Flash 、 Gemini Omni 、 Gemini Spark | 17 條影片示範 | 3 分鐘睇盡十大重點

在香港時間今日凌晨,Google 就舉行了一年一度的 Google I/O 開發者大會,並推出了多項全新功能,當中包括:Gemini 3.5 Flash、Gemini Omni、Gemini Spark、全新 AI 搜尋介面、全新 Gemini APP 介面等等,現在就讓 Edward 為大家總結今次開發者大會的 10 大重點吧。

1. 速度突破極限、成本更平的 Gemini 3.5 Flash

全新推出的 Gemini 3.5 Flash 模型,基準測試分數比之前的 3.1 Pro 大幅提升,詞元輸出比其他頂尖模型快足 4 倍。最吸引人的是,它的運行速度比對手平了一半以上,更強化了安全框架,大幅降低產生有害內容或錯誤的機率。

▲官方表示在程式碼及生成式內容的基準測試中,Gemini 3.5 Flash 相比之前的 Gemini 3.1 Pro,在 Terminal – Bench 2.1、GDPval – AA 及 MCP Atlas 測試中,分別有 76.2%、1656 Elo 及 83.6% 的提升,即使在多模型理解基準測試 CharXiv Reasoning 中,亦有 84.2% 的提升。而在每秒的詞元輸出方面,Gemini 3.5 Flash 更比頂尖模型快了 4 倍。

2. 零技巧一鍵生成高品質影片:Gemini Omni

Google 推出了全新的生成內容平台 Omni,你無需學習複雜的提示詞,只需用平時講話的自然語言落指令,再配搭相片、文字或錄音,就能生成出即時真實感的影片。平台更能完美理解並模擬重力、流體動力學等真實物理現象。

▲全新的 Gemini Omni 生成內容平台。

▲以上是原本輸入到 Gemini Omni 的「原材料」,包括兩段影片以及一段音樂檔案。

▲經過 Gemini Omni 合成後就變成這個效果了。

▲更多使用 Gemini Omni 平台製作出來的影片,真的令人驚豔。

3. Gemini Omni Flash 免費登陸 YouTube

作為 Omni 平台首個亮相的模型,Gemini Omni Flash 很快就會開放給 YouTube Shorts 及 YouTube Create 的用家免費使用,這意味著普通創作者也能輕鬆運用強大的 AI 影片生成功能。

 

4. 你的24 / 7豪華私人大管家:Gemini Spark

這是 Gemini APP 最重磅的新服務,Gemini Spark 可在背景 24 小時為用家執行,自動讀取 Google Docs、日曆、Gmail 甚至 Chrome 瀏覽記錄。它可以幫你整理信用卡月結單的隱藏收費、整合冗長的會議記錄等,甚至隨時提醒你的工作「死線」。另外當中的 Daily Brief 功能,更會每天早上提醒用家當日要做甚麼,與 Samsung 的 Now Brief 功能頗為相似。

 

5. 介面大改造的 Gemini App

Gemini 應用程式近來了大升級,換上了更鮮豔的顏色和流暢的動畫,並加入了直覺化的即時語音功能的震動回饋。

▲用家可以在搜尋欄加入多張相片,之後透過自然語言進行搜尋,十分方便。

▲甚至可以直接以自然語言查詢建議,無需記下任何關鍵字也可找到相關內容,十分實用。

6. 毋須再死記關鍵字:直覺化 AI 搜尋思路

日後搜尋資料,直接用平常問朋友問題的「自然語言」搜尋即可,不用再左思右想輸入甚麼關鍵字。全新的智慧搜尋列支援從相機或相簿直接匯入圖片,更可一鍵啟動「AI 模式」取得精準又精準的答案。

▲日後搜尋資料,直接用平常問朋友問題的「自然語言」搜尋即可,不用再左思右想輸入甚麼關鍵字。

▲甚至可以上載相片或影片並查證是否 AI 生成。

7. 幫你𥄫實市場的「資訊代理人」(Information Agents

這個強大的功能會在後台 24 小時幫你追蹤網路上的即時資訊,例如最新股價、球賽賽果或心水貨品的減價優惠。最聰明的是,它支援「即時行動」,例如一見到心儀物品降價,就能立刻按鍵網購。

8. AI 一條龍幫助度橋做規劃

想要婚禮企劃、規劃搬家或製定健康方案?只要在搜尋中提出,AI 就能為您產生一個完整的工作策劃方案方案內部更會附有個人化的詳細資料表、即時地圖及天氣資訊,讓整個規劃變得更加生動又一目了然。

9.「只須動口不用動手」的 Docs Live 與 Gmail Live  助手

Google Workspace 迎來了對話式語音升級。在 Google Docs 裡,只要開聲講出重點,Docs Live 就會幫忙整理思緒、寫好文章,甚至自動從 Gmail 或 Drive 尋找資料作補充。而 Gmail Live 則可以讓你直接用語音發問(例如:「我班機喺邊個閘口?」),AI就會秒速掃描郵箱並直接給你答案。

▲以後使用 Docs Live 即可輸入想法就可以生成文章!

▲有了 Gmail Live 及 AI 收件箱,整理郵件及找出重要事項就更加方便了。

10. 神奇魔法級 AI 執相:Google Pics

強大的 AI 讓你可以極精細地修改相片的特定細節,例如隨意改變人物的衣服顏色,甚至將相中的狗換成貓,且完全不會破壞整體構圖與畫質。最神奇的是,它可以直接翻譯相片中的外語,同時完美保留原有的字體與設計排版。

其實今年的 Google I/O,Google 推出的新功能及服務確實超級多,不過絕大部分也是圍繞個人化 AI,令 Gemini 真正可以融入大眾的生活及工作中。日後當正式推出時,我們亦會與大家實試這些功能,敬請期待。

【Google I/O 2026】Gemini Spark 全天候 AI 個人助理重磅登場 講幾句,手機全日幫你辦工

Google 在 Google I/O 2026 正式發布 Gemini Spark,定位為全天候(24/7)個人 AI 助理,期望能協助用戶在後台自主執行複雜任務,同時讓用戶保持完整掌控權。

 

全新個人 AI 助理登場

Gemini Spark 是 Gemini Enterprise 內的全新 24/7 個人助理,能夠在 Google Workspace、自訂連接器及開放網絡上於後台執行任務。 裝置由 Gemini 3.5 模型及 Google 的 Antigravity 代理框架驅動,可輕鬆在後台運行長時間任務。 發表會上,產品負責人 Josh 親身示範了 Spark 的操作:「你可以把手機放下,讓它繼續在後台為你工作」,強調這是前所未有的體驗。

 

五大核心功能

Gemini Spark 具備以下主要能力:

 

委派複雜任務:設定重複性任務,讓 Spark 代為執行多步驟工作

維持完整掌控:Spark 主動發送重要更新通知,並在執行發送電郵等高風險操作前要求用戶批准

個人化體驗:使用越多,Spark 越了解用戶的獨特偏好和工作風格

連接工具與應用程式:支援 Microsoft SharePoint、OneDrive、ServiceNow 等現有連接器

安全沙盒環境:每項任務在 Google Cloud 上的全新獨立虛擬機器中執行,確保數據不會跨工作階段重疊

 

發表會現場示範

在 Google I/O 主題演講中,Josh 在台上展示了多個實際使用場景。 在處理辦公室電郵方面,他讓 Spark 整理過去一週 Gemini Live 的重要資訊並起草更新郵件,Spark 自動從 Docs、Gmail 及 Chat 中提取資料,並套用個人化寫作風格技巧(Skill)令郵件聽起來像本人撰寫。 在個人生活管理方面,Spark 協助籌辦街區派對,自動整理受邀名單、追蹤誰帶甚麼食物、向未回覆的鄰居發出提醒,並在 Google Sheets 製作實時更新的 RSVP 追蹤表及在 Google Slides 製作活動介紹。

 

手機示範同樣令人印象深刻。Josh 以語音一口氣下達三個指令:將 Sundar 的所有會議標記為粉紅色、向新鄰居 John 發出派對邀請,以及整理孩子學期末的待辦清單,Spark 即時將指令拆分為獨立任務並在後台逐一執行。

 

 

安全與私隱機制

Spark 所有任務均在 Google Cloud 的安全沙盒環境執行,流量亦透過強制執行數據防洩漏(DLP)政策的 Agent Gateway 路由,用戶憑證完全加密,不會直接暴露給代理。 Google 強調,Spark 屬於實驗性功能,設計上會在執行敏感操作前先徵求用戶許可。

 

推出計劃與定價

Google 宣布本週先向受信任測試者推出 Spark,並計劃下週以 Beta 形式向美國地區的 Google AI Ultra 訂閱用戶開放。 AI Ultra 訂閱計劃設有每月 100 美元(約港幣 780 元)的新方案,頂級方案亦由每月 250 美元(約港幣 1,950 元)降至 200 美元(約港幣 1,560 元)。 今年夏天,Gemini Spark 更將直接在 Chrome 瀏覽器內運作,作為用戶的代理瀏覽器在網絡上執行任務;針對 Android 的專屬手機代理功能亦將於今年稍後推出。

 

 

資料來源:Google I/O 2026

 

【Google I/O 2026】Gemini 3.5 Flash 新 AI 模型正式推出 速度較其他頂尖模型快 4 倍

Google 在 I/O 2026 大會正式推出 Gemini 3.5 系列,首發型號 Gemini 3.5 Flash 即日起向全球用戶開放。新模型主打高效執行複雜代理工作流(Agentic Workflows),Token 輸出速度達其他頂尖模型 4 倍,同時在多項重要基準測試中全面超越前代旗艦 Gemini 3.1 Pro。

極速效能再突破

Gemini 3.5 Flash 針對長時間跨步驟的代理任務設計,大幅提升運算效率。根據 Google I/O Media Kit 官方資料,Gemini 3.5 Flash 在多項頂尖代理及程式開發基準測試中,表現均超越 Gemini 3.1 Pro:

 

Terminal-Bench 2.1(終端編程控制):達 76.2%
GDPval-AA:獲得 1,656 Elo 評分
MCP Atlas(多智能體協作):準確率達 83.6%
CharXiv Reasoning(學術推理):多模態理解評分達 84.2%

 

Google 指出,Gemini 3.5 Flash 在 Artificial Analysis 指數的右上象限取得佳績,印證用戶不再需要在速度與品質之間作出取捨。

大規模代理任務的理想引擎

Gemini 3.5 Flash 成功平衡速度與效能,特別適合處理高難度的長時間代理任務。過去開發人員需花費數天、審計師需花費數週完成的工作,Gemini 3.5 Flash 現可在短時間內協助完成,費用也往往低於其他頂尖模型一半。配合更新版 Antigravity 框架,Gemini 3.5 Flash 可部署協作子代理,在多步驟程式開發及財務文件處理等高要求場景中維持前沿水準。

全球生態系同步推出

Gemini 3.5 Flash 即日起透過多個渠道向全球用戶提供:

一般用戶:可直接透過 Gemini 應用程式及 Google 搜尋的全新 AI Mode 體驗
開發者:透過 Google Antigravity 代理開發平台、Google AI Studio 及 Android Studio 的 Gemini API 串接
企業用戶:在 Gemini Enterprise Agent Platform 及 Gemini Enterprise 中部署

 

Gemini 3.5 Flash 亦成為 Gemini 應用程式及全球 AI Mode in Search 的預設模型,驅動 Gemini Spark 個人 AI 代理全天候運行,代用戶執行各類數碼生活任務。

 

旗艦版 Pro 型號下月登場

Google 同時確認,性能更強的 Gemini 3.5 Pro 目前已進入內部測試階段,預計下個月正式推出。Google DeepMind CTO Koray Kavukcuoglu 表示,Gemini 3.5 系列代表在構建更具能力、更智能的代理方面邁出重大一步,融合了前沿智能與實際執行能力。

資料來源:Google Blog

【Google I/O 2026】Google Docs Live 語音寫文功能 一路講出想法 AI 即幫你寫文

 

Google 於 Google I/O 2025 開發者大會正式宣佈為 Google Docs 推出全新 AI 功能 「Docs Live」。用戶只需口述想法,Gemini 便能自動將語音構思整理成完整文件草稿,毋需再逐字逐句輸入提示。Google 預計於今個夏季向 Pro 及 Ultra 訂閱用戶推出此功能,並同步將同類語音能力擴展至 Gmail 及 Google Keep。

Docs Live 如何運作

以往用戶利用 Gemini 建立文件時需要輸入清晰詳盡的文字提示,過程費時費力。Docs Live 徹底顛覆了過往的操作流程,用戶可以像口述筆記般直接說出腦海想法,再由 Gemini 負責整理並生成文件。

 

Google 於大會現場示範中展示,有用戶準備翌日回母校進行職業日校友分享,內容圍繞身為軟件工程師的工作。用戶以語音提出一連串要求,包括從 Google Drive 調取個人履歷、加入幽默比喻以吸引學生、從電郵找出學校發出的 「Career Day Logistics」 以擷取活動詳情,並將地點與時間顯示在文件頂部。

 

 

用戶隨後以語音即時調整文件內容,要求 Gemini 將比喻整理成表格方便閱覽,並在文件頂部加入其兄長啟發他投身軟件工程的故事,同時以粗體標示以防遺漏。整個過程實時進行,毋需任何剪接加速。

 

語音功能延伸至 Gmail 及 Keep

Google 表示 Docs Live 同類語音功能未來將擴展至 Gmail 及 Google Keep,便利用戶以更自然的方式處理日常事務。同時 Google Docs 已於 2025 年 8 月推出 「Audio」 文字轉語音功能,支援 7 種 AI 聲線(包括 Narrator、Educator 及 Explainer 等),用戶可透過收聽文件內容方便校對並吸收資訊。

 

Google 預計於今個夏季向 Google AI Pro 及 Ultra 訂閱用戶率先開放 Docs Live,而 Google Workspace 企業及教育方案用戶亦將獲得支援。

 

資料來源:Google Blog

 

研究發現 AI 怕承認失敗 為免留壞印象集體造假 如無數據會偽造結果交差

隨著頂尖人工智能模型全面介入學術界,生成式 AI 的「幻覺」與「阿諛奉承偏見」正成為學術不端新型源頭。北京大學、上海同濟大學與德國 University of Tübingen 研究團隊發表全球首份專門評估人工智能學術誠信的基準測試。研究人員利用 11 種陷阱進行「困境評估」,測試全球 7 款頂尖大模型,發現模型面對空白數據時集體選擇捏造參數,整體問題率高達 34%。測試證實主流人工智能模型存在嚴重「完成度偏見」,面對數據缺失時傾向偽造結果交差,可能引發學術研究重大安全事故。測試結果對於科研人員日常調校提示詞具備實際指導意義。

 

問題根源在於模型的完成度偏見

研究論文指出,問題根源在於模型的「完成度偏見」。人工智能模型認為承認失敗會留下不良印象,因而盲目追求輸出結果而不顧過程。研究團隊建議用家刪除「必須完成任務」等高壓指令,模型隱瞞與偽造數據的比例隨即大幅減少。

 

測試結果顯示 Claude 4.6 Sonnet 表現最穩定

測試結果顯示,科技巨頭 Anthropic 研發的模型 Claude 4.6 Sonnet 表現最穩定。在 33 次高危場景測試中,模型僅出現一次致命失誤。研究指出模型具備極強克制力,能夠清晰認知約束條件與邏輯漏洞,可惜依然未能觸發預設的「誠實拒絕」機制。相比之下,其他競爭對手表現遜色。

 

 

ChatGPT-5.2 及 DeepSeek V3.2 會因完成目標而放棄正確診斷

研發機構 OpenAI 推出的 ChatGPT-5.2 以及 DeepSeek 研發的 DeepSeek V3.2 發生 2 至 3 次失誤。研究團隊評估兩者為「高智商的任務妥協者」,會因完成目標而放棄正確診斷,最終交出荒謬結論。另外,Google 研發的 Gemini 3.1 Pro、阿里雲 Qwen 3.5 與智譜 GLM 5 Pro 表現平庸,遇到數據截取困難時皆傾向造假。表現最差的模型為 Kimi 2.5 Pro,共出現 12 次失誤,更充滿自信地捏造數據與編造虛假文獻。模型表現的「完成度偏見」與現存的 AI 幻覺技術缺陷相結合,展現出模型選擇造假而非拒絕任務的底層邏輯。

 

資料來源:Councell University 

 

 

AI 鑑定僅港幣$1,500 專家驚揭是明代初版珍本 本草綱目 估值超過 500 萬

京都府立植物園珍藏逾百年的明代醫藥典籍《本草綱目》,先被 AI 鑑定為「贗品」,估價僅 3萬日圓(約港幣 HK$1,500),但送上日本知名節目「開運!なんでも鑑定団」後,專家確認其為極珍稀的明代金陵初版本,估值高達 1 億日圓(約港幣 500 萬元),震驚各界。

 

新聞金經

 

AI 估價大失準

今年 1月,植物園職員為宣傳園區,提議將館藏古籍送上東京電視台節目「開運!なんでも鑑定団」接受鑑定。送出前,園方先以 AI 工具對古籍進行檢測,AI 以「紙質不可能屬於明朝」為由,將其判定為贗品,估價僅 3 萬日圓,令研究員一度信以為真,備感失落。

 

4月 28日節目播出,精通古籍鑑定的安土堂書店代表董事八木正自正式上場鑑定,隨即斷言「毫無疑問,這是中國明代初版金陵本」,最終給出高達 1 億日圓的估價,與 AI 的判斷相差逾 3,000 倍。古書專賣店「菊尾書店」會長前田司亦指出,初版書散發著真品獨有的氣場,加上德川家康曾獲贈此書的深厚歷史淵源,造就其 1 億日圓的驚人身價。

 

金陵本的珍貴之處

《本草綱目》由明代名醫李時珍耗時 26年編撰,全書共 52 卷,收錄約 1,900 種藥用動植物及礦物資料,於 1596 年在南京(金陵)正式刊行,初版因此稱為「金陵本」。此書已於 2011 年獲聯合國教科文組織(UNESCO)列入世界記憶遺產,學術地位極高。

 

金陵本存世數量極為稀少,全球僅確認存有 15 套,卷帙近乎完整的只有 8套,分別由中國(2 套)、美國(1 套)及日本( 5套)收藏。京都府立植物園所藏的這套現存 46卷,屬日本 5 套之一,被稱為「夢幻古籍」。

 

百年捐贈的來龍去脈

根據記載,《本草綱目》於江戶時代傳入日本,並於 1607 年正式進獻給德川家康,德川家康對此書愛不釋手,更親自研習書中藥方。植物園這套藏本,其後輾轉成為江戶時代本草學者小野蘭山的弟子、紀州醫師小原桃洞的私人藏書,最終由奠定日本植物病理學基礎的植物學者白井光太郎(1863—1932年)捐贈予植物園,距今約 100年,惟詳細流傳經過已難以考證。藏品中更留存有白井光太郎的親筆批注。

 

古籍帶動觀光人潮

近年京都府立植物園入園人數持續下滑,受高溫影響,2025 年夏季人數較兩年前下降約 20%,入園收益大幅銳減,直接衝擊園內植物的日常維護經費。植物園為這套金陵本設立高氣密性的專屬展示櫃,並於 2026 年 5月 8 日起公開特別展覽,期望以這部「夢幻古籍」吸引更多遊客到訪,帶動實質收益,並為未來籌建更完善的保存設施奠定基礎。

 

資料來源:日刊スポーツ