Google 在 I/O 2025 開發者大會上全方位展示 AI 創作工具的最新進展,推出全新 Imagen 4 圖像生成模型、進階影片 AI Veo3、拍攝助手 Flow,並公佈月費高達 250 美元(約港幣 HK$1,950)的旗艦級「Gemini Advanced with Ultra 1.5」訂閱方案,標誌 Google 正大舉整合 AI 至創作、設計與日常工作流程。
Imagen 4 作為最新圖像生成模型,在色彩、細節與構圖準確度上較前一代大幅提升。新模型強調光影與材質細緻度,能準確呈現水珠、光暈與金屬反光等細節。更重要的是,圖片生成速度提升 10 倍,讓用戶在反覆修圖過程中減少等待時間。當中配合 Gemini 編輯能力,亦能針對圖片局部進行精細修改,進一步提升創作靈活度。
另一項 Google DeepMind 最新一代的視頻生成模型 Veo3 則主打具備聲音輸出的高解析 AI 影片生成工具,支援 1080p 畫質輸出。它能理解自然語言提示,例如「延時拍攝的日落城市」,並轉化為具電影語言效果的片段。Veo3 具備模擬多種攝影技巧的能力,包括慢動作、空拍鏡頭、推拉鏡等,並能根據使用者提供的片段或圖片作風格化延伸。
Veo3 是目前 Google 最先進影片生成模型,內部數據訓練涵蓋數以萬計紀錄片與劇情影片,Google 指出 Veo3 曾經參與 Sundance 導演與其他創作人試驗,用戶反應積極。Veo 3 即日開始透過 Gemini App 和 AI 影片製作軟件 Flow 向美國的 Google AI Ultra 訂戶提供,企業用戶也可以透過 Vertex AI 平台使用新模型。
Flow 專為影片創作者與導演而設,是一套結合語音、手勢與手機操作的 AI 協作系統。用戶只需以語音說出「拍攝一幕人物步出咖啡店的片段」,Flow 即可根據預設鏡位、時間與環境,安排拍攝流程與角度。此系統會同步傳送指令至手機、穿戴式裝置或其他攝錄器材,用戶亦能利用手勢改變鏡頭方位或切換鏡頭畫面。Google 更開放 Flow API,讓其他設備製造商與軟件開發者整合至其裝置或應用程式中。這項技術預計將率先應用在 Pixel 裝置、智慧眼鏡以及某些拍攝硬件平台,例如 Instinct 等支援外掛模組的攝錄設備,未來亦可能延伸至 XR 或 AR 場景。
此外,Google 同場亦介紹全新訂閱方案「Gemini Advanced with Ultra 1.5」,月費高達 250 美元(約港幣 HK$1,950),定位專業與高端用戶市場。該模型可處理高達 1,000 萬個字元資料,並支援文本、圖片、影片與語音的跨模態處理,特別適合需要整合大量複雜資料的用戶,例如科研人員、程式開發者或內容分析專家。AI Ultra 用戶可以搶先體驗 Veo 3 新模型,並無限使用 Flow 和運算密集型的 Deep Research 等功能。
Gemini Advanced 將全面支援 Google 自家應用,如 Gmail、Docs、Sheets 與 Slides。用戶可透過 Gemini 助理自動草擬、修飾與摘要文件內容,提升工作效率。未來,Pixel 裝置將內建即時語音轉寫、錄音整理、搜尋摘要等功能,進一步鞏固 AI 對用戶日常工作與生活的支援角色。
相關文章:
AI 重要性將會超越火與電 Google CEO 預測真正 AGI 或在 2030 年實現 OpenAI o3 模型被指違抗指令 研究揭系統或已為達目標「自行篡改」代碼 Google 推搜尋引擎「AI 模式」 Gemini 2.5 模型全面強化 AI 策略
分享到 :
最新影片
