人工智能

騰訊首款混元 3D 世界模型　透過文字指令或圖片生成虛擬世界

作者

藍骨
發佈日期

2025-07-28
閱讀時間

4分鐘
字體大小

騰訊正式發佈混元 3D 世界模型 1.0，作為業界首個開源可沉浸漫遊、可互動、可仿真的世界生成模型，用戶只需一句話或一張圖片，幾分鐘內即可生成 360 度沉浸式虛擬世界。過去需要專業建模團隊數週才能搭建的 3D 虛擬世界，現在可在短時間內完成，為遊戲開發、VR、數碼內容創作等場景帶來革命性突破。

混元 3D 世界模型 1.0 的核心在於其創新的「語意層次化 3D 場景表徵及生成算法」。該算法將複雜 3D 世界解構為不同語意層級，實現前景與背景、地面與天空的智能分離，不僅生成視覺效果逼真的整體場景，還能輸出標準化的 3D Mesh 資產。

模型融合了全景視覺生成與分層 3D 重建技術，同時支持文字和圖片輸入，實現了高品質、風格多樣的可漫遊 3D 場景生成。生成的 Mesh 檔案兼容 Unity、Unreal Engine、Blender 等主流工具，用戶可對場景內元素進行獨立編輯或物理仿真，無縫銜接 AIGC 技術與傳統 CG 工作流程。

對遊戲開發者而言，混元 3D 世界模型極大簡化了 3D 場景構建流程。開發者只需輸入簡單指令，模型即可快速生成包含建築、地形、植被的完整 3D 場景。輸出的 Mesh 檔案可用於遊戲原型搭建或關卡設計，還能靈活調整前景物體、更換天空背景，滿足個人化創作需求。

無建模經驗的普通用戶亦可通過混元 3D 創作引擎，僅需一句話或一張圖即可快速生成 360 度沉浸式視覺空間。生成的場景可無縫導入 Vision Pro 等虛擬頭顯，帶來沉浸式體驗。

與全球領先的開源模型相比，混元 3D 世界模型 1.0 在文生世界、圖生世界的美學品質和指令遵循能力等關鍵維度均全面超越當前 SOTA 的開源模型。該模型的發佈標誌著騰訊從秒級生成單個 3D 資產，到一鍵打造可漫遊的 3D 世界，正逐步構建完善的 3D 內容生成生態。

目前，騰訊混元大模型已實現圖像、影片、3D、文本等在內的全模態開源，圖像、影片衍生模型數量分別達到 1,400 個和 1,600 個，混元 3D 系列模型社群下載量超過 230 萬，已成為全球最受歡迎的 3D 開源模型。

來源：騰訊

騰訊首款混元 3D 世界模型　透過文字指令或圖片生成虛擬世界

分享到 :

最新影片

Follow 我們 :