腾讯开源混元3D世界模型2.0:多模态驱动、高保真生成与
摘要
腾讯开源混元3D世界模型2 0:多模态驱动、高保真生成与交互式创作 腾讯正式开源了混元3D
腾讯开源混元3D世界模型2.0:多模态驱动、高保真生成与交互式创作
腾讯正式开源了混元3D世界模型的2.0版本。此次升级并非简单的功能增强,而是构建了一个能够理解文本、图像及视频输入的多模态系统。该模型能依据这些信息,自主完成从生成、重建到动态模拟的完整3D世界构建流程。其核心价值在于输出结果并非封闭数据,而是可直接导出为多种标准格式的3D资产,确保与主流游戏引擎及具身智能仿真管线无缝兼容,显著提升了工业级可用性。

该模型的核心优势在于其输出质量与工程友好性。它能够生成结构清晰、分层明确的高质量3D资产文件。对于开发者而言,这意味着获得了一个“开箱即用”并可深度编辑的素材库,能够直接导入Unity、Unreal Engine等开发环境或仿真平台,实现快速原型验证与交互式创作,从而大幅压缩从概念设计到可交互场景的开发周期。目前,该能力已通过其创作引擎官网对外开放,开发者可申请接入使用。
与上一代相比,2.0版本实现了架构与能力的全面革新。
首先,其底层模型架构经过彻底重构,带来了语义理解能力的质变。现在,模型能够精准解析复杂的多模态指令(例如结合文本描述与参考图像),从而一键生成风格多样、且允许用户自由漫游的三维环境。这标志着其从基础指令识别,进阶到了对创作意图的深度理解与执行。
其次,在视觉保真度方面,2.0版本实现了显著提升。无论是几何网格的精细度、物体表面的材质纹理,还是全局光照与阴影的真实感,都达到了新的水准。同时,模型支持预设生成风格,为开发者提供了从写实、卡通到特定艺术风格的灵活控制权。
除了静态场景生成,2.0版本新增的“角色交互模式”是一个关键突破。用户可以选择以第一人称或第三人称视角,直接操控虚拟角色在AI生成的场景中自由移动与探索。系统集成的物理引擎确保了移动、碰撞等交互行为符合真实世界逻辑,这为游戏玩法测试、虚拟空间体验评估提供了高效的解决方案。
最后,其高精度场景复刻能力同样突出。模型仅需输入一段单目视频或一组多角度图像,即可重建出细节丰富的数字孪生空间。这项技术为室内设计可视化、城市规划模拟、以及高危行业的虚拟安全培训等专业领域,开辟了全新的高效工作流。从数字娱乐到产业应用,3D内容的生产效率正被重新定义。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。