其他资讯腾讯

腾讯开源混元3D世界模型2.0：多模态驱动、高保真生成与

2026-04-18

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

腾讯开源混元3D世界模型2 0：多模态驱动、高保真生成与交互式创作腾讯正式开源了混元3D

腾讯开源混元3D世界模型2.0：多模态驱动、高保真生成与交互式创作

腾讯正式开源了混元3D世界模型的2.0版本。此次升级并非简单的功能增强，而是构建了一个能够理解文本、图像及视频输入的多模态系统。该模型能依据这些信息，自主完成从生成、重建到动态模拟的完整3D世界构建流程。其核心价值在于输出结果并非封闭数据，而是可直接导出为多种标准格式的3D资产，确保与主流游戏引擎及具身智能仿真管线无缝兼容，显著提升了工业级可用性。

腾讯开源混元3D世界模型2.0：多模态驱动、高保真生成与

该模型的核心优势在于其输出质量与工程友好性。它能够生成结构清晰、分层明确的高质量3D资产文件。对于开发者而言，这意味着获得了一个“开箱即用”并可深度编辑的素材库，能够直接导入Unity、Unreal Engine等开发环境或仿真平台，实现快速原型验证与交互式创作，从而大幅压缩从概念设计到可交互场景的开发周期。目前，该能力已通过其创作引擎官网对外开放，开发者可申请接入使用。

与上一代相比，2.0版本实现了架构与能力的全面革新。

首先，其底层模型架构经过彻底重构，带来了语义理解能力的质变。现在，模型能够精准解析复杂的多模态指令（例如结合文本描述与参考图像），从而一键生成风格多样、且允许用户自由漫游的三维环境。这标志着其从基础指令识别，进阶到了对创作意图的深度理解与执行。

其次，在视觉保真度方面，2.0版本实现了显著提升。无论是几何网格的精细度、物体表面的材质纹理，还是全局光照与阴影的真实感，都达到了新的水准。同时，模型支持预设生成风格，为开发者提供了从写实、卡通到特定艺术风格的灵活控制权。

除了静态场景生成，2.0版本新增的“角色交互模式”是一个关键突破。用户可以选择以第一人称或第三人称视角，直接操控虚拟角色在AI生成的场景中自由移动与探索。系统集成的物理引擎确保了移动、碰撞等交互行为符合真实世界逻辑，这为游戏玩法测试、虚拟空间体验评估提供了高效的解决方案。

最后，其高精度场景复刻能力同样突出。模型仅需输入一段单目视频或一组多角度图像，即可重建出细节丰富的数字孪生空间。这项技术为室内设计可视化、城市规划模拟、以及高危行业的虚拟安全培训等专业领域，开辟了全新的高效工作流。从数字娱乐到产业应用，3D内容的生产效率正被重新定义。

来源：互联网

上一篇 青岛保时捷女销冠牟倩文：从专业到真心，揭秘她持续登顶的三大销售心法 下一篇 诺和诺德与OpenAI达成战略合作，AI全面赋能药物研发与商业运营

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

腾讯开源混元3D世界模型2.0：多模态驱动、高保真生成与

摘要

腾讯开源混元3D世界模型2.0：多模态驱动、高保真生成与交互式创作

相关文章推荐