产业资讯大模型云知声原生智能体U2

云知声原生智能体U2评测：百步复杂工作流自主完成

2026-06-09

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

云知声发布原生智能体大模型U2，突破了单轮对话局限，可自主拆解并连续推进超百步复杂

生成式人工智能正从单向问答工具快速进化为具备执行能力的“超级数字员工”。6月8日，云知声（9678.HK）正式发布新一代通用大语言模型U2。这款面向个人、开发者及企业组织打造的原生智能体（Agent）大模型，摒弃了传统模型依赖单轮对话的架构，技术主线聚焦于“高智能密度”与“高Token价值”的交付能力。

在企业级应用场景中，传统模型通常仅胜任短链路文本生成，面对复杂系统工程时力不从心。U2则重点强化了面向真实任务的连续执行闭环——在复杂办公、软件工程、深度研究及多工具协同等高难度场景下，它能像人类专家一样将宏观抽象任务自主拆解，并连续推进超过100步的复杂工作流，实现了从“被动响应”到“主动执行”的实质跃迁。

伴随新模型发布，多项国内外权威评测结果同步出炉。U2在多个关键维度直接跻身主流大模型第一梯队。在检验硬核知识与复杂逻辑推理能力的GPQA Diamond评测中，U2取得87.9分，超越GLM-5.1、Hy3preview、DeepSeek-V4-Flash（High）及MiniMax M2.7等众多强劲对手，证明其在高难度专业问题上具备稳定的输出质量。

除逻辑推理外，U2在办公场景中的交付质量同样表现突出。在面向真实办公与知识工作交付能力的GDPval评测中，该模型获得72.5分。不同于常规记忆型评测，GDPval侧重检验模型在企业生产环境中的实际产出。测试表明，U2已能成熟独立完成海量资料分析、专业报告撰写、复杂表格处理、图表动态生成及高质感幻灯片制作等一系列高价值办公任务。随着原生智能体大模型的常态化落地，AI驱动产业升级已进入更深层次的实践阶段。

来源：互联网

上一篇 AI巨头上市榜单：SpaceX、OpenAI、Anthropic迎来“阿波罗时刻” 下一篇 AI红利期PC组装商生存前景深度测评

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

云知声原生智能体U2评测：百步复杂工作流自主完成

摘要

相关文章推荐