云知声原生智能体U2评测:百步复杂工作流自主完成
摘要
云知声发布原生智能体大模型U2,突破了单轮对话局限,可自主拆解并连续推进超百步复杂
生成式人工智能正从单向问答工具快速进化为具备执行能力的“超级数字员工”。6月8日,云知声(9678.HK)正式发布新一代通用大语言模型U2。这款面向个人、开发者及企业组织打造的原生智能体(Agent)大模型,摒弃了传统模型依赖单轮对话的架构,技术主线聚焦于“高智能密度”与“高Token价值”的交付能力。
在企业级应用场景中,传统模型通常仅胜任短链路文本生成,面对复杂系统工程时力不从心。U2则重点强化了面向真实任务的连续执行闭环——在复杂办公、软件工程、深度研究及多工具协同等高难度场景下,它能像人类专家一样将宏观抽象任务自主拆解,并连续推进超过100步的复杂工作流,实现了从“被动响应”到“主动执行”的实质跃迁。
伴随新模型发布,多项国内外权威评测结果同步出炉。U2在多个关键维度直接跻身主流大模型第一梯队。在检验硬核知识与复杂逻辑推理能力的GPQA Diamond评测中,U2取得87.9分,超越GLM-5.1、Hy3preview、DeepSeek-V4-Flash(High)及MiniMax M2.7等众多强劲对手,证明其在高难度专业问题上具备稳定的输出质量。
除逻辑推理外,U2在办公场景中的交付质量同样表现突出。在面向真实办公与知识工作交付能力的GDPval评测中,该模型获得72.5分。不同于常规记忆型评测,GDPval侧重检验模型在企业生产环境中的实际产出。测试表明,U2已能成熟独立完成海量资料分析、专业报告撰写、复杂表格处理、图表动态生成及高质感幻灯片制作等一系列高价值办公任务。随着原生智能体大模型的常态化落地,AI驱动产业升级已进入更深层次的实践阶段。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。