菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 资讯 > 云知声原生Agent大模型评测:国产第一梯队新势力
其他资讯 大模型 云知声 国产第一梯队新势力

云知声原生Agent大模型评测:国产第一梯队新势力

2026-06-09
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

云知声发布原生Agent大模型U2,基于快慢思考融合的MoE范式,近3000亿参数,实现长程编排与

▲鼠标点击烟花

▲多摆混沌系统模拟器

以上这些,都是用云知声最新发布的U2大模型做出来的。

今天,被称为“港股AGI第一股”的云知声,正式发布了其自研的通用大语言模型U2。这款模型最大的亮点,是跳出了行业里盲目堆参数、堆Token的内卷路径,基于一种叫“快慢思考融合”的MoE(混合专家)范式构建。它的核心进化方向很明确:用更小的参数实现更强的能力、用更少的Token完成更高的产出、用更低的算力换取更低的成本。

只看基准测试的成绩,U2就已经稳稳站进了国产大模型的第一阵列。

长上下文能力方面,U2在AA-LCR评测中拿下70分,在对比模型里排名最高,比第二名的MiniMax M2.5/M2.7还高出0.5分。在知识与推理的赛道上,U2也以87.9分的成绩领跑。指令遵循能力同样突出,IFBench得分77.3分,比第二名的GLM-5.1高出1分。

至于智能体能力,U2在SWE-Bench Verified评测中取得75分,排名第三。在Claw-Eval(pass@3)上,获得76.9分,仅次于MiniMax M2.5/M2.7。而在面向真实办公与知识工作交付能力的GDPval上,U2拿到72.5分,证明了它在专业办公场景里的扎实功底。

提到云知声,很多人脑子里蹦出的第一反应可能还是“那家主攻语音识别的公司”。但从2012年创业至今,它已经悄然完成了蜕变——如今,云知声是一家原生智能体大模型公司,在最合适自己的路径上,走得越来越稳。

一、自动生成俄罗斯方块,2分钟做出大宗商品研报

从云知声团队了解到的信息来看,现阶段衡量一个大模型的价值,已经不能再单纯盯着参数规模和内容生成长度。当AI真正进入到真实的工作流,用户关心的不再是模型能不能给出一个漂亮的答复,而是它能不能真正把任务完成。

正因为如此,U2从设计之初就不是一个为了聊天场景打造的通用模型。它是一个拥有近3000亿参数、面向任务执行的原生智能体大模型。

核心能力在于长程工作编排与自主纠错。这意味着,它像一位资深工程师一样,能把一个复杂的任务拆解成若干子步骤,按顺序执行,同时还能在过程中自我校验、自动修正。

拿编程来举例,U2不仅能完成后端逻辑,还能胜任前端全流程开发:从项目功能开发、页面布局到视觉方案设计,全都可以端到端落地。

假如让U2生成一个新产品发布的倒数页面,要求包含邮箱信息填写和各个平台联系方式的互动按钮。几乎没有反应时间,它就直接交付了一个内容清晰、可运行的页面。

这套长程编排与自主纠错机制,也让U2能够独立完成像虚拟系统、游戏这类完整应用的交付。比如,用户不需要输入完整的游戏逻辑,它就能自己搜索相关条件,生成一个符合要求、可玩度还不错的俄罗斯方块小游戏。

面对复杂的知识工作,U2同样不是靠简单的信息拼接来应付。它具备跨行业数据检索、多源信息清洗与专业文献深度结构化分析的能力,能够并行调用多个工具,把零散、异构的数据整合成有逻辑、有结论的分析结果。

一个非常考验它的任务:分析2026年5月原油、黄金、铜、农产品等大宗商品走势,结合地缘整治、供需关系、美元指数、库存数据,判断短期价格波动与中长期趋势。这不仅要深刻理解当下的地缘整治局面,还得弄清地缘整治与大宗商品的内在逻辑关系,需要扎实的历史和金融知识作为支撑。

面对这个综合性的金融难题,U2几乎没有反应时间,自动调取了所需的网页检索和分析工具,在一两分钟内就生成了一篇超过5000字、带数据表格的分析报告,展现出十分强大的深度结构化分析能力。

此外,U2还通过Agentic Harness(智能体编排框架)精准落地各项办公任务。不管是生成报告、分析数据,还是写周报月报这类琐事,它都能自动理解指令、编排执行路径,给打工人减轻不少负担。

用户只需要说一句“帮我写一下本周的周报”,U2就会主动梳理已完成事项、提取关键数据、调用docx技能,并且模型还会自动校验生成结果的准确度。从最终效果来看,U2输出的周报文档结构清晰、内容详实,拿来就能直接用。

二、不拼参数拼密度,云知声U2把每一个Token都用在刀刃上

U2模型的所有核心创新,最终都指向一个清晰的目标:让模型在真实的业务场景中,展现出超越其自身体积的智能与效率。

要实现这个目标,模型的高智能密度和高Token价值就成了关键。

云知声通过对高质量知识数据进行深度提纯,实现了知识点级的精准萃取与结构化编码,把冗余低质的信息彻底剔除。这样一来,小参数模型就能获得与超大规模模型相当的知识承载能力和智能表现。

U2采用高效稀疏架构,激活的参数量仅仅是总参数量的约十分之一。推理成本与激活参数规模线性锚定,这意味着在高并发场景下,它的成本优势会特别突出。

同时,通过优化语义表征与推理路径压缩,技术团队让模型单个Token承载的语义和信息量都远超传统模型。用更少的Token完成更复杂任务,大幅降低了企业部署的算力门槛和推理延迟。

传统的显式思维链虽然解释性很强,但往往需要生成大量的中间推理文本,导致更高的Token消耗和推理延迟。而隐空间推理,又可能在面对复杂任务时出现逻辑漂移,缺乏足够的可控性和验证能力。

因此,在复杂推理层面,U2引入了一个非常独特的机制:混合思考机制。

这个机制借鉴了人脑的解题方式:在输出之前,先在隐藏的表征中形成连续思考,在高维空间里同步探索多条路径,然后再映射到后续的显式推理中,避免了把全部中间步骤逐一展开。

具体来说,U2引入了可控隐空间展开(Bounded Latent Rollout)与熵感知切换(Entropy-aware Switching)机制。这让模型能够根据推理过程中的不确定性,动态调整自己的思考方式:当隐式探索趋于稳定时,模型保持高效推理;当不确定性升高、推理路径可能偏离方向时,它就会及时切换回显式思维链,通过确定性Token来完成精准推导和结果收敛。

这套设计,在保留多路径探索和可验证性的同时,还节省了约25%的思考Token消耗。

在任务执行层面,U2使用了Agent-Harness协同训练范式。它将模型的原生Agent能力提升与Harness迭代优化纳入到同一个训练闭环中:一方面,Harness根据U2的模型特点持续优化任务执行链路;另一方面,真实任务中产生的高质量执行轨迹,又会反过来强化模型的任务规划、工具调用、过程纠错和结果验收能力。

整体来看,U2的整个设计思路非常清晰:用更小的参数、更少的Token、更低的算力,在真实业务场景中交付稳定、可靠、可验证的智能结果。

三、端云协同叠加场景深耕,云知声走出大模型商业化样本

回顾云知声从2012年创立至今的发展历程,它走的是一条相当独特的道路。

在技术硬实力上,云知声拥有只有少数厂商才具备的全栈AI能力。它不仅能做云端,也能做端侧,实现了端云协同。和单纯的模型层厂商不同,云知声手里握着“芯片+算力+模型+应用”的完整链条。其自研的“蜂鸟”等系列芯片出货量已经超过亿颗,这使得它在端侧大模型的部署上优势明显。

在商业化壁垒上,云知声的产品已经广泛落地于智慧医疗、智慧交通、智慧生活及物联网(AIoT)等多个领域。

在智慧医疗领域,产品已经在近450家医院实现规模化部署,覆盖了病历生成与质控、辅助诊疗以及保险和医保监管等场景。在智慧交通领域,产品应用于深圳、广州、青岛等多地地铁及航空枢纽,提供智慧客服、语音购票和智能调度等解决方案。而在智慧生活与AIoT领域,通过“芯片+模型”方案,赋能智能家居、智慧座舱、智慧营销等场景,服务了众多行业头部企业。

这种在高价值B端场景中的扎根,让云知声成为了国产大模型公司里变&现能力最强、离盈利最近的那一个。

财报数据也正好证明了这一点。今年3月26日,云知声交出了一张“硬核成绩单”:2025年营收12.1亿元,同比增长29%;其中大模型相关收入达到6.1亿元,同比暴涨1076%,已经撑起半壁江山。更值得关注的是,亏损大幅收窄,全年经调整净亏损约1.3亿元,同比下降近25%,下半年更是大幅缩窄92%,几乎接近盈亏平衡。

受益于高质量场景Token需求的激增,云知声5月Token调用收入的ARR环比暴涨600%,预计6月将继续保持高增长,ARR达到1500万美元。

这意味着,其收入与客户使用AI的强度已经紧密关联,云知声业务的规模天花板已经被全面打开。

结语:跻身国产大模型第一梯队后,云知声再次捅破行业天花板

站在2026年6月的时间点回望,从2012年以语音技术起家,到2025年登陆港交所,再到上市一周年之际发布U2大模型,云知声用14年时间完成了一次从智能交互到AGI的跨越。

云知声的特殊性在于,它从未脱离过产业场景。长达十年的“云端芯”布局,让它积累了深厚的垂直行业Know-How。U2大模型发布后,立刻就能在智慧医疗、智慧交通、智慧座舱等场景中产生化学反应,成为真正的生产力工具。

U2的发布,不仅是一次自身的产品迭代,更是国产大模型走向成熟化、产业化进程中的一个缩影。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多