2025全球AI贡献榜单:阿里位列前三,权威解读与深度分析
摘要
斯坦福大学人工智能研究所《2026年人工智能指数报告》指出,中美在尖端大模型技术上的
斯坦福大学人工智能研究所《2026年人工智能指数报告》指出,中美在尖端大模型技术上的差距已基本弥合。报告数据显示,双方顶尖模型在核心性能上已难分伯仲。在全球最具影响力的模型贡献榜单中,阿里巴巴排名第三,并且是贡献关键模型数量最多的中国企业。尤为显著的是,在全球前20大AI研究机构中,中国机构占据11席,数量上首次超越美国,位列第一。

该报告由斯坦福大学自2017年起每年发布,汇聚了全球学术界、产业界及政策制定者的专业洞察,旨在对人工智能的技术演进、经济价值与社会影响进行深度评估,被业界视为衡量AI发展态势的权威基准。
细分评测能力突出
报告在多个专项能力评估中,均记录了中国模型的卓越表现。以阿里巴巴的通义千问系列为例,其评测数据极具参考价值。
在评估真实工作流中工具调用与智能体交互能力的τ-bench基准上,Qwen3.5实现了68.4%的任务成功率,排名全球第三。这项成绩标志着模型已超越单纯的语言理解,具备了有效调度外部工具以执行复杂指令的“智能体”雏形能力。
在衡量小语种性能的HELM阿拉伯语测试中,Qwen3以0.79的平均得分(Mean Score)位居中国模型榜首,跻身全球最擅长阿拉伯语的大模型行列。这突破了AI能力长期集中于主流语言的局限,展现了技术普惠的切实进展。
在考察多学科知识整合与复杂逻辑推理的MMLU-Pro基准测试中,Qwen3.5以87.8%的准确率,与Gemini 3.1 Pro、Claude Opus 4.6等国际顶级模型并驾齐驱,充分验证了其综合认知能力的顶尖水平。
开源领域的中国引领
报告同时着重分析了2024年以来全球开源AI生态的迅猛扩张。数据显示,GitHub平台上的开源AI项目数量已超过560万,而Hugging Face社区的模型托管量在两年内增长至原先的三倍。
在这场开源浪潮中,以阿里巴巴、DeepSeek为代表的中国力量扮演了关键角色。截至目前,阿里通义千问大模型系列已开源超过400个模型,全球基于其进行二次开发的衍生模型数量超过20万,累计下载量突破10亿次,构成了全球规模最大的开源模型矩阵。据悉,千问3.6系列也将有新的开源版本发布。
开源已演变为驱动AI技术快速迭代、构建行业标准与生态的核心引擎。中国科技公司在这一领域的深度投入与主导作用,为全球开发者社区提供了关键基础设施,也预示着未来技术路线将更加多元与开放。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。