2024大模型权威榜单:阿里千问3.7测评,国产第一实力解析
摘要
Artificial Analysis最新发布的全球大模型综合性能榜单显示,阿里云最新旗舰模型Qwen3 7-Max以56
Artificial Analysis最新发布的全球大模型综合性能榜单显示,阿里云最新旗舰模型Qwen3.7-Max以56.6分的综合得分,超越Kimi-K2.6、DeepSeek-v4-Pro-Max及GLM5.1等国内主流模型,位列全球第五,稳居国产模型首位。其性能表现已逼近GPT、Claude、Gemini等国际顶尖模型的最强版本。

图说:Artificial Analysis官网截图显示,Qwen3.7-Max位列全球第五、国产第一
Artificial Analysis作为独立的第三方评测机构,其多维度基准测试与综合排名因客观性与系统性,已成为评估大模型技术实力的行业基准之一。阿里千问系列是该榜单的长期参与者,其前代模型Qwen3.6-Max-Preview曾在一个月前创下国产模型的最佳纪录。
此次,Qwen3.7-Max将这一纪录再次刷新。根据5月20日晚公布的数据,其得分较前代旗舰提升了4.8分,与GPT-5.4(xhigh)、Gemini3.1 Pro Preview、Claude-Opus4.7(max)等国际顶级模型的差距显著缩小。这一排名变化,标志着国产大模型在全球第一梯队中的技术竞争力实现了实质性突破。
Qwen3.7-Max的核心突破源于其明确的设计定位:专为“智能体”(Agent)场景优化。该模型在编程能力、智能体协同与复杂推理等关键维度实现了显著提升。它能够与Claude Code、OpenClaw等主流Agent框架深度集成,通过自主编程与工具调用,独立执行长达35小时、涉及超千次工具调用的复杂长程任务。这使其从对话工具演进为能够处理企业级复杂工作流、交付生产级成果的智能体基座模型。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。