阿里Qwen3.7-Plus多模态混合AI智能体发布
摘要
6月2日,阿里千问大模型正式发布Qwen3 7-Plus。从命名即可看出,这绝非常规迭代——核心定
6月2日,阿里千问大模型正式发布Qwen3.7-Plus。从命名即可看出,这绝非常规迭代——核心定位是多模态交互混合智能体,简言之,AI不仅能解析文字,还能识别图像、视频乃至屏幕画面,并据此执行具体任务。

Qwen3.7-Plus 是 Qwen3.7 的多模态升级版本。在延续原有文本处理、编码能力、工具调用及生产力工作流的基础上,重点强化了视觉理解、视觉推理与跨模态任务处理。这意味着AI从单纯的“文本对话器”进化为“能看会做的辅助工具”。
目前该模型已通过阿里云百炼提供API服务,用户也可在Qwen Studio上直接体验。它支持图像、视频、屏幕、网页及文本等多种输入格式,覆盖复杂的软件与办公场景——无论是图形用户界面(GUI)、命令行界面(CLI)还是各类工具环境,均能尝试完成操作。
在模型性能上,Qwen3.7-Plus 凭借 Vision Arena 的评测成绩,助力阿里跻身全球前5、中国第1。纯文本测试中,其表现接近Max级别模型,在编码智能体、通用智能体、推理、指令遵循及多语言任务上保持强劲水准。多模态测试方面,强化后的视觉推理、工具调用与任务执行链路优势显著,在BabyVision、MathVision、ScreenSpot Pro、OSWorld-Verified、AndroidWorld等基准评测中均取得明显提升。
了解更多:Qwen3.7-Plus——想得深,看得懂,做得到
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。