辅助资源
Qwen2-Math 开源AI模型发布:阿里通义千问家族新成员,数学能力超 GPT-4o
摘要
简介 阿里通义千问的Qwen2开源家族,最近迎来了一位专攻数学的“新选手”——Qwen2-Math。
简介
阿里通义千问的Qwen2开源家族,最近迎来了一位专攻数学的“新选手”——Qwen2-Math。这个系列包含15亿、70亿和720亿参数三个版本,本质上是在Qwen2大语言模型基础上,专门为解数学题而“特训”出来的模型。它的目标很明确:要在需要复杂多步逻辑推理的高阶数学问题上发力,为科研社区提供新的工具。从初步表现看,其数学能力不仅显著超越了众多开源模型,甚至在一些关键评测中对标乃至超过了某些闭源模型,比如GPT-4o。
性能
那么,这款“数学特长生”的实际能力究竟如何?团队在多项主流的数学基准测试上进行了全面评估。结果相当引人注目:其顶配版本Qwen2-Math-72B-Instruct,在数学解题能力上,实现了对一系列顶尖模型的超越。这其中包括了闭源领域的GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro,以及开源巨擘Llama-3.1-405B。这意味着,在当前的模型竞技场上,Qwen2-Math已经占据了数学能力的第一梯队。
正开发多语言模型
当然了,目前发布的Qwen2-Math模型主要专注于数学能力提升,并且初期仅支持英文语料。这显然只是第一步。根据官方信息,团队已经有了清晰的路线图:接下来计划推出同时支持英文和中文的双语模型,并且将开发更广泛的多语言版本。这对于全球范围内,特别是中文场景下的科研与教育应用,无疑是一个值得期待的消息。
来源:互联网
免责声明
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。