其他资讯
大模型
国产算力训练
美团LongCat-2.0大模型开放测试:国产算力训练,权威测评与新手入门指南
摘要
国内大模型领域近期迎来关键进展。《科创板日报》4月24日报道,美团新一代基础大模型Lon
国内大模型领域近期迎来关键进展。《科创板日报》4月24日报道,美团新一代基础大模型LongCat-2.0-Preview已启动邀请测试。该模型的核心突破在于其参数总规模达到万亿级别,标志着其技术能力正式进入全球第一梯队。

虽然官方命名尚未公布,但“万亿参数”与“混合专家架构”已清晰定义了其技术定位。业内评估认为,其综合性能已可对标GPT-4级别。更具战略意义的是,据知情人士透露,该模型的完整训练流程均依托国产化算力集群完成。若该信息得到证实,则表明美团在利用国产算力支撑万亿级大模型训练这一技术攻坚上,已取得关键性进展。
美团对算力体系的战略性投入此前已有明确信号。在今年初的财报会议上,创始人王兴首次系统阐述了公司的GPU资源战略。他确认了每年数十亿美元的持续投入以保障算力供给,并明确表示未来将进一步扩大投资规模,为大模型的长期研发构建坚实底座。这一前瞻性布局,为当前的技术突破提供了核心支撑。
美团的大模型技术演进路径清晰。去年9月,其首款自研大语言模型LongCat-Flash已实现开源发布。该模型同样采用混合专家架构,参数量达到5600亿。其技术亮点在于引入了“零计算专家机制”等创新设计,在维持极高推理效率的同时,显著优化了运营成本。LongCat-Flash的成功实践,为当前万亿参数模型的研发积累了关键的技术经验与架构验证。
来源:互联网
免责声明
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。