菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > AI教程 > 面壁智能发布 Eurux-8x22B 开源大模型:代码性能超越 Llama3-70B
辅助资源 AI模型 AI编程 大模型

面壁智能发布 Eurux-8x22B 开源大模型:代码性能超越 Llama3-70B

2026-05-02
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

面壁智能发布 Eurux-8x22B 开源大模型:代码性能超越 Llama3-70B 开源社区又迎来了一个重量级

面壁智能发布 Eurux-8x22B 开源大模型:代码性能超越 Llama3-70B

开源社区又迎来了一个重量级选手。面壁智能最新推出的 Eurux-8x22B 系列模型,凭借出色的推理能力,引起了广泛关注。这个系列包含 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO 两个版本,目标直指复杂问题求解的高地。

效果如何?官方给出了相当硬核的测试数据。在由180道真题构成的 LeetCode 编程测试,以及考验数理逻辑的 TheoremQA(相当于美国大学STEM课程水平)上,Eurux-8x22B 的表现均超过了参数量更大的 Llama3-70B。更有看点的是,它在 LeetCode 测试中甚至超越了闭源的 GPT-3.5-Turbo。这个成绩,足以让开发者们眼前一亮。

面壁智能发布 Eurux-8x22B 开源大模型:代码性能超越 Llama3-70B

那么,这套模型的底子从何而来?Eurux-8x22B 是在 Mixtral-8x22B 的基座模型上进行深度对齐训练得到的产物。它的激活参数为39B,并支持长达64K的上下文窗口。关键在于其训练数据——团队使用了专门为提升推理能力而设计的 UltraInteract 对齐数据集。

这套数据集可谓是“推理特训营”。它规模庞大且质量精良,汇聚了涵盖数学、编程和逻辑推理等核心领域的12个开源数据集精华,最终整合了约86K条指令和220K个偏好对,数据总量达到五十万条左右。正是基于这样的“养料”,模型才锤炼出了超越同侪的推理本领。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多