菜鸟游戏网 - 游戏让生活变快乐! 全站导航 全站导航
AI工具安装教程 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

您的位置 : 资讯 > 其他资讯 > 壁仞科技完成智谱新一代旗舰模型适配

壁仞科技完成智谱新一代旗舰模型适配

来源:菜鸟下载 | 更新时间:2026-04-26

4月8日,大模型领域传来重磅更新:智谱正式上线并开源了新一代旗舰模型GLM-5 1。这一迭代

4月8日,大模型领域传来重磅更新:智谱正式上线并开源了新一代旗舰模型GLM-5.1。这一迭代版本的最大看点,在于其针对“长程任务”的处理能力取得了显著突破,无疑将拓展模型在实际应用中的边界。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

硬件适配的速度,往往最能反映一个生态的活力。就在模型发布的同一天,壁仞科技便宣布,其壁砺166系列产品已完成对GLM-5.1的适配,成为国内首批支持该模型的国产GPU厂商之一。这个速度,本身就颇具信号意义。

“全栈深度优化”如何落地?

面对GLM-5.1引入的744B混合专家(MoE)架构、200K超长上下文以及DSA稀疏注意力等核心新特性,简单的兼容显然不够。根据官方透露的信息,壁仞科技的适配策略是全栈深度优化。其核心打法是,依托自研芯片的高算力底座,与BIRENSUPA软件栈进行算子级的深度协同。

具体而言,团队基于vLLM、SGLang这两大主流开源推理框架,对模型的几个关键瓶颈进行了精准优化。一方面,是针对40B激活参数与Interlea ve Thinking(交叉推理)模式进行了适配,从而确保在200K的超长上下文窗口下,依然能实现“无损推理”,保持模型的理解连贯性与准确性。

另一方面,为了将这种能力高效地转化为实际服务,一系列性能优化技术被组合运用。这其中,就包括了针对MoE模型的专家调度优化、对稀疏计算的专项支持,以及综合运用Tensor Parallel(张量并行)、Context Parallel(上下文并行)、MTP(模型张量并行)等多种并行策略。最终目标很明确:在提供超长上下文能力的同时,实现低时延与高吞吐,让大模型的“长记性”不以牺牲响应速度为代价。

菜鸟下载发布此文仅为传递信息,不代表菜鸟下载认同其观点或证实其描述。

展开
盗墓长生印荆轲破解版
盗墓长生印荆轲破解版
类型:动作射击 运营状态:公测 语言:简体中文
探险 独立游戏 经营
前往下载

相关文章

更多>>

热门游戏

更多>>