软件教程 AI编程大模型 DeepSeek教程

DeepSeek V4或将于农历新年推出，代码更新揭示未知大模型“MODEL1”

2026-01-22

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

1月21日最新消息，据科技媒体The Information月初披露，AI领军企业DeepSeek拟于2026年2月中旬、即农历新年假期期间正式推出其全新一代旗舰

1月21日最新消息，据科技媒体The Information月初披露，AI领军企业DeepSeek拟于2026年2月中旬、即农历新年假期期间正式推出其全新一代旗舰大模型——DeepSeek V4。该模型预计将显著强化编程相关能力，尤其在代码生成与理解方面实现跃升。

值得关注的是，在1月20日——恰逢DeepSeek-R1模型发布一周年之际，有开发者于GitHub平台发现，DeepSeek悄然更新了多组FlashMLA核心代码。此次更新覆盖114个文件，在共计28处代码段中均出现了此前从未公开的模型标识符“MODEL1”。尤为关键的是，该标识符并非作为V3.2（即DeepSeek-V3.2）的子版本或变体出现，而是与其并列、独立存在，暗示其属于一套全新序列。

DeepSeek V4或将于农历新年推出，代码更新揭示未知大模型“MODEL1”

进一步结合上下文分析可见，“MODEL1”在底层架构层面与“V32”存在本质性差异：包括键值（KV）缓存的内存排布策略、稀疏注意力机制的实现路径，以及对FP8低精度数据格式的原生解码支持等关键模块均被重构。这些改动指向一个高度定制化的新型架构，极可能聚焦于极致内存压缩与高吞吐推理效率。

与此同时，DeepSeek研究院近期连续公开两篇前沿技术论文：一篇提出“优化残差连接（mHC）”训练范式，另一篇则首次披露受神经科学启发的“AI记忆模块（Engram）”。业界普遍认为，上述创新成果或将深度融入正在研发中的新模型体系，为V4乃至后续迭代提供理论与工程双重支撑。

来源：互联网

上一篇 2021最新AO3国内访问指南：稳定不迷路的官方网址入口 下一篇 漫蛙漫画官网登录指南：Manwa2网页版免费在线看

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

DeepSeek V4或将于农历新年推出，代码更新揭示未知大模型“MODEL1”

摘要

相关文章推荐