其他资讯综合资讯

Codex与Claude_Code对比：新功能仅领先11天深度测评

2026-06-09

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

ClaudeCode与Codex两项AI编程智能体功能高度趋同，24项重叠功能中ClaudeCode首发18项，Codex仅4项

最近，开发者Elie Bakouch的发现让整个AI编程圈都坐不住了——Claude Code和Codex这两大智能体，功能趋同的速度比预想中快得多。他干脆把双方的核心能力整理成了一张清晰的时间线图表。

这张时间线横跨2025年2月到2026年6月，按功能上线顺序排列了双方同步具备的所有能力。橙色代表Claude Code，蓝色代表Codex，每一行对应一项双方均已实现或高度相似的功能，从 /goal 指令、子智能体到OpenAI近期推出的「dreaming」记忆机制，一应俱全。

统计结果相当直观：两家共有24项功能高度趋同，其中18项由Claude Code率先落地，Codex仅抢先发布了4项，其余2项存在发布时间上的争议。

单看共性功能的维度，Claude Code明显占据了节奏主导权。18项首发优势让它的橙色节点密集覆盖了时间线的前半段，而Codex只在4个节点上拔得头筹。更值得注意的是，双方新功能上线的间隔正急剧缩短，“先发”带来的窗口期已经被压缩到以天为单位。

在Codex那4项首发功能中，有2项被Claude Code迅速跟进：/goal 功能由Codex首发，11天后Claude Code即完成对齐；多智能体并行任务同样由Codex先行推出，Claude Code仅用11天便实现了复刻。两次追赶均未超过两周。

相比之下，Codex后续需要填补的功能清单就要长得多。

这场竞速不仅体现在时间维度，连斜杠命令的命名习惯、技能文件的结构等细节层面也日趋一致。两大AI编程智能体，正在悄然融合为同一种技术面孔。

18比4，Claude Code赢在起跑阶段

Elie梳理的这份对照清单，囊括了Claude Code与Codex自发布以来全部24项重叠功能。整理基于npm发布记录、GitHub Release日志及官方博客交叉验证，虽未经逐条与厂商官方确认，但整体演进趋势明确可信。

Claude Code比OpenAI新版Codex早了约80天面世：它于2025年2月以终端内嵌编程智能体形态首发；Codex则迟至同年5月才作为云端软件工程智能体正式亮相。正是这近三个月的先发优势，叠加此后高频迭代的节奏，让Claude Code在24项功能中拿下18项首发，橙色节点几乎铺满时间轴的前半程。

这些功能包括无界面脚本化、模型上下文协议、自定义斜杠命令、上下文压缩、子智能体、生命周期钩子、技能系统等。

作为后来者，Codex也并非全程被动追赶。内置沙箱、云端异步智能体、多智能体协同团队、目标模式等几项均为其首发。

另有两项功能存在归属争议：

检查点与回滚——若以“可撤销代码变更”的强语义定义，Claude Code的 /rewind 更贴近完整检查点机制；若按“会话回退/分叉”这一较宽松标准，Codex侧也有早期实践记录，因此该项仍列为争议。

关于记忆dreaming，争议源于概念混杂。若单论“记忆”能力，OpenAI早在ChatGPT memory体系中已有推进；但若聚焦“dreaming”这一命名及其所指代的历史复盘、自我优化机制，则Anthropic于2026年5月6日在Claude Managed Agents中首次公开该能力。

剔除这两项模糊地带，18比4的领先格局一目了然。

需要说明的是，“Codex”之名并非2025年新创。OpenAI早在2021年就发布了Codex模型，主打自然语言生成代码。但Elie比对的是2025年全新上线的Codex编程智能体产品。OpenAI虽在AI编程赛道早早布局，却将编程Agent产品的市场先机让渡给了Claude Code。旧版Codex验证了“模型能写代码”，而Claude Code则率先将其转化为开发者日常依赖的成熟智能体产品。

功能像素级对齐，是模仿，还是必然收敛？

这场贴身较量中，双方能力正以前所未有的精度靠拢，早已超越个别功能点的偶然重合，进入了关键模块成组对齐的新阶段。

最具代表性的便是 /goal。根据Claude Code官方文档定义：用户设定完成条件后，系统将持续执行多轮操作直至目标达成；每轮结束后由轻量模型实时判断是否满足终止条件，未达成则自动进入下一轮，而非将控制权交还用户。

Claude Code官方文档中 /goal 的定义：设好完成条件，每跑完一回合由一个小而快的模型判断是否达成，未达成就继续。

Codex的Goal mode同样遵循同一逻辑：给定长期目标后，系统将持续自主推进，支持数小时乃至数天无人值守运行。该功能已脱离实验阶段，在App、IDE插件及CLI中全面可用。同一底层范式，两家各自实现了独立版本。

subagents亦是如此。Claude Code的子智能体运行于彼此隔离的上下文窗口中，用于上下文隔离、工具权限约束、配置复用及成本优化；Codex则通过并行专用智能体执行subagent工作流，并汇总结果。

更微妙的是，连命名都高度趋同：Codex为侧边提问指令新增的 /btw 别名，与Claude Code完全一致；技能系统方面，两者均采用由Anthropic发起、后成为行业通用标准的SKILL.md格式。

Claude Code与Codex的技能均采用Anthropic发起、后开放为标准的SKILL.md格式，连文件名都一致。

细读双方文档不难发现：这并非简单的复制粘贴，而是AI编程智能体作为一类新型产品，其形态本身正快速收敛为固定范式。长周期任务调度、子智能体架构、上下文压缩策略、权限沙箱机制、工作区隔离设计、插件与技能生态建设……无论哪家主导开发，最终都可能演化出高度相似的技术骨架。

Dreaming机制尤为典型。Anthropic为Claude Managed Agents引入了名为dreaming的能力，支持历史会话回溯、模式识别与自我调优；OpenAI亦于六月初在ChatGPT中上线了同名dreaming记忆系统。

但二者实质不同：Anthropic的Dreaming部署于托管智能体平台，并非Claude Code CLI中可直接调用的命令；OpenAI的Dreaming则构建于ChatGPT记忆系统之上，也不属于Codex编程能力范畴。真正值得关注的是：AI Agent的产品语言、能力模块划分及接口设计，正以前所未有的速度向统一范式聚拢。这意味着，功能列表本身已难以构成竞争壁垒。真正的差异点，正从“有没有这项能力”，跃迁至“这项能力做到什么水准”。

先发抢占声量，决胜关键转向可靠性

在AI高速迭代的赛道中，“先发”红利是否仍在？

据WIRED报道，2025年9月Codex用户量仅为Claude Code的5%；至2026年1月，该比例飙升至近40%，追赶势头迅猛。用户规模差距也在收窄。OpenAI于6月2日宣布，Codex周活跃用户突破500万，相较2月桌面版上线时增长约6倍。Anthropic未单独披露Claude Code周活数据，第三方估算其5月活跃用户约为200万。

需注意口径差异：Codex的500万用户中非开发者占比已达两成，体现其正将“编程工具”拓展为“通用办公平台”。在纯开发者群体中，Claude Code仍具优势：过去30天npm下载量约4630万次，是Codex命令行版本（约1400万次）的3倍以上。就“每周打开频次”而言，Codex已反超；但就“开发者使用深度”而言，Claude Code依然领先。

更值得Anthropic警惕的是部分开发者的“迁移行为”。WIRED援引Notion联合创始人Simon Last观点称，他与核心工程师团队在GPT-5.2发布前后集体转向Codex，主因在于稳定性。“Claude Code有时会假装执行任务，实际并未采取任何动作。”去年10月，OpenClaw创始人Peter Steinberger公开宣布其整套开发流程已全面切换至Codex；四个月后，他本人亦加入OpenAI。

Peter Steinberger 自述已完全转用 Codex CLI 作为日常主力，常在 3x3 终端网格里并行跑3到8个实例。

当先发优势以天为单位快速稀释，真正的胜负手早已不在“谁最先做出来”。

差异化窗口加速收窄

一旦功能清单趋于一致，竞争焦点便自然转向体验层——同一能力，谁响应更快、长任务成功率更高、上下文压缩更精准、权限管控更严谨、资源消耗更低。

双方对AI编程的理解路径亦有差异。Claude Code更像“终端里的自主工程师”，深耕命令行工作流后再向外延展hooks、子智能体、技能与插件生态。Codex则更倾向“全端工作台”，将CLI、IDE插件、桌面应用、移动端远程控制与云端异步任务整合为统一平台。尽管路径不同，终极目标却高度一致：不甘局限于IDE插件角色，而是立志成为每位开发者每日启动的第一个入口，进而演进为企业级操作系统。

Elie最初绘制这张对比表，本意在于厘清高下，结果却意外揭示另一事实：AI编程智能体的差异化窗口，正以前所未有的速度关闭。双方越追越紧，也越长越像。

来源：互联网

上一篇 ChatGPT最大规模改版评测：2025新功能深度对比 下一篇 最新自动化工作流排行榜：5款高可靠性任务处理链路推荐

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

Codex与Claude_Code对比：新功能仅领先11天深度测评

摘要

18比4，Claude Code赢在起跑阶段

功能像素级对齐，是模仿，还是必然收敛？

先发抢占声量，决胜关键转向可靠性

差异化窗口加速收窄

相关文章推荐