Codex与Claude_Code对比:新功能仅领先11天深度测评
摘要
ClaudeCode与Codex两项AI编程智能体功能高度趋同,24项重叠功能中ClaudeCode首发18项,Codex仅4项
最近,开发者Elie Bakouch的发现让整个AI编程圈都坐不住了——Claude Code和Codex这两大智能体,功能趋同的速度比预想中快得多。他干脆把双方的核心能力整理成了一张清晰的时间线图表。

这张时间线横跨2025年2月到2026年6月,按功能上线顺序排列了双方同步具备的所有能力。橙色代表Claude Code,蓝色代表Codex,每一行对应一项双方均已实现或高度相似的功能,从 /goal 指令、子智能体到OpenAI近期推出的「dreaming」记忆机制,一应俱全。

统计结果相当直观:两家共有24项功能高度趋同,其中18项由Claude Code率先落地,Codex仅抢先发布了4项,其余2项存在发布时间上的争议。
单看共性功能的维度,Claude Code明显占据了节奏主导权。18项首发优势让它的橙色节点密集覆盖了时间线的前半段,而Codex只在4个节点上拔得头筹。更值得注意的是,双方新功能上线的间隔正急剧缩短,“先发”带来的窗口期已经被压缩到以天为单位。
在Codex那4项首发功能中,有2项被Claude Code迅速跟进:/goal 功能由Codex首发,11天后Claude Code即完成对齐;多智能体并行任务同样由Codex先行推出,Claude Code仅用11天便实现了复刻。两次追赶均未超过两周。
相比之下,Codex后续需要填补的功能清单就要长得多。
这场竞速不仅体现在时间维度,连斜杠命令的命名习惯、技能文件的结构等细节层面也日趋一致。两大AI编程智能体,正在悄然融合为同一种技术面孔。
18比4,Claude Code赢在起跑阶段
Elie梳理的这份对照清单,囊括了Claude Code与Codex自发布以来全部24项重叠功能。整理基于npm发布记录、GitHub Release日志及官方博客交叉验证,虽未经逐条与厂商官方确认,但整体演进趋势明确可信。
Claude Code比OpenAI新版Codex早了约80天面世:它于2025年2月以终端内嵌编程智能体形态首发;Codex则迟至同年5月才作为云端软件工程智能体正式亮相。正是这近三个月的先发优势,叠加此后高频迭代的节奏,让Claude Code在24项功能中拿下18项首发,橙色节点几乎铺满时间轴的前半程。
这些功能包括无界面脚本化、模型上下文协议、自定义斜杠命令、上下文压缩、子智能体、生命周期钩子、技能系统等。
作为后来者,Codex也并非全程被动追赶。内置沙箱、云端异步智能体、多智能体协同团队、目标模式等几项均为其首发。
另有两项功能存在归属争议:
检查点与回滚——若以“可撤销代码变更”的强语义定义,Claude Code的 /rewind 更贴近完整检查点机制;若按“会话回退/分叉”这一较宽松标准,Codex侧也有早期实践记录,因此该项仍列为争议。
关于记忆dreaming,争议源于概念混杂。若单论“记忆”能力,OpenAI早在ChatGPT memory体系中已有推进;但若聚焦“dreaming”这一命名及其所指代的历史复盘、自我优化机制,则Anthropic于2026年5月6日在Claude Managed Agents中首次公开该能力。
剔除这两项模糊地带,18比4的领先格局一目了然。

需要说明的是,“Codex”之名并非2025年新创。OpenAI早在2021年就发布了Codex模型,主打自然语言生成代码。但Elie比对的是2025年全新上线的Codex编程智能体产品。OpenAI虽在AI编程赛道早早布局,却将编程Agent产品的市场先机让渡给了Claude Code。旧版Codex验证了“模型能写代码”,而Claude Code则率先将其转化为开发者日常依赖的成熟智能体产品。
功能像素级对齐,是模仿,还是必然收敛?
这场贴身较量中,双方能力正以前所未有的精度靠拢,早已超越个别功能点的偶然重合,进入了关键模块成组对齐的新阶段。
最具代表性的便是 /goal。根据Claude Code官方文档定义:用户设定完成条件后,系统将持续执行多轮操作直至目标达成;每轮结束后由轻量模型实时判断是否满足终止条件,未达成则自动进入下一轮,而非将控制权交还用户。

Claude Code官方文档中 /goal 的定义:设好完成条件,每跑完一回合由一个小而快的模型判断是否达成,未达成就继续。
Codex的Goal mode同样遵循同一逻辑:给定长期目标后,系统将持续自主推进,支持数小时乃至数天无人值守运行。该功能已脱离实验阶段,在App、IDE插件及CLI中全面可用。同一底层范式,两家各自实现了独立版本。
subagents亦是如此。Claude Code的子智能体运行于彼此隔离的上下文窗口中,用于上下文隔离、工具权限约束、配置复用及成本优化;Codex则通过并行专用智能体执行subagent工作流,并汇总结果。
更微妙的是,连命名都高度趋同:Codex为侧边提问指令新增的 /btw 别名,与Claude Code完全一致;技能系统方面,两者均采用由Anthropic发起、后成为行业通用标准的SKILL.md格式。

Claude Code与Codex的技能均采用Anthropic发起、后开放为标准的SKILL.md格式,连文件名都一致。
细读双方文档不难发现:这并非简单的复制粘贴,而是AI编程智能体作为一类新型产品,其形态本身正快速收敛为固定范式。长周期任务调度、子智能体架构、上下文压缩策略、权限沙箱机制、工作区隔离设计、插件与技能生态建设……无论哪家主导开发,最终都可能演化出高度相似的技术骨架。
Dreaming机制尤为典型。Anthropic为Claude Managed Agents引入了名为dreaming的能力,支持历史会话回溯、模式识别与自我调优;OpenAI亦于六月初在ChatGPT中上线了同名dreaming记忆系统。

但二者实质不同:Anthropic的Dreaming部署于托管智能体平台,并非Claude Code CLI中可直接调用的命令;OpenAI的Dreaming则构建于ChatGPT记忆系统之上,也不属于Codex编程能力范畴。真正值得关注的是:AI Agent的产品语言、能力模块划分及接口设计,正以前所未有的速度向统一范式聚拢。这意味着,功能列表本身已难以构成竞争壁垒。真正的差异点,正从“有没有这项能力”,跃迁至“这项能力做到什么水准”。
先发抢占声量,决胜关键转向可靠性
在AI高速迭代的赛道中,“先发”红利是否仍在?
据WIRED报道,2025年9月Codex用户量仅为Claude Code的5%;至2026年1月,该比例飙升至近40%,追赶势头迅猛。用户规模差距也在收窄。OpenAI于6月2日宣布,Codex周活跃用户突破500万,相较2月桌面版上线时增长约6倍。Anthropic未单独披露Claude Code周活数据,第三方估算其5月活跃用户约为200万。
需注意口径差异:Codex的500万用户中非开发者占比已达两成,体现其正将“编程工具”拓展为“通用办公平台”。在纯开发者群体中,Claude Code仍具优势:过去30天npm下载量约4630万次,是Codex命令行版本(约1400万次)的3倍以上。就“每周打开频次”而言,Codex已反超;但就“开发者使用深度”而言,Claude Code依然领先。
更值得Anthropic警惕的是部分开发者的“迁移行为”。WIRED援引Notion联合创始人Simon Last观点称,他与核心工程师团队在GPT-5.2发布前后集体转向Codex,主因在于稳定性。“Claude Code有时会假装执行任务,实际并未采取任何动作。”去年10月,OpenClaw创始人Peter Steinberger公开宣布其整套开发流程已全面切换至Codex;四个月后,他本人亦加入OpenAI。

Peter Steinberger 自述已完全转用 Codex CLI 作为日常主力,常在 3x3 终端网格里并行跑3到8个实例。
当先发优势以天为单位快速稀释,真正的胜负手早已不在“谁最先做出来”。
差异化窗口加速收窄
一旦功能清单趋于一致,竞争焦点便自然转向体验层——同一能力,谁响应更快、长任务成功率更高、上下文压缩更精准、权限管控更严谨、资源消耗更低。
双方对AI编程的理解路径亦有差异。Claude Code更像“终端里的自主工程师”,深耕命令行工作流后再向外延展hooks、子智能体、技能与插件生态。Codex则更倾向“全端工作台”,将CLI、IDE插件、桌面应用、移动端远程控制与云端异步任务整合为统一平台。尽管路径不同,终极目标却高度一致:不甘局限于IDE插件角色,而是立志成为每位开发者每日启动的第一个入口,进而演进为企业级操作系统。
Elie最初绘制这张对比表,本意在于厘清高下,结果却意外揭示另一事实:AI编程智能体的差异化窗口,正以前所未有的速度关闭。双方越追越紧,也越长越像。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。