高阶编程能力大幅提升,Anthropic发布Claude Opus 4.7
摘要
Anthropic 发布 Claude Opus 4 7:旗舰模型迎来关键迭代 在距离上一版本仅两个月后,Anthropic 准
Anthropic 发布 Claude Opus 4.7:旗舰模型迎来关键迭代
在距离上一版本仅两个月后,Anthropic 准时推出了其最新的旗舰人工智能模型 Claude Opus 4.7。这一更新严格遵循了公司近期的发布周期,展现了其在模型研发与部署上稳定且高效的节奏。

Opus 4.7:显著降低复杂编码任务的人工监督需求
作为 Anthropic 面向公众的最新旗舰模型,Claude Opus 4.7 的核心竞争力在于其卓越的软件工程与代码生成能力。
相较于 Opus 4.6,新版模型在高级软件工程任务上实现了质的飞跃,特别是在处理超高复杂度项目时表现更为突出。开发者反馈表明,现在可以将以往需要密集人工审查的、最棘手的编码任务更放心地委托给 Opus 4.7。该模型不仅能稳健、准确地执行冗长复杂的指令,更关键的是,它会在交付最终代码前,自主构建一套验证逻辑来确保输出结果的可靠性与正确性。
除了编码,Anthropic 也着重提升了模型的多模态能力。其视觉解析精度更高,内容创作的审美与质量也得到同步优化。
模型的视觉处理能力获得大幅升级:现已支持更高分辨率的图像输入与分析。在执行专业设计任务时,它能展现出更优的审美判断与创意构思,生成质量更高的用户界面、演示文稿及各类视觉化文档。
基准测试:性能全面领先
在实际性能评估中,Opus 4.7 的表现令人印象深刻。在智能体编码、计算机操作等一系列核心应用场景的基准测试中,它不仅超越了前代 Opus 4.6,也领先于主要竞品 GPT-5.4 和 Gemini 3.1 Pro。值得注意的是,其综合性能略低于更为全面的 Claude Mythos Preview。然而,Mythos 版本目前并未广泛开放,Anthropic 仅向苹果等少数核心平台合作伙伴提供访问权限。




核心能力升级:指令遵循、多模态与长程记忆
除了上述突出改进,Opus 4.7 在多项基础能力上也进行了增强,包括指令遵循精度、多模态支持、实际任务处理能力以及长期记忆功能。
官方指出:“Opus 4.7 更擅长利用基于文件系统的记忆机制。这使得它能够在跨越多个会话的长期工作流程中,持久化关键信息,并基于这些累积的上下文来执行新任务。其直接益处是,用户启动新任务时需要提供的背景信息大幅减少。”
稳定的双月更新周期
一个明显的趋势是,Anthropic 已经为 Claude Opus 系列确立了更稳定、可预测的双月升级节奏。Opus 4.7 与 4.6 的发布间隔为两个月,而 4.6 与 4.5 之间同样如此。相比之下,从 Opus 4.1 到 4.5 的迭代周期为三个月。更新频率的加快,直接反映了人工智能领域核心技术竞争的加剧。
词元(Token)消耗变化说明
性能的提升通常伴随资源消耗的调整。Anthropic 在公告中特别说明了 Opus 4.7 在 Token 使用上的两点关键变化,需要用户提前规划:
Opus 4.7 是 Opus 4.6 的直接升级版,但以下变更会影响 Token 消耗: 1. 模型采用了新的分词器,文本处理效果更好,但相同内容可能产生更多 Token——根据内容类型,消耗量约为之前的 1.0 至 1.35 倍。 2. 在高算力模式下,Opus 4.7 的“思考”过程更深入,尤其在智能体场景的后续交互中。这增强了解决复杂问题的可靠性,但也会相应产生更多的输出 Token。
Claude Code 功能持续增强
在发布新模型的同时,Anthropic 近期也在持续迭代 Mac 端 Claude 应用中的 Claude Code 功能。主要更新包括:
授权 Claude 代理用户操作 Mac 系统;在重构后的 Claude Code 中引入了自动化流程;为开发者提供了更安全的“自动模式”,作为跳过某些权限操作的替代方案。
更重要的是,即日起,Claude Code 的自动模式不再仅限于团队版、企业版或 API 用户,个人 Max 订阅用户也已获得使用权限。
此外,Claude Code 新增了一个 /ultrareview 指令。该指令会触发一个专门的代码审查流程,系统性地审阅所有代码变更,并精准标识出那些通常只有资深工程师才能发现的潜在问题与风险点,为开发者提供了强有力的代码质量保障工具。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。