Claude Opus 4.7 于 2026 年 4 月 16 日发布,是 Opus 系列迄今最强版本。从本页收录的 8 项可比基准来看,Opus 4.7 的最大亮点集中在软件工程和桌面 Agent 两个方向,而在信息检索类 Agent 任务(BrowseComp)上,它是三大竞品中排名最低的。这种"结构性优势"而非"全面碾压"的格局,是理解这款模型定位的核心。
软件工程:本次升级的最强信号
SWE-bench Verified 是当前代码 Agent 能力最具说服力的公开评测之一。Opus 4.7 以 拿下该项目的旗舰成绩,比 Opus 4.6 的 80.84 提升了整整 ——这在 SWE-bench 上属于非常显著的单代进步,因为该榜单头部模型的差距通常以 1–3 分计。SWE-Bench Pro(更难的真实工程任务集)上,Opus 4.7 以 ,领先 GPT-5.4 的 57.70 和 Gemini 3.1 Pro 的 54.20 超过 6 分。