AI Agent 长任务中断、状态丢失、context 超限怎么办?拆解 Anthropic Managed Agents 的架构设计
Anthropic 最近发布了一篇工程博客,讲他们怎么重新设计 Agent 的底层架构。表面上是一篇基础设施文章,但背后的设计思路值得仔细看。

给模型打的补丁,会随着模型进化变成废代码
做 Agent 开发的人都遇到过这种情况:模型有某个行为问题,于是在框架层面加一段逻辑来绕过它。问题解决了,但这段逻辑就永远留在代码里了。
Anthropic 自己也遇到了这件事。他们发现 Claude Sonnet 4.5 在 context 快满的时候会提前放弃任务,表现得像是"时间不多了,赶紧收尾"——他们把这个现象叫做 context anxiety(上下文焦虑)。解决方案是在 harness 里加入 context reset 的逻辑,每隔一段就重置一次。
后来他们把同一套 harness 用在 Claude Opus 4.5 上,发现这个行为消失了。模型能力提升之后,context anxiety 不再出现,而那段 reset 逻辑就变成了没有意义的死代码。
这个例子说明一个更普遍的问题:。模型在进化,假设会过期,但代码不会自动失效。
