跳转到主要内容

像 Agent 一样思考

AI 辅助写的

Anthropic 工程师 Thariq 一条推文里,比"三次失败"更值得想的另一件事。

Anthropic 工程师 Thariq 最近发了一条推文,讲 Claude Code 团队给 Claude 加一个"主动问用户问题"功能的过程:弹个窗让用户选 A 还是 B,比让用户从一段长文字里挑答案省事得多。

他们做了三次。

第一次想偷懒——在已有的 ExitPlanTool 上加个参数,让它输出计划的同时也输出问题。失败:用户回答和已经输出的计划冲突时,Claude 不知道该听谁的。

第二次更工程化——约定一种 markdown 格式,让 Claude 用固定结构提问,前端解析。失败:模型一次次用错格式,多余句子、缺选项、自由发挥。

第三次单独做一个 AskUserQuestion 工具,调用就弹窗,阻塞 agent 循环直到用户回答。成了。

你要给它匹配其自身能力的工具。但你怎么知道它的能力是什么?你得认真观察,阅读它的输出,不断实验。你要学会像 Agent 一样去看世界

但比这个故事更值得记的,是 Thariq 顺手提到的另一件事。

Claude Code 早期有一个 TodoWrite 工具,让 Claude 自己写待办清单。模型常常忘记自己该做什么,团队就每 5 轮对话插一次系统提醒。

聪明的设计。直到模型变强,提醒反而成了限制——Claude 把清单当成必须严格遵守的东西,不敢随机应变。最后团队彻底重做,用 Task Tool 替代了 TodoWrite。

Todos 像老板盯着员工的清单。Tasks 像团队的协作看板。

这是 Thariq 全文最好的一句话。它指向的现象比 agent 设计普遍得多:

所有 prompt engineering 都有半衰期。

你不会收到一个明确的信号说"这条规则可以删了"。它只是悄悄从"必要"滑向"多余",再从"多余"滑向"反作用"。不定期回头看自己写过的提示词,它们会越积越多——而且大部分都已经过期。

像 agent 一样去看世界。也像使用者一样,看你做的每一样东西。


延伸阅读:

构建 Claude Code 的经验:像 Agent 一样思考

构建 agent 框架最难的部分之一,是设计它的行动空间。以下是我们在构建 Claude Code 过程中,通过认真观察 Claude 所总结出的一些经验。

ThariqX (Twitter)2026-02-28
Thariq Shihipar
Thariq Shihipar· Claude Code 构建者
Software Engineer, Anthropic

MIT Media Lab 硕士,连续创业者。曾创办 YC 支持的游戏公司 Multiverse(融资 1700 万美元),联合创办 Chime(被 HubSpot 收购)和学术出版平台 PubPub.org

Claude Code 团队如何设计 Agent 工具

对 Thariq 长文的详细拆解分析,包括 Apple CodeAct 研究及其对 agent 工具设计的启示。

Anupanup.io

Agent 设计模式

探讨编程 Agent 的核心抽象:CLI 访问和操作系统层原语优于预定义工具列表。

Lance Martinrlancemartin.github.io2026-01-09

评论

像 Agent 一样思考 | Yu的赛博工位