post cover

让 Fable 自己判断:Simon Willison 的 Claude Code 省钱秘诀(2026-07-04)


本文为翻译/转载,原文使用 CC BY-NC-SA 4.0 协议发布。 原文作者:Simon Willison 原文标题:Fable’s judgement 原文链接:https://simonwillison.net/2026/Jul/3/judgement/ 原文发布:2026-07-03 本博客不参与任何商业变现(含 ads / 付费 / affiliate),本译文遵循 CC BY-NC-SA 4.0 条款发布。

译者按

Anthropic 最近推出了 Claude Fable 5——目前最强的编码 AI 模型之一,但 API 价格也水涨船高。Simon Willison(Django 联合创始人、Datasette 作者)在 AI Engineer 大会上与 Claude Code 团队的交流中,学到了一个反直觉的技巧:不要过度指导你的 AI 助手,让它自己判断。更妙的是,他还分享了如何让 Fable 委托子任务给更便宜的模型,从而在享受顶级模型能力的同时控制成本。这个思路对国内使用 Claude / GPT 做编码辅助的开发者也极具参考价值——毕竟 token 预算总是有限的。

正文

周三在 AI Engineer 大会(AIE)上,我与 Claude Code 团队的 Cat Wu 和 Thariq Shihipar 主持了一场炉边谈话。从他们那里学到的最有趣的一条建议是:让 Fable(以及一定程度上 Opus)运用自己的判断,而不是事无巨细地告诉它们该怎么做。

他们举的例子是测试。你可以告诉 Fable “只对较大的功能使用自动化测试,不要为微小的文案或设计改动运行测试”——但更好的做法是,直接告诉 Fable 让它自己决定什么时候该写测试。

Jesse Vincent 又给了我一个相关的建议,帮助我在涨价前的最后几天里省着点用 Fable 宝贵的 token 配额:告诉 Fable 把较小的任务交给其他模型去完成,让它自己判断该用哪个模型。

我刚刚在 Claude Code 里输入了这条提示:

对于所有编码任务,运用你的判断力决定使用哪个较低功率的模型,并在子代理中运行它

Claude 将这条指令保存在了项目的记忆文件中(~/.claude/projects/name-of-project/memory/delegate-coding-to-subagents.md):

---
name: delegate-coding-to-subagents
description: Simon 希望编码任务被委托给运行在适当较低功率模型上的子代理
---

Simon 于 2026-07-03 声明:"对于所有编码任务,运用你的判断力决定使用哪个较低功率的模型,并在子代理中运行它。"

原因:成本/效率——实现工作很少需要顶级模型;判断、审阅和合成工作保留在主循环中。

如何应用:当项目中的任务主要是编写/编辑代码时,启动一个带模型覆盖的子代理(实质性实现用 Sonnet,琐碎/机械性编辑用 Haiku),并附带自包含的提示;在提交前在主循环中审阅结果。设计、审计、数据合成以及任何需要判断的繁重工作保留在主模型中。

到目前为止,效果不错。我的工作量大增,而 Fable 的配额消耗速度比以前慢多了。

译者注

  • Fable 5 / Mythos 5:Anthropic 在 2026 年推出的 Claude 高端模型系列。Fable 是面向编码的顶级模型,能力极强但价格昂贵;Mythos 是通用旗舰模型。此前美国商务部一度对这两个模型施加了出口管制,后于 2026 年 6 月底解除。
  • Sonnet / Haiku:Anthropic Claude 模型系列中不同规格的模型。Sonnet 是中等规格的均衡模型,适合大多数任务;Haiku 是最小最快的模型,适合简单、机械性的任务。Simon 的策略是让 Fable(顶级模型)做主代理,将具体编码任务委托给 Sonnet 或 Haiku 子代理执行。
  • Claude Code:Anthropic 推出的终端内编码 AI 代理工具,支持多文件编辑、命令执行、子代理等高级功能。
  • 这个”委托子代理”的思路与国内开发者使用 Cursor / Windsurf 等 AI 编码工具时的”Agent 模式”类似——核心思想都是让最强的模型负责规划与判断,较弱的模型负责执行,从而在能力与成本之间取得平衡。

延伸阅读