Jul 4, 2026

让 Fable 自己判断：Simon Willison 的 Claude Code 省钱秘诀（2026-07-04）

本文为翻译/转载，原文使用 CC BY-NC-SA 4.0 协议发布。原文作者：Simon Willison 原文标题：Fable’s judgement 原文链接：https://simonwillison.net/2026/Jul/3/judgement/ 原文发布：2026-07-03 本博客不参与任何商业变现（含 ads / 付费 / affiliate），本译文遵循 CC BY-NC-SA 4.0 条款发布。

译者按

Anthropic 最近推出了 Claude Fable 5——目前最强的编码 AI 模型之一，但 API 价格也水涨船高。Simon Willison（Django 联合创始人、Datasette 作者）在 AI Engineer 大会上与 Claude Code 团队的交流中，学到了一个反直觉的技巧：不要过度指导你的 AI 助手，让它自己判断。更妙的是，他还分享了如何让 Fable 委托子任务给更便宜的模型，从而在享受顶级模型能力的同时控制成本。这个思路对国内使用 Claude / GPT 做编码辅助的开发者也极具参考价值——毕竟 token 预算总是有限的。

正文

周三在 AI Engineer 大会（AIE）上，我与 Claude Code 团队的 Cat Wu 和 Thariq Shihipar 主持了一场炉边谈话。从他们那里学到的最有趣的一条建议是：让 Fable（以及一定程度上 Opus）运用自己的判断，而不是事无巨细地告诉它们该怎么做。

他们举的例子是测试。你可以告诉 Fable “只对较大的功能使用自动化测试，不要为微小的文案或设计改动运行测试”——但更好的做法是，直接告诉 Fable 让它自己决定什么时候该写测试。

Jesse Vincent 又给了我一个相关的建议，帮助我在涨价前的最后几天里省着点用 Fable 宝贵的 token 配额：告诉 Fable 把较小的任务交给其他模型去完成，让它自己判断该用哪个模型。

我刚刚在 Claude Code 里输入了这条提示：

对于所有编码任务，运用你的判断力决定使用哪个较低功率的模型，并在子代理中运行它

Claude 将这条指令保存在了项目的记忆文件中（~/.claude/projects/name-of-project/memory/delegate-coding-to-subagents.md）：

---
name: delegate-coding-to-subagents
description: Simon 希望编码任务被委托给运行在适当较低功率模型上的子代理
---

Simon 于 2026-07-03 声明："对于所有编码任务，运用你的判断力决定使用哪个较低功率的模型，并在子代理中运行它。"

原因：成本/效率——实现工作很少需要顶级模型；判断、审阅和合成工作保留在主循环中。

如何应用：当项目中的任务主要是编写/编辑代码时，启动一个带模型覆盖的子代理（实质性实现用 Sonnet，琐碎/机械性编辑用 Haiku），并附带自包含的提示；在提交前在主循环中审阅结果。设计、审计、数据合成以及任何需要判断的繁重工作保留在主模型中。

到目前为止，效果不错。我的工作量大增，而 Fable 的配额消耗速度比以前慢多了。

译者注

Fable 5 / Mythos 5：Anthropic 在 2026 年推出的 Claude 高端模型系列。Fable 是面向编码的顶级模型，能力极强但价格昂贵；Mythos 是通用旗舰模型。此前美国商务部一度对这两个模型施加了出口管制，后于 2026 年 6 月底解除。
Sonnet / Haiku：Anthropic Claude 模型系列中不同规格的模型。Sonnet 是中等规格的均衡模型，适合大多数任务；Haiku 是最小最快的模型，适合简单、机械性的任务。Simon 的策略是让 Fable（顶级模型）做主代理，将具体编码任务委托给 Sonnet 或 Haiku 子代理执行。
Claude Code：Anthropic 推出的终端内编码 AI 代理工具，支持多文件编辑、命令执行、子代理等高级功能。
这个”委托子代理”的思路与国内开发者使用 Cursor / Windsurf 等 AI 编码工具时的”Agent 模式”类似——核心思想都是让最强的模型负责规划与判断，较弱的模型负责执行，从而在能力与成本之间取得平衡。

让 Fable 自己判断：Simon Willison 的 Claude Code 省钱秘诀（2026-07-04）

译者按

正文

译者注

延伸阅读