作者: xiyu
想用Claude Opus 4.6 但不想月底帳單爆炸?這篇幫你砍掉60-85% 成本。
一、token花在哪裡?
你以為token 只是"你說的話+ AI 回的話"?實際遠不止。
每次對話的隱藏成本:
System Prompt(~3000-5000 tokens):OpenClaw 核心指令,改不了
上下文檔案注入(~3000-14000 tokens): AGENTS.md 、 SOUL.md 、 MEMORY.md等,每次對話都帶上-這是最大的隱形開銷
歷史消息:越聊越長
你的輸入+ AI 輸出:這才是你以為的"全部"
一個簡單的"今天天氣怎麼樣",實際消耗8000-15000 input tokens。用Opus 算,光上下文就花$0.12-0.22。
Cron 更狠:每次觸發= 全新對話= 重新註入全部上下文。一個每15 分鐘跑的cron,一天96 次,Opus 下一天$10-20。
Heartbeat 同理:本質也是對話調用,間隔越短越燒錢。
二、模型分層:日常Sonnet,關鍵Opus
省錢第一大招,效果最猛。 Sonnet 定價約Opus 的1/5,80% 日常任務完全夠用。
markdown
提示词:
请帮我把OpenClaw 的默认模型改为Claude Sonnet,
只在需要深度分析或创作时使用Opus。
具体需要:
1) 默认模型设为Sonnet
2) cron 任务默认用Sonnet
3) 只有写作、深度分析类任务指定Opus
Opus 場景:長文寫作、複雜程式碼、多步驟推理、創意任務
Sonnet 場景:日常閒聊、簡單問答、cron 檢查、heartbeat、文件操作、翻譯
實測:切換後月成本降65%,體驗幾乎沒差。
三、上下文瘦身:砍掉隱形Token 大戶
每次調用的"底噪"可能3000-14000 tokens。精簡注入檔案是性價比最高的最佳化。
markdown
提示词:
帮我精简OpenClaw 的上下文文件以节约token。
具体包括:1) AGENTS.md 删掉不需要的部分(群聊规则、TTS、不用的功能),压缩到800 tokens 以内
2) SOUL.md 精简为简洁要点,300-500 tokens
3) MEMORY.md 清理过期信息,控制在2000 tokens 以内
4) 检查workspaceFiles 配,移除不必要的注入文件
經驗法則:每減少1000 tokens 注入,以每天100 次呼叫Opus 算,月省約$45。
四、Cron 優化:最隱密的成本殺手
markdown
提示词:帮我优化OpenClaw 的cron 任务以节约token。
请:
1) 列出所有cron 任务及其频率和模型
2) 把所有非创作类任务降级为Sonnet
3) 合并同时间段的任务(比如多个检查合为一个)
4) 降低不必要的高频率(系统检查从10 分钟改为30 分钟,版本检查从3 次/天改为1 次/天)
5) 配置delivery 为按需通知,正常時不發送訊息
核心原則:不是越頻繁越好,大多數"即時"需求是假需求。合併5 個獨立檢查為1 次調用,省75% 上下文注入成本。
五、Heartbeat 優化
markdow n
提示词:帮我优化OpenClaw heartbeat 配置:
1) 工作时间间隔设为45-60 分钟
2) 深夜23:00-08:00 设为静默期
3) 精简HEARTBEAT.md 到最少行数
4) 把分散的检查任务合并到heartbeat 批量执行
六、精準檢索:用qmd 省90% Input Token
agent 查資料時預設"讀取全文"—一個500 行檔案3000-5000 tokens,但它只需要其中10 行。 90% 的input token 被浪費了。
qmd 是本地語意檢索工具,建立全文+ 向量索引,讓agent 精確定位段落而非讀取整個檔案。全部本地計算,零API 成本。
配合mq(Mini Query)使用:預覽目錄結構、精準段落擷取、關鍵字搜尋-每次只讀需要的10-30 行。
markdown
提示词:
帮我配置qmd 知识库检索以节约token。
Github地址:https://github.com/tobi/qmd
需要:
1) 安装qmd
2) 为工作目录建立索引
3) 在AGENTS.md 中添加检索规则,强制agent 优先用qmd/mq 搜索而非直接read 全文
4) 设置定时更新索引
實測效果:每次查資料從15,000 tokens 降到1500 tokens,減少90%。
與memorySearch 的差異:memorySearch 管"回憶"( MEMORY.md ),qmd 管"查資料"(自訂知識庫),互不影響。
七、Memory Search 選擇
markdown
提示词:帮我配置OpenClaw 的memorySearch。
如果我的记忆文件不多(几十个md),
推荐用本地嵌入还是Voyage AI?
请说明各自的成本和检索质量差异。
簡單結論:記憶檔案少用本地嵌入(零成本),多語言需求高或檔案多用Voyage AI(每帳號2 億token 免費)。
八、終極配置清單
markdown
提示词:
请帮我一次性优化OpenClaw 配置以最大限度节约token,按以下清单执行:
默认模型改为Sonnet,只保留创作/分析任务用Opus
精简AGENTS.md / SOUL.md / MEMORY.md
所有cron 任务降级Sonnet + 合并+ 降频
Heartbeat 间隔45 分钟+ 深夜静默
配置qmd 精准检索替代全文读取
workspaceFiles 只保留必要文件
记忆文件定期精简,MEMORY.md 控制2000 tokens 以内
配置一次,長期受益:
1. 模型分層— Sonnet 日常,Opus 關鍵,省60-80%
2. 上下文瘦身— 精簡文件+ qmd 精準檢索,省30-90% input token
3. 減少呼叫— 合併cron、拉長heartbeat、開啟靜默期
Sonnet 4 已經很強了,日常用感覺不到差別。真正需要Opus 的時候切過去就行。
基於多agent 系統實戰經驗,數據為脫敏估算值。

