作者:しゆ
Claude Opus 4.6 を使いたいけれど、月末に請求額が爆発的に増えるのは避けたいと思いませんか?この記事を読めば、コストを 60~85% 削減できます。
1. トークンはどこで使われますか?
トークンとは「あなたが言ったこと + AIがそれに応じて言ったこと」だけだと思っていませんか? 実は、トークンはそれ以上のものです。
各会話の隠れたコスト:
システム プロンプト (約 3000 ~ 5000 トークン): OpenClaw コア命令。変更できません。
コンテキスト ファイル インジェクション (約 3000 ~ 14000 トークン): AGENTS.md 、 SOUL.md 、 MEMORY.mdなどがすべての会話に含まれます。これが最大の隠れたオーバーヘッドです。
歴史的なメッセージ:会話はどんどん長くなる
あなたの入力 + AIの出力: これがあなたが「すべて」だと思うもの
シンプルな「今日の天気はどうですか?」というメッセージは、実際には8,000~15,000の入力トークンを消費します。Opusを使用すると、コンテキストだけで0.12~0.22ドルかかります。
cronはさらに容赦がありません。トリガーごとに全く新しい会話が開始され、コンテキスト全体が再注入されます。15分ごとに1日に96回実行されるcronジョブは、翌日にOpusの料金として10~20ドルかかります。
同様に、Heartbeat は本質的にはダイアログ通話であり、間隔が短いほどコストが高くなります。
II. モデルレイヤリング:デイリーソネット、キーオプス
一番効果的な節約術。SonnetはOpusの約5分の1の価格で、日常の作業の80%以上をこなせます。
markdown
提示词:
请帮我把OpenClaw 的默认模型改为Claude Sonnet,
只在需要深度分析或创作时使用Opus。
具体需要:
1) 默认模型设为Sonnet
2) cron 任务默认用Sonnet
3) 只有写作、深度分析类任务指定Opus
Opusシナリオ:長い記事の執筆、複雑なコード、多段階の推論、創造的なタスク
Sonnet のシナリオ:カジュアルな会話、簡単な Q&A、cron チェック、ハートビート、ファイル操作、翻訳。
実際のテスト結果: 切り替え後、月額コストは 65% 削減されましたが、ユーザー エクスペリエンスにはほとんど違いはありませんでした。
III. コンテキストスリム化:隠れトークン保有者の排除
各呼び出しの「ノイズフロア」は3,000~14,000トークンになる可能性があります。インジェクションファイルを簡素化することが、最も費用対効果の高い最適化です。
markdown
提示词:
帮我精简OpenClaw 的上下文文件以节约token。
具体包括:1) AGENTS.md 删掉不需要的部分(群聊规则、TTS、不用的功能),压缩到800 tokens 以内
2) SOUL.md 精简为简洁要点,300-500 tokens
3) MEMORY.md 清理过期信息,控制在2000 tokens 以内
4) 检查workspaceFiles 配、不要なインジェクションファイルを削除します。
経験則: 1 日に Opus 呼び出しが 100 回であると仮定すると、注入されるトークンが 1,000 少なくなるごとに、1 か月あたり約 45 ドル節約できます。
IV. Cronの最適化:最も陰険なコスト削減要因
markdown
提示词:帮我优化OpenClaw 的cron 任务以节约token。
请:
1) 列出所有cron 任务及其频率和模型
2) 把所有非创作类任务降级为Sonnet
3) 合并同时间段的任务(比如多个检查合为一个)
4) 降低不必要的高频率(系统检查从10 分钟改为30 分钟,版本检查从3 次/天改为1 次/天)
5) 配置delivery 为。通常の状況ではメッセージは送信されません。
基本原則:頻度が高いほど良いとは限りません。「リアルタイム」要件のほとんどは誤った要件です。5つの個別のチェックを1回の呼び出しに統合することで、コンテキスト注入コストを75%削減できます。
V. ハートビートの最適化
マークダウンn
提示词:帮我优化OpenClaw heartbeat 配置:
1) 工作时间间隔设为45-60 分钟
2) 深夜23:00-08:00 设为静默期
3) 精简HEARTBEAT.md 到最少行数
4) 把分散的检查任务合并到heartbeat 批量执行
VI. 精密検索: qmdで入力トークンを90%節約
エージェントが情報を検索する場合、デフォルトで「全文読み取り」が選択されます。500 行のファイルには 3000 ~ 5000 個のトークンが含まれますが、必要なのは 10 行だけです。入力トークンの 90% が無駄になります。
QMDは、フルテキスト+ベクターインデックスを構築するローカルセマンティック検索ツールです。これにより、エージェントはファイル全体を読み込む代わりに、段落を正確に特定できます。すべての計算はローカルで実行され、APIコストはかかりません。
MQ (ミニクエリ) での使用: ディレクトリ構造をプレビューし、段落を正確に抽出し、キーワードを検索します。必要な 10 ~ 30 行だけを一度に読み取ります。
markdown
提示词:
帮我配置qmd 知识库检索以节约token。
Github地址:https://github.com/tobi/qmd
需要:
1) 安装qmd
2) 为工作目录建立索引
3) 在AGENTS.md 中添加检索规则,强制agent 优先用qmd/mq 搜索而非直接read 全文
4) 设置定时更新
実際の結果: データ検索ごとのコストが 15,000 トークンから 1,500 トークンに減少し、90% 削減されました。
memorySearch と qmd の違い: memorySearch は「リコール」( MEMORY.md ) を管理しますが、 qmd は「データ検索」(カスタム知識ベース) を管理しますが、それらは互いに影響しません。
VII. メモリ検索の選択
markdown
提示词:帮我配置OpenClaw 的memorySearch。
如果我的记忆文件不多(几十个md),
推荐用本地嵌入还是Voyage AI?
请说明各自的成本和检索质量差异。
簡単な結論:メモリ ファイルが少ない場合はローカル埋め込み (コスト 0) を使用し、多言語要件が高い場合やファイル数が多い場合は Voyage AI (アカウントごとに 2 億トークンが無料) を使用します。
VIII. 最終構成リスト
markdown
提示词:
请帮我一次性优化OpenClaw 配置以最大限度节约token,按以下清单执行:
默认模型改为Sonnet,只保留创作/分析任务用Opus
精简AGENTS.md / SOUL.md / MEMORY.md
所有cron 任务降级Sonnet + 合并+ 降频
Heartbeat 间隔45 分钟+ 深夜静默
配置qmd 精准检索替代全文读取
workspaceFiles 只保留必要文件
记忆文件定期精简,MEMORY.md 控制2000 tokens 以内
一度設定すれば、長期的にメリットが得られます。
1. モデルの階層化 - Sonnetルーチン、Opusキー、60~80%の節約
2. コンテキストベースの最適化 - 簡素化されたファイル + 正確な QMD 検索により、入力トークンを 30 ~ 90% 節約します。
3. 呼び出しを減らす - cron ジョブをマージし、ハートビートを長くし、サイレント期間を有効にします。
Sonnet 4はすでに非常にパワフルなので、普段使いでは違いに気づかないでしょう。Opusが本当に必要な時だけSonnet 4に切り替えてください。
マルチエージェントシステムの実践経験に基づいて、データは匿名化された推定値です。

