작가: 시유
Claude Opus 4.6을 사용하고 싶지만 월말에 요금이 폭증하는 건 싫으신가요? 이 글을 통해 비용을 60~85% 절감하는 방법을 알아보세요.
1. 토큰은 어디에 사용되나요?
토큰이 단순히 "사용자의 말 + AI의 응답"이라고 생각하시나요? 사실 토큰은 그보다 훨씬 더 많은 의미를 담고 있습니다.
각 대화에 숨겨진 비용:
시스템 메시지(~3000-5000 토큰): OpenClaw 핵심 명령어입니다. 수정할 수 없습니다.
컨텍스트 파일 삽입(~3000-14000 토큰): AGENTS.md , SOUL.md , MEMORY.md 등이 모든 대화에 포함됨 - 이것이 가장 큰 숨겨진 오버헤드입니다.
역사적 메시지: 대화가 점점 길어집니다
당신의 입력 + AI 출력: 이것이 당신이 생각하는 "전부"입니다.
"오늘 날씨는 어때요?"라는 간단한 메시지 하나를 처리하는 데에도 실제로 8,000~15,000개의 입력 토큰이 소모됩니다. Opus를 사용하면 문맥 처리 비용만 해도 0.12~0.22달러가 소요됩니다.
크론은 훨씬 더 가혹합니다. 각 트리거는 완전히 새로운 대화를 생성하고 전체 컨텍스트를 다시 주입합니다. 15분마다 실행되고 하루에 96번 실행되는 크론 작업은 다음 날 Opus 수수료로 10~20달러를 지불하게 됩니다.
마찬가지로, 하트비트는 기본적으로 대화형 통화이며, 통화 간격이 짧을수록 비용이 더 많이 듭니다.
II. 모델 레이어링: 일일 소네트, 핵심 작품
돈을 절약하는 가장 효과적인 방법 1순위입니다. 소네트는 오푸스 가격의 약 1/5밖에 되지 않지만, 일상적인 작업의 80%를 수행하기에는 충분합니다.
markdown
提示词:
请帮我把OpenClaw 的默认模型改为Claude Sonnet,
只在需要深度分析或创作时使用Opus。
具体需要:
1) 默认模型设为Sonnet
2) cron 任务默认用Sonnet
3) 只有写作、深度分析类任务指定Opus
Opus 시나리오: 장문 작성, 복잡한 코드 작성, 다단계 추론, 창의적인 작업
소네트 시나리오: 일상적인 대화, 간단한 질의응답, cron 점검, 하트비트, 파일 작업, 번역.
실제 테스트 결과: 전환 후 월 비용이 65% 감소했으며 사용자 경험에는 거의 차이가 없었습니다.
III. 맥락 간소화: 숨겨진 토큰 보유자 제거
각 호출의 "노이즈 플로어"는 3,000~14,000 토큰일 수 있습니다. 주입 파일을 단순화하는 것이 가장 비용 효율적인 최적화 방법입니다.
markdown
提示词:
帮我精简OpenClaw 的上下文文件以节约token。
具体包括:1) AGENTS.md 删掉不需要的部分(群聊规则、TTS、不用的功能),压缩到800 tokens 以内
2) SOUL.md 精简为简洁要点,300-500 tokens
3) MEMORY.md 清理过期信息,控制在2000 tokens 以内
4) 检查workspaceFiles 配하고 불필요한 주입 파일을 제거하십시오.
일반적인 규칙: 하루에 Opus 호출을 100회 한다고 가정할 때, 주입되는 토큰이 1,000개 줄어들면 매달 약 45달러를 절약할 수 있습니다.
IV. 크론 최적화: 가장 교묘한 비용 낭비 요소
markdown
提示词:帮我优化OpenClaw 的cron 任务以节约token。
请:
1) 列出所有cron 任务及其频率和模型
2) 把所有非创作类任务降级为Sonnet
3) 合并同时间段的任务(比如多个检查合为一个)
4) 降低不必要的高频率(系统检查从10 分钟改为30 分钟,版本检查从3 次/天改为1 次/天)
5) 配置delivery 为. 일반적인 상황에서는 메시지가 전송되지 않습니다.
핵심 원칙: 빈번하다고 해서 반드시 좋은 것은 아닙니다. 대부분의 "실시간" 요구사항은 잘못된 요구사항입니다. 5개의 개별 검사를 단일 호출로 통합하면 컨텍스트 주입 비용을 75% 절감할 수 있습니다.
V. 심장 박동 최적화
마크다운 n
提示词:帮我优化OpenClaw heartbeat 配置:
1) 工作时间间隔设为45-60 分钟
2) 深夜23:00-08:00 设为静默期
3) 精简HEARTBEAT.md 到最少行数
4) 把分散的检查任务合并到heartbeat 批量执行
VI. 정밀 검색: qmd를 사용하여 입력 토큰 비용을 90% 절감하세요
에이전트가 정보를 검색할 때 기본적으로 "전체 텍스트 읽기"를 선택합니다. 500줄짜리 파일에는 3000~5000개의 토큰이 포함되어 있지만, 실제로 필요한 것은 10줄뿐입니다. 따라서 입력 토큰의 90%가 낭비됩니다.
QMD는 전체 파일을 읽지 않고도 단락을 정확하게 찾을 수 있도록 전체 텍스트와 벡터 인덱스를 구축하는 로컬 의미 검색 도구입니다. 모든 계산은 로컬에서 수행되며 API 사용료는 없습니다.
MQ(미니 쿼리)와 함께 사용하면 디렉터리 구조를 미리 보고, 단락을 정확하게 추출하고, 키워드를 검색할 수 있습니다. 한 번에 필요한 10~30줄만 읽으면 됩니다.
markdown
提示词:
帮我配置qmd 知识库检索以节约token。
Github地址:https://github.com/tobi/qmd
需要:
1) 安装qmd
2) 为工作目录建立索引
3) 在AGENTS.md 中添加检索规则,强制agent 优先用qmd/mq 搜索而非直接read 全文
4) 设置定时更新
실제 결과: 데이터 조회당 비용이 15,000 토큰에서 1,500 토큰으로 감소하여 90%의 절감 효과를 거두었습니다.
memorySearch와 qmd의 차이점은 memorySearch는 "리콜"( MEMORY.md )을 관리하고, qmd는 "데이터 검색"(사용자 지정 지식 기반)을 관리하며, 둘은 서로 영향을 미치지 않는다는 것입니다.
VII. 메모리 검색 선택
markdown
提示词:帮我配置OpenClaw 的memorySearch。
如果我的记忆文件不多(几十个md),
推荐用本地嵌入还是Voyage AI?
请说明各自的成本和检索质量差异。
간단히 말해서, 메모리 파일 수를 줄이려면 로컬 임베딩을 사용하고(비용 없음), 다국어 지원이 많이 필요하거나 파일이 많은 경우에는 Voyage AI(계정당 2억 토큰 무료)를 사용하세요.
VIII. 최종 구성 목록
markdown
提示词:
请帮我一次性优化OpenClaw 配置以最大限度节约token,按以下清单执行:
默认模型改为Sonnet,只保留创作/分析任务用Opus
精简AGENTS.md / SOUL.md / MEMORY.md
所有cron 任务降级Sonnet + 合并+ 降频
Heartbeat 间隔45 分钟+ 深夜静默
配置qmd 精准检索替代全文读取
workspaceFiles 只保留必要文件
记忆文件定期精简,MEMORY.md 控制2000 tokens 以内
한 번 설정하면 장기적인 이점을 누릴 수 있습니다.
1. 모델 레이어링—소네트 루틴, 오푸스 키, 60~80% 절약
2. 문맥 기반 최적화 - 간소화된 파일과 정확한 QMD 검색을 통해 입력 토큰을 30~90% 절약합니다.
3. 실행 횟수 줄이기 - cron 작업을 병합하고, 하트비트 간격을 늘리고, 대기 시간을 설정합니다.
소네트 4는 이미 매우 강력해서 일상적인 사용에서는 차이를 느끼지 못할 겁니다. 오푸스가 정말 필요할 때만 소네트 4로 전환하세요.
다중 에이전트 시스템에 대한 실제 경험을 바탕으로, 데이터는 익명화된 추정치입니다.

