PANews 6月27日消息,Coinbase 首席执行官 Brian Armstrong 在 X 平台发文分享公司内部 AI 成本管控实践,他提出在 Token 调用量指数级增长的背景下,稳定 AI 开支的核心并非设置使用门槛与消费提醒,而是优化默认模型、智能任务路由、缓存体系三大底层能力。
Coinbase 通过 LLM 网关将 GLM 5.2、Kimi 2.7 等开源权重模型设为默认选型,数据显示 91% 员工从未触及用量上限,因此公司放弃下调额度、增加告警的管控方式;系统自动预处理提示词,结合缓存、价格自动匹配最优模型,由 AI 替代人工完成模型选择。
同时平台全链路启用缓存机制,LibreChat 缓存命中率由 5% 提升至 60%,并规范精简上下文减少无效 Token 损耗。整套体系不限制 AI 使用规模,只为承载业务增长,目前 Coinbase 已实现 AI 支出近乎减半,Token 消耗量持续走高。



