PANews 6月27日消息,Coinbase 執行長 Brian Armstrong 在 X 平台發文分享公司內部 AI 成本管控實踐,他提出在 Token 調用量指數級增長的背景下,穩定 AI 開支的核心並非設定使用門檻與消費提醒,而是優化預設模型、智慧任務路由、快取體系三大底層能力。
Coinbase 透過 LLM 閘道將 GLM 5.2、Kimi 2.7 等開源權重模型設為預設選型,數據顯示 91% 員工從未觸及用量上限,因此公司放棄下調額度、增加告警的管控方式;系統自動預處理提示詞,結合快取、價格自動匹配最優模型,由 AI 替代人工完成模型選擇。
同時平台全鏈路啟用快取機制,LibreChat 快取命中率由 5% 提升至 60%,並規範精簡上下文減少無效 Token 損耗。整套體系不限制 AI 使用規模,只為承載業務增長,目前 Coinbase 已實現 AI 支出近乎減半,Token 消耗量持續走高。



