PANews 6月29日消息,Coinbase執行長Brian Armstrong發文分享了公司在AI支出方面的優化經驗。他指出,在代幣使用量指數級增長的同時,通過更好的預設設定、路由和快取策略,已將AI支出削減近半,而非依賴使用上限和警報機制。在預設設定方面,Coinbase正通過LLM閘道將開源權重模型(如智譜的GLM 5.2和月之暗面的Kimi 2.7)設為預設選項,同時鼓勵工程師為特定任務選擇正確模型。該公司91%的員工從未觸及使用上限,因此團隊選擇轉向更便宜的預設設定而非降低上限。在路由層面,Coinbase透過預處理提示詞並根據快取命中率和模型定價將任務路由至最適合的模型,並認為AI最終可自動化這一選擇過程。快取方面,Coinbase所有請求均具備快取感知能力,LibreChat的快取命中率從5%提升至60%。
Armstrong表示,目標並非抑制使用量,而是構建使指數級增長可持續的基礎設施。他強調應保持上下文精簡、減少浪費的token,並提供使用情況可見性——AI支出越高,對產出影響的期望也越高。



