2026 年6 月9 日,Anthropic 發布了Claude Fable 5,一個專注複雜程式碼規劃與生成的新模型。發布本身並不令人意外,但兩個附帶資訊迅速點燃了開發社群的討論:Fable 5 的API 定價是上一代Opus 4.8 的兩倍;6 月22 日之後,Fable 5 將從Pro、Max 等訂閱計劃中移除,用戶只能透過API 呼叫或usage credits 存取。
有開發者在Reddit 回饋,用Max 20x 計畫跑Fable 5,每分鐘消耗2% 額度。 Hacker News 上一位用戶記錄了自己一天的用量,Fable 5 的API token 消耗在額度內就達到了82.92 美元。能力強,但燒錢也快。
這不僅僅是一個模型的定價問題。當最頂尖的AI 開始按能力等級分層定價,並且最高一級被移出普惠訂閱,一個更棘手的問題浮出水面:最好的模型,誰在使用?
兩倍價格,以及一個倒數計時
Anthropic 官方公告顯示,Claude Fable 5 是第一個公開發布的Mythos 等級模型。 Mythos 是Anthropic 內部對最高能力模型的定級,先前僅供Project Glasswing 合作夥伴使用。 Fable 5 相當於Mythos 5 的“公開發行版”,在精確構建程式碼結構、理解開發者深層需求等場景中,效能較Claude Sonnet 有顯著提升。
能力附帶了直接的成本代價。根據Anthropic 官方定價頁數據,Fable 5 API 輸入價格為每百萬token 10 美元,輸出價格為50 美元。同為Anthropic 旗下,Opus 4.8 的對應價格是5 美元和25 美元,Sonnet 4.6 是3 美元和15 美元。 Fable 5 的輸出價格是Sonnet 的3.3 倍。
訪問視窗也有限制。 Anthropic 確認,6 月22 日前Fable 5 包含在所有訂閱方案中;6 月23 日起,Fable 5 將從訂閱方案移除,使用者需使用usage credits 才能呼叫。官方的表述是“容量允許時將恢復為標準訂閱功能”,但沒有給出時間表。
賓州大學華頓商學院教授Ethan Mollick 在他的部落格oneusefulthing.org 上發表了關於Fable 5 的深入評論。他寫道:「Fable 價格是Opus 的兩倍,token 消耗速度表明生產成本會『非常高』。」Mollick 長期追蹤AI 模型能力演進,這句判斷指向的並非定價策略本身,而是模型運行的基礎設施成本。
token 消耗速度有多快? Reddit 用戶回饋,在Claude Max 20x 方案下使用Fable 5,每分鐘消耗約2% 的額度。這個方案每月定價200 美元,以此速率,連續使用不到一小時就會耗盡整月額度。 Hacker News 上的開發者Simon Willison 記錄了自己一天的API 使用情況,額度內消耗達82.92 美元。
Fable 5 的定價和存取策略傳達了一個訊號:下一代模式的能力提升直接反映在價格乘數上。訂閱方案的「免費試用期」只夠用戶建立使用習慣。當截止日期到來,使用者面臨兩個選擇:支付更不可控的API 成本繼續使用,或退回到上一個等級的模型。
從9 美元到120 美元的分層
Fable 5 的定價不是孤例。把目前在售的主流模型API 定價拉出來看,一條陡峭的價格光譜清晰可見。
根據Google 官方定價頁,Gemini 3.5 Flash 的付費層輸出價格為每百萬token 9 美元。 OpenAI 官方定價頁顯示,GPT-5.4 輸出價格為15 美元,GPT-5.5 為30 美元,GPT-5.5 Pro 為120 美元。 Anthropic 這邊,Sonnet 4.6 輸出價15 美元,Opus 4.8 為25 美元,Fable 5 為50 美元。
從Gemini 3.5 Flash 的9 美元到GPT-5.5 Pro 的120 美元,最大價差超過13 倍。這不再是簡單的「高端vs 低端」二分。廠商正在主動建構一個三層結構:底層是極低價的入門模型,承擔普及和獲客功能;中層是中等價位的高效能模型,面向日常開發需求;頂層是昂貴但能力最強的推理模型,目標用戶是高頻、高價值場景的使用者。
定價分層的背後,是能力等級的顯性化。 Anthropic 用Sonnet、Opus、Fable、Mythos 四級劃分模型能力,OpenAI 用標準版和Pro 版區分GPT-5 系列的不同規格,Google 則用Flash 和Pro 區分Gemini 3 系列的定位。這些等級不再只是內部代號,而是直接對應到價格上。
更值得注意的變化發生在訪問權上。在Anthropic 官方定價頁公佈的模型列表中,Fable 5 被標註為“6 月22 日前包含在訂閱計劃中”,Opus 4.8 和Sonnet 4.6 則沒有類似的時間限制。 Anthropic 正在嘗試一種新的分層方式:不是按能力高低給不同訂閱等級分配不同模型,而是直接將頂級模型從訂閱系統中剝離,單獨建立API 呼叫通道。
帳單不可控的焦慮
單看每百萬token 50 美元的定價,放在企業採購場景不算驚人。 Claude Fable 的上下文視窗達100 萬token,最大輸出12.8 萬token,一次完整的複雜任務可能消耗數萬到數十萬token。 Fable 5 作為推理模型,「思考更久、產生更多token」不是設計缺陷,而是能力來源。模型在輸出最終答案前會進行多步驟推理,每步產生token 消耗。
問題在於用戶無法控制這個消耗量。一位用Max 20x 計劃的開發者每分鐘燒掉2% 額度,Simon Willison 一天消耗82.92 美元。這些消耗發生在「試用期」內,屬於計畫內額度。 6 月22 日之後,類似的用量將直接轉為API 帳單或credits 扣減。
Token 作為一種計費單位,其消耗量由模型設計方決定,使用者無法控制「用量」。把AI 調用比作用電,核心矛盾在於用戶既不能選擇“省電模式”,也不能預測下一次查詢會消耗多少“電”。一篇發佈於LinkedIn 的行業討論文章將這種現象概括為“AI 稅”的核心特徵:“真正的AI 稅不僅是模型價格,而是不可預測性。”
這種不可預測性對個人開發者的衝擊遠大於企業。企業可以簽訂大量協議、設定預算上限、在團隊內分攤成本。個人用戶面對按量計費的API,一次較真的調試可能就是整月訂閱費。 Hacker News 上一位用戶評論說,「成本意識路由從錦上添花變成強制要求」。 「成本意識路由」指的是在預設任務中使用便宜模型,只在必要時呼叫昂貴模型。在Fable 5 之前,這更像是一種優化策略;Fable 5 的價格和消耗速度,讓這種策略變成了不做就面臨超支的剛性配置。
主流API 都提供不同模型的呼叫接口,開發者可以自行設定路由邏輯。但這要求使用者俱備程式設計能力、理解模型差異、願意接受降級模型可能帶來的品質損失。每多一層門檻,就多一批人被擋在門外。
兩百美元月費也買不到全通票
訪問權的分層同樣在改變。 Claude Fable 5 的策略是:6 月22 日之前,所有付費用戶都能使用;6 月22 日之後,即使支付最高200 美元月費的Max 20x 用戶也不能直接訪問,需要透過usage credits 呼叫API。
相較之下,OpenAI 的存取權策略是另一條路徑。根據ChatGPT 官方定價頁,ChatGPT Pro 提供100 美元和200 美元兩個層級,均可訪問GPT-5 Pro。更高層的模型能力對應更高層的訂閱等級,但訂閱本身仍然是一個完整的存取權包。
兩種策略的差異不只在價格。 OpenAI 的模式把壁壘設在訂閱費上:付得起200 美元月費,就能用最好的模型。 Anthropic 對Fable 5 的策略把障礙設在兩個地方:費用(API 按量計費)和技術門檻(需要API 存取能力)。 Hacker News 上的用戶討論中,有人將這種策略稱為“藥物免費樣品策略,讓你上癮後漲價”,也有人認為這更可能是真實的算力供應鏈問題,Anthropic 暫時無法以固定價格的訂閱模式覆蓋Fable 5 的推理成本。
無論動機如何,效果是清晰的:訂閱變成了一張“入場券”,而不是“全票”。最頂級的模型能力不在票面範圍內。 TechCrunch 在關於Fable 5 發布的報告中指出,Fable 5 是「第一個公開發布的Mythos 級別模型」。在Fable 5 之前,Mythos 等級僅限Project Glasswing 合作夥伴使用。現在門檻降低了,但並沒有消失。
繞路的用戶
存取權的分層已經產生了可見的使用者行為變化。一部分用戶開始尋找繞過正規管道的路徑。
一種做法是透過第三方聚合服務呼叫模型。這些「中轉站」以低於官方標價的價格提供token,來源通常是企業批量採購的閒置額度、不同區域的價差套利或未公開管道。價格更低,但隱私保護和穩定性沒有保障。相關討論在知乎等平台上持續發酵,用戶真正擔心的不是“便宜tok en 能不能用”,而是“數據會經過誰的手”。
另一種做法是轉向開源或低價替代模型。有開發者分享教學課程,展示如何把DeepSeek 等模型接入各類開發工具,繞過官方定價和驗證流程。能力會有損失,隱私風險上升,但成本可控性顯著提高。
Hacker News 和Reddit 上的開發者討論中,混合使用策略被頻繁提及:「預設用便宜的模型,只在關鍵步驟切換Fable。」這聽起來像是合理的資源優化。如果回顧兩、三年前關於「AI 民主化」的討論,彼時的主流敘事是每個人都能平等地使用最好的模型。現在,「用最好的模型」變成了一件需要精打細算的事。
本地部署提供了另一種對照。一台能夠流暢運行大模型的GPU 價格不低,能跑120B 模型的整機配備更不是大多數個人開發者可以輕鬆承擔的。本地部署的門檻是另一種形式的付費牆,只是用硬體採購替換了按量計費。
這些繞路行為不是「聰明用戶的省錢技巧」。當大量使用者開始主動尋找替代方案,是因為原有路徑正在變窄。中轉站的隱私風險、開源模型的能力差距、本地部署的硬體投入,每一種繞路都有代價。
台階已經在腳下
如果把AI 比喻為水力發電一類的公用基礎設施,那麼公用事業的第一原則就是普遍服務、公平接入。但AI 模型的定價趨勢正在朝相反的方向走。能力越強價格越高,頂級模式脫離普惠訂閱,以token 計費讓成本變得不可預測。水電供應不會只給付費更多的用戶提供“更強電流”,但AI 正在這樣做。
這不是一個「貴還是便宜」的定價討論。當Claude Fable 這樣的頂尖模型被從大眾化訂閱中移除,當GPT-5.5 Pro 的輸出價格達到Flash 模型的13 倍,當個人開發者的一天用量能燒掉82 美元,「用不起」正在從一個價格問題變成一個結構問題。
在使用AI 工具的領域裡,階梯已經清晰可見。最上層是能負擔無限API 呼叫和專用硬體的企業級用戶,中間層是精打細算使用頂級模型的個人開發者,底層是只能用免費或低價模型的普通用戶。這道階梯的每一級,不是由技術水平劃定的,而是由支付能力和技術接入能力劃定的。
Anthropic 6 月22 日的截止日期只是這條台階上最新的一級,不是第一級,也不會是最後一級。


