Claude Fable 定價翻倍，頂尖 AI 正在變成奢侈品

2026 年6 月9 日，Anthropic 發布了Claude Fable 5，一個專注複雜程式碼規劃與生成的新模型。發布本身並不令人意外，但兩個附帶資訊迅速點燃了開發社群的討論：Fable 5 的API 定價是上一代Opus 4.8 的兩倍；6 月22 日之後，Fable 5 將從Pro、Max 等訂閱計劃中移除，用戶只能透過API 呼叫或usage credits 存取。

有開發者在Reddit 回饋，用Max 20x 計畫跑Fable 5，每分鐘消耗2% 額度。 Hacker News 上一位用戶記錄了自己一天的用量，Fable 5 的API token 消耗在額度內就達到了82.92 美元。能力強，但燒錢也快。

這不僅僅是一個模型的定價問題。當最頂尖的AI 開始按能力等級分層定價，並且最高一級被移出普惠訂閱，一個更棘手的問題浮出水面：最好的模型，誰在使用？

兩倍價格，以及一個倒數計時

Anthropic 官方公告顯示，Claude Fable 5 是第一個公開發布的Mythos 等級模型。 Mythos 是Anthropic 內部對最高能力模型的定級，先前僅供Project Glasswing 合作夥伴使用。 Fable 5 相當於Mythos 5 的“公開發行版”，在精確構建程式碼結構、理解開發者深層需求等場景中，效能較Claude Sonnet 有顯著提升。

能力附帶了直接的成本代價。根據Anthropic 官方定價頁數據，Fable 5 API 輸入價格為每百萬token 10 美元，輸出價格為50 美元。同為Anthropic 旗下，Opus 4.8 的對應價格是5 美元和25 美元，Sonnet 4.6 是3 美元和15 美元。 Fable 5 的輸出價格是Sonnet 的3.3 倍。

訪問視窗也有限制。 Anthropic 確認，6 月22 日前Fable 5 包含在所有訂閱方案中；6 月23 日起，Fable 5 將從訂閱方案移除，使用者需使用usage credits 才能呼叫。官方的表述是“容量允許時將恢復為標準訂閱功能”，但沒有給出時間表。

賓州大學華頓商學院教授Ethan Mollick 在他的部落格oneusefulthing.org 上發表了關於Fable 5 的深入評論。他寫道：「Fable 價格是Opus 的兩倍，token 消耗速度表明生產成本會『非常高』。」Mollick 長期追蹤AI 模型能力演進，這句判斷指向的並非定價策略本身，而是模型運行的基礎設施成本。

token 消耗速度有多快？ Reddit 用戶回饋，在Claude Max 20x 方案下使用Fable 5，每分鐘消耗約2% 的額度。這個方案每月定價200 美元，以此速率，連續使用不到一小時就會耗盡整月額度。 Hacker News 上的開發者Simon Willison 記錄了自己一天的API 使用情況，額度內消耗達82.92 美元。

Fable 5 的定價和存取策略傳達了一個訊號：下一代模式的能力提升直接反映在價格乘數上。訂閱方案的「免費試用期」只夠用戶建立使用習慣。當截止日期到來，使用者面臨兩個選擇：支付更不可控的API 成本繼續使用，或退回到上一個等級的模型。

從9 美元到120 美元的分層

Fable 5 的定價不是孤例。把目前在售的主流模型API 定價拉出來看，一條陡峭的價格光譜清晰可見。

根據Google 官方定價頁，Gemini 3.5 Flash 的付費層輸出價格為每百萬token 9 美元。 OpenAI 官方定價頁顯示，GPT-5.4 輸出價格為15 美元，GPT-5.5 為30 美元，GPT-5.5 Pro 為120 美元。 Anthropic 這邊，Sonnet 4.6 輸出價15 美元，Opus 4.8 為25 美元，Fable 5 為50 美元。

從Gemini 3.5 Flash 的9 美元到GPT-5.5 Pro 的120 美元，最大價差超過13 倍。這不再是簡單的「高端vs 低端」二分。廠商正在主動建構一個三層結構：底層是極低價的入門模型，承擔普及和獲客功能；中層是中等價位的高效能模型，面向日常開發需求；頂層是昂貴但能力最強的推理模型，目標用戶是高頻、高價值場景的使用者。

定價分層的背後，是能力等級的顯性化。 Anthropic 用Sonnet、Opus、Fable、Mythos 四級劃分模型能力，OpenAI 用標準版和Pro 版區分GPT-5 系列的不同規格，Google 則用Flash 和Pro 區分Gemini 3 系列的定位。這些等級不再只是內部代號，而是直接對應到價格上。

更值得注意的變化發生在訪問權上。在Anthropic 官方定價頁公佈的模型列表中，Fable 5 被標註為“6 月22 日前包含在訂閱計劃中”，Opus 4.8 和Sonnet 4.6 則沒有類似的時間限制。 Anthropic 正在嘗試一種新的分層方式：不是按能力高低給不同訂閱等級分配不同模型，而是直接將頂級模型從訂閱系統中剝離，單獨建立API 呼叫通道。

帳單不可控的焦慮

單看每百萬token 50 美元的定價，放在企業採購場景不算驚人。 Claude Fable 的上下文視窗達100 萬token，最大輸出12.8 萬token，一次完整的複雜任務可能消耗數萬到數十萬token。 Fable 5 作為推理模型，「思考更久、產生更多token」不是設計缺陷，而是能力來源。模型在輸出最終答案前會進行多步驟推理，每步產生token 消耗。

問題在於用戶無法控制這個消耗量。一位用Max 20x 計劃的開發者每分鐘燒掉2% 額度，Simon Willison 一天消耗82.92 美元。這些消耗發生在「試用期」內，屬於計畫內額度。 6 月22 日之後，類似的用量將直接轉為API 帳單或credits 扣減。

Token 作為一種計費單位，其消耗量由模型設計方決定，使用者無法控制「用量」。把AI 調用比作用電，核心矛盾在於用戶既不能選擇“省電模式”，也不能預測下一次查詢會消耗多少“電”。一篇發佈於LinkedIn 的行業討論文章將這種現象概括為“AI 稅”的核心特徵：“真正的AI 稅不僅是模型價格，而是不可預測性。”

這種不可預測性對個人開發者的衝擊遠大於企業。企業可以簽訂大量協議、設定預算上限、在團隊內分攤成本。個人用戶面對按量計費的API，一次較真的調試可能就是整月訂閱費。 Hacker News 上一位用戶評論說，「成本意識路由從錦上添花變成強制要求」。「成本意識路由」指的是在預設任務中使用便宜模型，只在必要時呼叫昂貴模型。在Fable 5 之前，這更像是一種優化策略；Fable 5 的價格和消耗速度，讓這種策略變成了不做就面臨超支的剛性配置。

主流API 都提供不同模型的呼叫接口，開發者可以自行設定路由邏輯。但這要求使用者俱備程式設計能力、理解模型差異、願意接受降級模型可能帶來的品質損失。每多一層門檻，就多一批人被擋在門外。

兩百美元月費也買不到全通票

訪問權的分層同樣在改變。 Claude Fable 5 的策略是：6 月22 日之前，所有付費用戶都能使用；6 月22 日之後，即使支付最高200 美元月費的Max 20x 用戶也不能直接訪問，需要透過usage credits 呼叫API。

相較之下，OpenAI 的存取權策略是另一條路徑。根據ChatGPT 官方定價頁，ChatGPT Pro 提供100 美元和200 美元兩個層級，均可訪問GPT-5 Pro。更高層的模型能力對應更高層的訂閱等級，但訂閱本身仍然是一個完整的存取權包。

兩種策略的差異不只在價格。 OpenAI 的模式把壁壘設在訂閱費上：付得起200 美元月費，就能用最好的模型。 Anthropic 對Fable 5 的策略把障礙設在兩個地方：費用（API 按量計費）和技術門檻（需要API 存取能力）。 Hacker News 上的用戶討論中，有人將這種策略稱為“藥物免費樣品策略，讓你上癮後漲價”，也有人認為這更可能是真實的算力供應鏈問題，Anthropic 暫時無法以固定價格的訂閱模式覆蓋Fable 5 的推理成本。

無論動機如何，效果是清晰的：訂閱變成了一張“入場券”，而不是“全票”。最頂級的模型能力不在票面範圍內。 TechCrunch 在關於Fable 5 發布的報告中指出，Fable 5 是「第一個公開發布的Mythos 級別模型」。在Fable 5 之前，Mythos 等級僅限Project Glasswing 合作夥伴使用。現在門檻降低了，但並沒有消失。

繞路的用戶

存取權的分層已經產生了可見的使用者行為變化。一部分用戶開始尋找繞過正規管道的路徑。

一種做法是透過第三方聚合服務呼叫模型。這些「中轉站」以低於官方標價的價格提供token，來源通常是企業批量採購的閒置額度、不同區域的價差套利或未公開管道。價格更低，但隱私保護和穩定性沒有保障。相關討論在知乎等平台上持續發酵，用戶真正擔心的不是“便宜tok en 能不能用”，而是“數據會經過誰的手”。

另一種做法是轉向開源或低價替代模型。有開發者分享教學課程，展示如何把DeepSeek 等模型接入各類開發工具，繞過官方定價和驗證流程。能力會有損失，隱私風險上升，但成本可控性顯著提高。

Hacker News 和Reddit 上的開發者討論中，混合使用策略被頻繁提及：「預設用便宜的模型，只在關鍵步驟切換Fable。」這聽起來像是合理的資源優化。如果回顧兩、三年前關於「AI 民主化」的討論，彼時的主流敘事是每個人都能平等地使用最好的模型。現在，「用最好的模型」變成了一件需要精打細算的事。

本地部署提供了另一種對照。一台能夠流暢運行大模型的GPU 價格不低，能跑120B 模型的整機配備更不是大多數個人開發者可以輕鬆承擔的。本地部署的門檻是另一種形式的付費牆，只是用硬體採購替換了按量計費。

這些繞路行為不是「聰明用戶的省錢技巧」。當大量使用者開始主動尋找替代方案，是因為原有路徑正在變窄。中轉站的隱私風險、開源模型的能力差距、本地部署的硬體投入，每一種繞路都有代價。

台階已經在腳下

如果把AI 比喻為水力發電一類的公用基礎設施，那麼公用事業的第一原則就是普遍服務、公平接入。但AI 模型的定價趨勢正在朝相反的方向走。能力越強價格越高，頂級模式脫離普惠訂閱，以token 計費讓成本變得不可預測。水電供應不會只給付費更多的用戶提供“更強電流”，但AI 正在這樣做。

這不是一個「貴還是便宜」的定價討論。當Claude Fable 這樣的頂尖模型被從大眾化訂閱中移除，當GPT-5.5 Pro 的輸出價格達到Flash 模型的13 倍，當個人開發者的一天用量能燒掉82 美元，「用不起」正在從一個價格問題變成一個結構問題。

在使用AI 工具的領域裡，階梯已經清晰可見。最上層是能負擔無限API 呼叫和專用硬體的企業級用戶，中間層是精打細算使用頂級模型的個人開發者，底層是只能用免費或低價模型的普通用戶。這道階梯的每一級，不是由技術水平劃定的，而是由支付能力和技術接入能力劃定的。

Anthropic 6 月22 日的截止日期只是這條台階上最新的一級，不是第一級，也不會是最後一級。