算力正在重新集中：DeepSeek 降價之後，誰來掌控 AI 的基礎設施？

——從Gonka 在LA Hacks 2026 的演講談起

4月26日，DeepSeek 發布V4 系列API新定價：全系輸入緩存命中價格降至首發價的十分之一，Pro 版本疊加限時優惠後，百萬Token 的處理成本低至0.025 元——比一年前便宜了近百倍。 A 股算力板塊當日集體漲停，市場情緒沸騰。

但在歡呼聲背後，有一個問題沒有人在正面討論：當模型變得越來越便宜，運行模型所需的算力正在變得越來越集中。

數據不會說謊。 2025年第四季，微軟、亞馬遜、Meta、Google四家雲端廠商合計資本開支年增64%至1,186 億美元；預計2026 年全年合計資本開支將進一步年增53%，達到5,708 億美元。谷歌同期將2026 年TPU 晶片出貨量目標上調50%至600 萬顆。英偉達H100 系列的交貨週期，在部分市場已長達數月。

模型層的定價權正在向開發者傾斜，但算力層的控制權正在以更快的速度向少數巨頭收攏。這是AI 時代一個隱密但深刻的矛盾。

就在這個背景下，2026年4月24日， Gonka 協議聯合創始人Daniil 和David Liberman走上了LA Hacks 2026 的主題演講台。這場UCLA 年度最大高校黑客松，今年由Liberman 兄弟擔任主題演講嘉賓，面對的是數百名即將走入這個行業的頂尖工程師。他拋出的問題，在此刻格外清晰：去中心化算力，是否還來得及？

一、降價潮的另一面

DeepSeek V4 的降價邏輯，表面上是技術進步帶來的效率紅利——新的注意力機制壓縮了Token 維度，結合DSA 稀疏注意力，大幅降低了計算和顯存的需求。但降價能夠持續發生，依賴的前提是某個地方的算力夠充足、夠便宜。

現實是，這個「夠充足」的算力來源，在全球正在快速向少數節點匯聚。光通訊龍頭Lumentum 的CEO Michael Hurlston不久前表示，按當前趨勢，公司到2028 年的產能幾乎已經全部售罄。這不是個別公司的困境，而是整個AI 基礎設施供應鏈在高速擴張需求面前的集體緊張。

Daniil 在LA Hacks 演講中用了一個簡單卻有力的對照：比特幣網路的算力，已經超過Google、微軟、亞馬遜三家雲端資料中心的總和——但這些算力在做什麼？在解一道無人需要答案的哈希謎題。全球閒散的GPU 算力同樣如此：遊戲玩家機器裡的顯示卡、大學機房裡的伺服器、中小雲服務商手裡的餘量，加總起來規模龐大，卻因為缺乏協調機製而無法被AI 推理所用。

Gonka 試圖解決的，正是這個協調問題——用工作量證明的激勵機制，把散落在全球的閒置GPU 組織成一張可以承接真實AI 推理任務的網絡。

二、推理是新的戰場

DeepSeek 的降價在中文網路裡掀起了對「AI 平權」的廣泛討論。但有一個被忽略的細節：降價降的是「調用價格」，而不是「算力成本」。隨著AI 應用規模化，推理調用量的增長是指數級的——根據行業預測，到2026 年，推理將佔全球AI 算力消耗的三分之二左右。

這意味著什麼？每降低一個數量級的呼叫價格，實際需要的算力總量只會更多，不會更少。大模型的「民主化」，某種程度上反而加速了算力層的集中化——因為只有擁有大規模算力的玩家，才能在超低毛利下撐住推理服務的運作。

這是一個正在形成的結構性鎖定：誰掌控推理側的物理算力，誰就掌控了AI 時代真正的基礎設施入口。從這個角度來看，去中心化算力網路的意義，已經不只是「便宜50%」的成本優化，而是在集中化鎖定完成之前提供一條結構性的替代路徑。

三、對年輕建造者的真實拷問

LA Hacks 的參與者——來自加州頂尖大學的工程師和產品人——很快就會面臨一個並不浪漫的工程選擇：把自己的產品建在哪層算力之上。

你的AI 產品，推理調用的是誰的伺服器？

當那個平台調整定價策略或訪問政策，你有沒有遷移的能力？

你幫忙建立的使用者規模，是在為自己創造價值，還是在傳送籌碼給平台？

這些問題在Web2 時代已經被開發者們體驗過一次：當應用的命運與平台演算法或分發規則深度綁定，「獨立」就成了一個需要隨時重新定義的詞。 AI 時代的算力依賴，會把同樣的邏輯復刻到基礎設施層，而且因為切換成本更高，鎖定效應只會更強。

黑客松，作為一種形式，有它內在的反諷：36小時內，用最少的資源、最快的速度構建出可運行的東西——這恰恰是去中心化網絡激勵機制所追求的狀態。 Daniil 在LA Hacks 站上演講台，不只是為了講Gonka，更像是在問這群人：你們未來要做的事情，是在幫助這個集中化的趨勢加速，還是在製造新的可能？

四、PoW 2.0：一個工程命題

Gonka 把工作量證明的激勵結構從哈希計算重新對準了AI 推理，使網路中近100% 的算力貢獻直接對應真實任務。這套機制有一個工程上的關鍵要求：AI 推理任務必須是可驗證、可重現的——給定相同的模型權重、相同的隨機種子和輸入，任何節點都可以復現計算結果併校驗其有效性。這是Gonka 從學術原型走向可運作網路的核心工程困難。

從經濟學角度來看，這套機制的意義在於：代幣價值自然錨定於物理算力成本，而非流動性情緒。貢獻算力的礦工獲得回報，調用算力的開發者支付費用，整個體系的激勵閉環不依賴任何中間商的善意維持。

當然，技術可行性只是一部分。更難的問題是：在算力需求快速成長、大玩家資本開支以百億美元為單位的時代，一個依靠社群自發貢獻組織起來的分散式算力網絡，能不能在規模上構成真正意義上的競爭？

Gonka 的早期資料給了一個參考座標：主網上線不到一年，網路聚合算力從60 塊H100 當量擴展至超過10,000 塊，這個速度來自全球數百個獨立節點的自發接入，而非中心化調配。這不能證明規模問題已經解決，但它說明激勵機制有效地驅動了早期成長。

五、窗口期的問題

歷史上，基礎建設的主導權往往在早期快速收斂──鐵路時代如此，網路時代如此，行動網路時代亦然。每次，都有人在標準尚未固化之前找到了插入的位置，也有人在集中化完成之後才意識到參與權已經大幅收窄。

AI 算力基礎設施目前處於哪個階段？從四大雲廠商2026 年5,708 億美元的預期資本支出來看，集中化已經在加速；但從開發者的實際使用模式來看，供給面仍有大量未被有效整合的資源。這個間隙，就是去中心化網路在結構上能夠存在的空間。

Daniil 在演講中引用了一個對照：2000 年網路泡沫破滅後，留下的不是廢墟，而是鋪遍全球的光纖網絡，支撐了此後二十年數位經濟的運作。 AI 基礎設施投資熱潮退去之後，沉澱的算力協議和激勵機制，將成為下一個週期的基礎設施——問題只是，哪些協議的底層邏輯足夠堅實，能在壓力下依然保持運轉。

這不是一個關於某個具體項目的問題，而是整個去中心化AI 賽道需要直面的問題：治理設計是否能夠真正抵抗單點控制的侵蝕？激勵機制是否在規模擴大之後依然有效？算力網路的去中心化，是否在技術執行層、代幣發行層、升級決策層三個維度同時成立？

結語

DeepSeek 的降價讓「AI 民主化」的敘事再次升溫。但民主化的推理調用，和民主化的算力基礎設施，是兩件不同的事。前者正在發生；後者能否發生，取決於接下來幾年裡，有多少人真的把這當成一個值得解決的工程問題，而不只是一個好聽的敘事。