——從Gonka 在LA Hacks 2026 的演講談起
4月26日,DeepSeek 發布V4 系列API新定價:全系輸入緩存命中價格降至首發價的十分之一,Pro 版本疊加限時優惠後,百萬Token 的處理成本低至0.025 元——比一年前便宜了近百倍。 A 股算力板塊當日集體漲停,市場情緒沸騰。
但在歡呼聲背後,有一個問題沒有人在正面討論:當模型變得越來越便宜,運行模型所需的算力正在變得越來越集中。
數據不會說謊。 2025年第四季,微軟、亞馬遜、Meta、Google四家雲端廠商合計資本開支年增64%至1,186 億美元;預計2026 年全年合計資本開支將進一步年增53%,達到5,708 億美元。谷歌同期將2026 年TPU 晶片出貨量目標上調50%至600 萬顆。英偉達H100 系列的交貨週期,在部分市場已長達數月。
模型層的定價權正在向開發者傾斜,但算力層的控制權正在以更快的速度向少數巨頭收攏。這是AI 時代一個隱密但深刻的矛盾。
就在這個背景下,2026年4月24日, Gonka 協議聯合創始人Daniil 和David Liberman走上了LA Hacks 2026 的主題演講台。這場UCLA 年度最大高校黑客松,今年由Liberman 兄弟擔任主題演講嘉賓,面對的是數百名即將走入這個行業的頂尖工程師。他拋出的問題,在此刻格外清晰:去中心化算力,是否還來得及?
一、降價潮的另一面
DeepSeek V4 的降價邏輯,表面上是技術進步帶來的效率紅利——新的注意力機制壓縮了Token 維度,結合DSA 稀疏注意力,大幅降低了計算和顯存的需求。但降價能夠持續發生,依賴的前提是某個地方的算力夠充足、夠便宜。
現實是,這個「夠充足」的算力來源,在全球正在快速向少數節點匯聚。光通訊龍頭Lumentum 的CEO Michael Hurlston不久前表示,按當前趨勢,公司到2028 年的產能幾乎已經全部售罄。這不是個別公司的困境,而是整個AI 基礎設施供應鏈在高速擴張需求面前的集體緊張。
Daniil 在LA Hacks 演講中用了一個簡單卻有力的對照:比特幣網路的算力,已經超過Google、微軟、亞馬遜三家雲端資料中心的總和——但這些算力在做什麼?在解一道無人需要答案的哈希謎題。全球閒散的GPU 算力同樣如此:遊戲玩家機器裡的顯示卡、大學機房裡的伺服器、中小雲服務商手裡的餘量,加總起來規模龐大,卻因為缺乏協調機製而無法被AI 推理所用。
Gonka 試圖解決的,正是這個協調問題——用工作量證明的激勵機制,把散落在全球的閒置GPU 組織成一張可以承接真實AI 推理任務的網絡。
二、推理是新的戰場
DeepSeek 的降價在中文網路裡掀起了對「AI 平權」的廣泛討論。但有一個被忽略的細節:降價降的是「調用價格」,而不是「算力成本」。隨著AI 應用規模化,推理調用量的增長是指數級的——根據行業預測,到2026 年,推理將佔全球AI 算力消耗的三分之二左右。
這意味著什麼?每降低一個數量級的呼叫價格,實際需要的算力總量只會更多,不會更少。大模型的「民主化」,某種程度上反而加速了算力層的集中化——因為只有擁有大規模算力的玩家,才能在超低毛利下撐住推理服務的運作。
這是一個正在形成的結構性鎖定:誰掌控推理側的物理算力,誰就掌控了AI 時代真正的基礎設施入口。從這個角度來看,去中心化算力網路的意義,已經不只是「便宜50%」的成本優化,而是在集中化鎖定完成之前提供一條結構性的替代路徑。
三、對年輕建造者的真實拷問
LA Hacks 的參與者——來自加州頂尖大學的工程師和產品人——很快就會面臨一個並不浪漫的工程選擇:把自己的產品建在哪層算力之上。
你的AI 產品,推理調用的是誰的伺服器?
當那個平台調整定價策略或訪問政策,你有沒有遷移的能力?
你幫忙建立的使用者規模,是在為自己創造價值,還是在傳送籌碼給平台?
這些問題在Web2 時代已經被開發者們體驗過一次:當應用的命運與平台演算法或分發規則深度綁定,「獨立」就成了一個需要隨時重新定義的詞。 AI 時代的算力依賴,會把同樣的邏輯復刻到基礎設施層,而且因為切換成本更高,鎖定效應只會更強。
黑客松,作為一種形式,有它內在的反諷:36小時內,用最少的資源、最快的速度構建出可運行的東西——這恰恰是去中心化網絡激勵機制所追求的狀態。 Daniil 在LA Hacks 站上演講台,不只是為了講Gonka,更像是在問這群人:你們未來要做的事情,是在幫助這個集中化的趨勢加速,還是在製造新的可能?
四、PoW 2.0:一個工程命題
Gonka 把工作量證明的激勵結構從哈希計算重新對準了AI 推理,使網路中近100% 的算力貢獻直接對應真實任務。這套機制有一個工程上的關鍵要求:AI 推理任務必須是可驗證、可重現的——給定相同的模型權重、相同的隨機種子和輸入,任何節點都可以復現計算結果併校驗其有效性。這是Gonka 從學術原型走向可運作網路的核心工程困難。
從經濟學角度來看,這套機制的意義在於:代幣價值自然錨定於物理算力成本,而非流動性情緒。貢獻算力的礦工獲得回報,調用算力的開發者支付費用,整個體系的激勵閉環不依賴任何中間商的善意維持。
當然,技術可行性只是一部分。更難的問題是:在算力需求快速成長、大玩家資本開支以百億美元為單位的時代,一個依靠社群自發貢獻組織起來的分散式算力網絡,能不能在規模上構成真正意義上的競爭?
Gonka 的早期資料給了一個參考座標:主網上線不到一年,網路聚合算力從60 塊H100 當量擴展至超過10,000 塊,這個速度來自全球數百個獨立節點的自發接入,而非中心化調配。這不能證明規模問題已經解決,但它說明激勵機制有效地驅動了早期成長。
五、窗口期的問題
歷史上,基礎建設的主導權往往在早期快速收斂──鐵路時代如此,網路時代如此,行動網路時代亦然。每次,都有人在標準尚未固化之前找到了插入的位置,也有人在集中化完成之後才意識到參與權已經大幅收窄。
AI 算力基礎設施目前處於哪個階段?從四大雲廠商2026 年5,708 億美元的預期資本支出來看,集中化已經在加速;但從開發者的實際使用模式來看,供給面仍有大量未被有效整合的資源。這個間隙,就是去中心化網路在結構上能夠存在的空間。
Daniil 在演講中引用了一個對照:2000 年網路泡沫破滅後,留下的不是廢墟,而是鋪遍全球的光纖網絡,支撐了此後二十年數位經濟的運作。 AI 基礎設施投資熱潮退去之後,沉澱的算力協議和激勵機制,將成為下一個週期的基礎設施——問題只是,哪些協議的底層邏輯足夠堅實,能在壓力下依然保持運轉。
這不是一個關於某個具體項目的問題,而是整個去中心化AI 賽道需要直面的問題:治理設計是否能夠真正抵抗單點控制的侵蝕?激勵機制是否在規模擴大之後依然有效?算力網路的去中心化,是否在技術執行層、代幣發行層、升級決策層三個維度同時成立?
結語
DeepSeek 的降價讓「AI 民主化」的敘事再次升溫。但民主化的推理調用,和民主化的算力基礎設施,是兩件不同的事。前者正在發生;後者能否發生,取決於接下來幾年裡,有多少人真的把這當成一個值得解決的工程問題,而不只是一個好聽的敘事。

