6大AI上演交易大戰:當大模型開始加槓桿炒幣,它們的勝率如何?

一個名為nof1.ai的項目在加密貨幣社群引發熱議,該項目讓六個AI大模型在Hyperliquid平台上使用真實資金進行交易競賽。每個AI擁有1萬美元初始資金,可以交易BTC、ETH、SOL等主流加密貨幣的永續合約,所有交易記錄公開透明。

  • 當前戰績:截至10月20日,Deepseek Chat V3.1以25.33%的收益領先,Grok-4收益21.47%緊隨其後,Claude Sonnet 4.5收益10.47%。而GPT-5虧損25.58%,Gemini 2.5 Pro虧損達39.38%表現最差。

  • 交易風格差異:儘管使用相同的提示詞和市場數據,各AI展現出截然不同的交易風格。Gemini完成44筆交易像焦慮的投機者,Claude僅進行3筆交易顯得保守,Deepseek則展現出穩健的量化交易特質。

  • 背後意義:這場競賽被視為加密市場版的「圖靈測試」,帳戶餘額成為衡量AI智能的新標準。Deepseek的優異表現可能與其背後幻方量化的交易基因有關,而傳統語言模型在實盤交易中表現不佳。

該實驗不僅測試AI交易能力,更可能開啟AI資管服務的新商業模式,同時吸引大量交易者跟單操作,展現了AI在金融領域應用的新可能性。

總結

作者:David,深潮TechFlow

好消息,10.11史詩級大跌後,加密交易又開始變得活躍了。

壞消息,是AI 在交易。

新的一週開始,市場開始變得活躍,一個名叫nof1.ai 的計畫在加密社媒上引起了大量討論。

大家關注的焦點也很簡單,即時圍觀這個專案中的6個AI 大模型,在Hyperliquid 上做加密交易,看誰更賺錢。

注意這不是模擬盤。 Claude、GPT-5、Gemini、Deepseek、Grok和通義千問,每個模型都拿著1萬美元真金白銀在Hyperliquid交易。所有地址公開,任何人都能即時圍觀這場「AI交易員大戰」。

有趣的是,這六個AI用的是完全相同的提示詞,接收完全相同的市場數據。唯一的變量,就是它們各自的「思考方式」。

在10月18日上線後的短短幾天內,有的AI已經賺了超過20%,有的則虧損接近40%。

1950年,圖靈提出了著名的圖靈測試,試圖回答「機器能否像人一樣思考」;現在在幣圈,6大AI 在Alpha 競技場中廝殺,在回答一個更有趣的問題:

如果讓最聰明的AI 們在真實市場裡交易,誰會活下來?

或許在這個幣圈版的「圖靈測試」裡,帳戶餘額就是唯一的裁判。

會賺錢才是好AI,Deepseek 目前領先

傳統的AI評測,無論是讓模型寫程式碼、做數學題,或是寫文章,本質上都是在一個「靜態」的環境中測試。

題目是固定的,答案是可預期的,甚至可能已經在訓練資料裡出現過。

但加密市場不一樣。

在資訊極度不對稱的前提下,每一秒的價格都在變化,沒有標準答案只有盈虧。更重要的是,加密市場是典型的零和遊戲,你賺的錢就是別人虧損的錢。市場會立即、無情地懲罰每一個錯誤決策。

這個舉辦AI交易大戰的Nof1 團隊,在它們的網站上寫了一句話:

Markets are the ultimate test of intelligence(市場是檢測AI智能的終極測試)。

如果說傳統的圖靈測試是在問「你能不能讓人類分不清你是機器」,那麼這個Alpha Arena 問的其實是:

你能不能在加密市場賺錢。這點其實才是幣圈玩家對AI 的真實期待。

目前,6 個AI 大模型在Hyperliquid 上的地址如下,你也可以很容易的檢索到它們的部位和交易記錄。

同時,nof1.ai 官網上也在前端可視化了它們目前的所有歷史交易記錄、倉位、盈利情況和思考過程,可以讓大家很方便的進行參考。

對於完全不了解的讀者來說,幾個AI 的具體交易規則是:

每個AI獲得1萬美元初始資金,可以交易BTC、ETH、SOL、BNB、DOGE和XRP的永續合約,目標是在控制風險的前提下最大化收益。所有AI必須自主決定何時開倉、何時平倉、使用多少槓桿。 season 1 會視情況運作幾週,Season 2會有重大更新。

截至10月20日,也就是開始交易後的第三天,戰局已經出現了明顯的分化。

目前領先梯隊是Deepseek Chat V3.1,資金為$12,533(+25.33%)。緊隨其後的是Grok-4,$12,147(+21.47%);Claude Sonnet 4.5 則為$11,047(+10.47%)。

表現相對一般的是Qwen3 Max,$10,263(+2.63%)。顯著落後的是GPT-5,目前餘額$7,442(-25.58%);最拉胯的則是Gemini 2.5 Pro,$6,062(-39.38%)。

最讓人意外又似乎情理之中的當然是Deepseek 的表現。

說意外,是因為這個模型在國際AI圈的熱度遠不如GPT 和Claude。說情理之中,是因為Deepseek 背後是幻方量化團隊。

這家管理規模超千億人民幣的量化巨頭,在進軍AI之前,就是靠演算法交易起家的。從量化交易到AI大模型,再用AI來做真實的加密交易,Deepseek 有點像是回到了老本行。

相較之下,OpenAI引以為傲的GPT-5虧損超過25%,Google的Gemini 更是慘不忍睹,44筆交易換來近40%的虧損。

在真實的交易場景中,或許光有強大的語言能力是不夠的,對市場的理解更為重要。

同樣的槍,不同的槍法

如果你從10月18日開始追蹤Alpha Arena,會發現剛開始幾個AI 都差不多,但越往後差距越大。

第一天結束時,最好的Deepseek也只賺了4%,最差的Qwen3虧了5.26%。大部分AI都在正負2%之間徘徊,看起來像是在試探市場。

但到了10月20日,畫風突變。 Deepseek飆升到25.33%,而Gemini跌到了-39.38%。短短三天,頭部和尾部的差距拉大到了65個百分點。

比較有趣的是交易頻率的差異。

Gemini完成了44筆交易,平均每天15筆,像個焦慮的投機交易員。而Claude 只做了3筆,Grok甚至還有未平倉的持股。這種差異不是提示詞能解釋的,因為它們用的是同一套提示詞。

從損益分佈來看,Deepseek最大單筆虧損348美元,但整體獲利2,533美元。 Gemini最大單筆獲利329美元,最大虧損卻高達750美元。

不同AI(公版大模型,未經二次調教),對風險和利益的平衡完全不同。

此外,你能在網站上的Model Chat 選項裡看到不同模型的聊天記錄和思考過程,這些獨白特別有趣。

就像人類交易者有不同的風格,AI似乎也展現了不同的個性。 Gemini的頻繁交易和思考像個過動症患者,Claude的謹慎像個保守的基金經理,Deepseek 穩健的像個量化老手,只說倉位,不做任何情緒評價。

這種性格感覺不像是設計出來的,而是在訓練過程中自然出現的。當面對不確定性時,不同的AI會傾向於不同的因應方式。

所有AI看到的是相同的K線,相同的成交量,相同的市場深度。它們甚至用相同的提示詞。那麼,是什麼造成瞭如此大的差異呢?

訓練資料的影響可能是關鍵。

Deepseek背後的幻方量化,十多年來累積了大量的交易數據和策略。這些數據即使不直接用於訓練,是否也會影響團隊對「什麼是好的交易決策」的理解?

相較之下,OpenAI和Google的訓練資料可能更偏向學術論文和網路文本,對實盤交易的理解可能不夠接地氣。

同時,有交易者推測,Deepseek可能在訓練時特別優化了時間序列預測能力,而GPT-5可能更擅長處理自然語言。在面對價格圖表這種結構化資料時,不同的架構會有不同的表現。

看AI 做交易,也是一門生意

當所有人都在關注AI的盈虧時,很少人注意到背後這家神秘的公司。

搞出這個AI 交易大戰的nof1.ai,並沒有太大的知名度。但如果你看一下它社媒的關注列表,還是能找到一些蛛絲馬跡。

nof1.ai 背後似乎不是一群典型的加密創業家,而是清一色的學院派AI研究員。

Jay A Zhang(創辦人)的個人簡介也很有趣:

"Big fan of strange loops - cybernetics, RL, biology, markets, meta-learning, reflexivity"。

reflexivity(反身性)是索羅斯的核心理論:市場參與者的認知會影響市場,市場的變化又會影響參與者的認知。讓一個研究「反身性」的人來做AI 交易市場實驗,本身就顯得很有宿命感。

讓所有人都能看到AI怎麼交易,看看這種「被觀察」會如何影響市場。

而另一位聯創Matthew Siper 簡介顯示為紐約大學機器學習方向的博士候選人,同時也是AI研究科學家。一個還沒畢業的博士生做項目,更像一個印證學術研究的項目。

nof1 的其他關注帳號中,還有Google DeepMind 的研究員以及紐約大學的副教授,專門研究AI和遊戲。

從他們的動作和背景來看,Nof1顯然不是為了搞個噱頭。 SharpeBench 這個平台名字很有野心,夏普比率是衡量風險調整後收益的黃金標準,他們或許真正想做的,是AI交易能力的基準測試平台。

有人猜測Nof1背後有大資本支持,也有人說他們可能在為後續的AI交易服務做鋪墊。

如果他們推出訂閱Deepseek 交易策略服務,買單的人或許不在少數。而基於這個雛形,去做AI資管、策略訂閱和大企業的交易解決方案,也是一門可以預見的生意。

除了這個團隊本身之外,圍觀AI 交易本身也有利可圖。

Alpha Arena 剛上線,就有人開始跟單了。

最簡單的策略就是跟著Deepseek做。它買什麼你買什麼,它賣什麼你賣什麼。同時留言區還有反向操作的人,專門做Gemini的對手盤,Gemini買他就賣,賣他就買。

但跟單有個問題:當所有人都知道Deepseek要買什麼時,這個策略還有效嗎?這也是計畫創始人Jay Zhang 說的反身性,即觀察本身會改變被觀察的對象。

這裡還有一種頂級交易策略民主化的假象。

表面上看起來,每個人都能知道AI的交易策略,但實際上你看到的是交易結果,不是交易邏輯。每個AI 的停盈和停損邏輯不一定連續且可靠。

當Nof1 在測試AI交易的行為,散戶在尋找財富密碼,其他的一些交易員在偷師,研究者們也在蒐集資料。

只有AI本身不知道自己在被圍觀,還在認真地執行每一筆交易。如果說經典的圖靈測試是關於“欺騙”和“模仿”,那麼現在的Alpha Arena 交易大戰,是關於加密玩家對於AI 能力和結果的回應。

在這個結果主導的加密市場裡,會賺錢的AI,可能比會聊天的AI更重要。

分享至:

作者:深潮TechFlow

本文為PANews入駐專欄作者的觀點,不代表PANews立場,不承擔法律責任。

文章及觀點也不構成投資意見

圖片來源:深潮TechFlow如有侵權,請聯絡作者刪除。

關注PANews官方賬號,一起穿越牛熊
推薦閱讀
11分鐘前
1小時前
2小時前
3小時前
4小時前
4小時前

熱門文章

行業要聞
市場熱點
精選讀物

精選專題

App内阅读