作者:龍玥
來源:華爾街見聞
近日,美國創業加速器Y Combinator(YC)在舊金山舉辦首屆AI 新創學校(AI Startup School)並邀請多位AI 產業重量級人物出席,包括埃隆·馬斯克、OpenAI 首席執行官奧特曼等。
前不久剛結束130 天美國政府「政府效率部」(DOGE)特別僱員任期的馬斯克,在訪談中直言不諱地評價這段經歷如同一次“有趣的支線任務”,但其重要性在即將到來的AI 革命面前相形見絀。他將政府效率部門的工作比作“清理海灘”,而即將到來的AI 則是“千英尺高的海嘯”。
修復政府就像…海灘很髒,有針頭、糞便和垃圾。但接著還有一道千英尺高的水牆,那就是AI 海嘯。如果一場千英尺高的海嘯即將來臨,清理海灘有多大意義?沒多大意義。
馬斯克預測數位超級智慧可能在今年或明年到來,將比人類更聰明,同時未來人形機器人數量將遠超人類,可能達人類人口的5-10 倍。他更是大膽預言AI 驅動的經濟規模將是當前的數千倍甚至數百萬倍,人類智能佔比可能降至1% 以下。以下為其講話部分要點:
• 馬斯克宣布已於5 月28 日離開DOGE,結束130 天的政府特別員工任期,稱「回到主線任務」;
• 馬斯克將政府效率部門工作比作“清理海灘”,而即將到來的AI 則是“千英尺高的海嘯”,當後者即將到來時,相比之下前者意義不大;
• 預測數位超級智慧可能在今年或明年到來,將比人類更聰明,他強調「今年不發生,明年肯定發生」;
•未來人形機器人數量將遠超過人類,數量可能是人類的5 倍,甚至10 倍;
•預言AI 驅動的經濟規模將是當前的數千倍甚至數百萬倍,推動文明邁向卡爾達肖夫II 型(恆星能源級),人類智能佔比可能降至1% 以下;
•馬斯克強調「對真相的嚴謹堅持」是AI 安全最重要的基石,強迫AI 相信不真實之事極度危險;
•回顧SpaceX 早期,三連敗後第四次火箭發射成功是「生死一線」,2008 年特斯拉融資在破產前最後一刻完成。

DOGE 任務完成:政治噪音太大,回歸「主線任務」
馬斯克在訪談中坦言,在華盛頓特區的經歷讓他深刻體會到「政治中的訊號噪音糟透了」。他將在DC 的工作描述為「有趣的支線任務」,但最終決定「回到主線任務——建立技術,這是我喜歡做的事」。
這位億萬富翁解釋了自己離開政府職務的根本原因:「修復政府就像清理海灘——海灘很髒,有針頭、糞便和垃圾。但同時還有這堵千英尺高的水牆,這就是AI 海嘯。如果你面臨千英尺高的海嘯,清理海灘真的還有多重要呢?並沒有那麼重要。」
AI 超級智慧迫在眉睫:今年或明年必然到來
馬斯克對數位超級智慧的到來時間給出了極為明確的預測。他表示:「我認為我們已經非常接近數位超級智慧了。如果今年不會發生,明年肯定會發生。」
他定義的「數位超級智慧」是「在任何事情上都比任何人類都更聰明的智慧」。馬斯克預測,AI 將推動經濟規模實現指數級成長——「不是比當前經濟大10 倍,而是數千倍,甚至數百萬倍」。
AI 將如此深刻地改變未來,其程度難以估量……假設我們沒有誤入歧途,AI 沒有消滅我們和它自己,那麼你最終將看到的不是一個比當前經濟大十倍的經濟。最終,如果我們…的後代(主要是機器後代)成為卡爾達肖夫II 型或更高級的文明,我們談論的將是一個比今天經濟大數千倍,甚至數百萬倍的經濟體。
他進一步闡述了人類智能在未來的地位:「在某個時刻,人類智能的百分比將變得相當小。在某個時刻,人類智能的集合總和將不到所有智能的1%。」
xAI 目前正在訓練Grok 3.5
馬斯克在訪談中透露,xAI 目前正在訓練Grok 3.5,「專注於推理能力」。
根據ZeroHedge 報導,xAI 正尋求43 億美元的股權融資,這將與50 億美元的債務融資相結合,涵蓋xAI 和社交媒體平台X。
硬體競賽:從零到十萬GPU 的工程奇蹟
馬斯克用第一原理思維解決了AI 訓練的硬體挑戰。當供應商告訴他們需要18 到24 個月才能完成10 萬個H100 GPU 的訓練超級叢集時,馬斯克團隊將其壓縮到6 個月。
他們租用了孟菲斯一家廢棄的Electrolux 工廠,透過租賃發電機解決150 兆瓦的電力需求,租用了美國四分之一的行動冷卻設備,並使用特斯拉Mega Packs 來平滑訓練過程中的功率變化。馬斯克甚至親自參與佈線工作,「睡在資料中心」。
目前,該訓練中心擁有15 萬個H100、5 萬個H200 和3 萬個GB200,第二個資料中心即將上線11 萬個GB200。
多重未來願景:機器人軍團與星際文明
馬斯克預測,未來將有至少5 倍於人類數量的人形機器人,「也許是10 倍」。他坦言曾因擔心「讓終結者成為現實」而在AI 和機器人領域拖延,但最終意識到「無論我做不做,這都會發生。你要么是觀眾,要么是參與者。我寧願做參與者。」
在更宏大的願景中,馬斯克將人類文明置於卡爾達肖夫等級的框架下。他認為人類目前只利用了地球1-2% 的能源,距離一級文明還很遙遠。而成為多行星物種是擴展意識到星際的關鍵步驟,「極大提高文明或意識的可能壽命」。
馬斯克表示,SpaceX 計劃在大約30 年內向火星轉移足夠的物質,使火星能夠自給自足,「即使來自地球的補給船停止運行,火星也能繼續發展繁榮」。

訪談全文如下(由AI 翻譯)
馬斯克(Elon Musk)
我們正處於智慧大爆炸非常非常早期的階段。成為多行星物種能大大延長文明、意識或智慧(無論是生物的還是數位的)可能的存續時間。我認為我們非常接近數位超級智慧了。如果今年沒實現,明年一定能成。
YC 執行長暨總裁Garry Tan
[音樂] 讓我們掌聲歡迎伊隆馬斯克。 [掌聲] 埃隆,歡迎來到AI 創業學院。你今天能大駕光臨,我們真的真的感到無比榮幸。從SpaceX、特斯拉、Neuralink、xAI 等等說起。在你做這一切之前,你生命中有沒有某個時刻讓你覺得「我必須做出點偉大的事」?是什麼讓你做出了這個決定?
馬斯克(Elon Musk)
我最初並不認為自己能做出什麼偉大的事。 我只是想嘗試做些有用的東西,但我不認為我能做出什麼特別偉大的東西。如果你從機率上講,那似乎不太可能, 但我至少想試試看。
Garry Tan
你現在面對的是一屋子的人,他們都是技術工程師, 其中不乏一些冉冉升起的頂尖AI 研究者。
馬斯克(Elon Musk)
好吧。我我覺得我們應該...我更喜歡「工程師」這個詞,而不是「研究員」。我是說,如果有什麼基礎演算法的突破,那算研究,但除此之外都是工程。
Garry Tan
也許我們可以從很久以前說起。我的意思是,你現在面對的是一屋子18 到25 歲的年輕人。 這裡更偏年輕化,因為創辦人群越來越年輕了。 你能設身處地想想他們嗎?當你18、19 歲的時候,你知道,學習編程,甚至想出了Zip2 的第一個點子。對你來說,那是什麼感覺?
馬斯克(Elon Musk)
是的,早在95 年,我面臨一個選擇:要么在斯坦福讀研究生、博士, 其實是材料科學方向,研究超級電容器,想用在電動車上,本質上是為了解決電動車的續航問題; 要么就投身於這個當時大多數人聞所未聞、叫做“互聯網”的東西。 我和我的教授談過,他是材料科學系的比爾‧尼克斯(Bill Nix), 我說, 我能不能休學一個學期? 因為這個(網路)很可能會失敗,然後我就得回學校繼續讀書。
然後他說,這可能是我們最後一次談話了。 他說對了。 所以,但我當時覺得事情大概率會失敗,而不是大機率會成功。 然後在95 年,我寫了... 基本上,我認為是第一個或接近第一個的網路地圖、路線指引、白頁和黃頁。
我就自己寫了那些程式碼,我甚至沒用網頁伺服器。我直接讀取端口,因為我負擔不起,也負擔不起一條T1 專線。 最初的辦公室在帕洛阿爾託的謝爾曼大道(Sherman Avenue)。 樓下好像就有ISP(網路服務供應商)。所以我就往地板上鑽了個洞, 直接拉了根網線連接到ISP。
然後你知道, 我兄弟加入了我,還有另一位聯合創始人格雷格·庫裡(Greg Curry),他已經去世了。 我們當時連住的地方都負擔不起,所以我們就...辦公室每月租金500 美元,我們就睡在辦公室裡,然後在佩奇米爾路的基督教青年會(YMCA)洗澡。 是的,我們最後算是做了一家有點用的公司, Zip2,在初期。 我們我們確實開發了很多非常非常棒的軟體技術,但我們某種程度上被傳統媒體公司「俘虜」了,因為像奈特- 里德報業(Knight-Ridder)、紐約時報(New York Times)這些公司既是投資者,又是客戶,也在董事會裡。
所以他們總是想把我們的軟體用在毫無意義的地方。 所以我想直接面向消費者。總之,Zip2 的事就不細說了,但核心是我真的只是想在網路上做點有用的事。 因為我就兩個選擇:要麼讀博士,看著別人建立網路;要麼以某種微小的方式參與建立網路。我當時想, 我猜我總可以先嘗試,失敗了再回去讀研究所。 不管怎樣,結果算是相當成功吧。賣了大概3 億美元,
這在當時是很大一筆錢。現在嘛,我覺得一家AI 新創公司的最低起拍價都得10 億美元了。 這就像...現在有太多該死的獨角獸公司了,簡直像一群獨角獸,你知道的,獨角獸是指估值十億的情況。
Garry Tan
從那以後通貨膨脹了,所以實際上錢貶值了不少。
馬斯克
是的。我是說,在1995 年,你大概花5 美分就能買個漢堡?好吧,沒那麼誇張,但我是說,是的,確實發生了很多通膨。 但我是說,現在AI 的熱度是相當高,就像你看到的。 你知道,你會看到有些公司,成立不到一年,有時就能獲得十億甚至幾十億美元的估值。 我猜其中一些可能會成功,也可能確實會成功。 但看到其中一些估值確實讓人瞠目結舌。 是的,你怎麼看?我是說,
Garry Tan
我個人非常看好。我其實非常樂觀。所以,我認為在座的各位將會創造大量的價值,這些價值你知道,全球應該有十億人都在使用這些東西。 我們現在甚至還沒觸及表面。我很喜歡那個網路的故事, 即使在那個時候,你也很像在座的各位,因為你知道,所有傳統媒體公司的CEO 們都把你視為那個懂網路的人。而現在,對於那個不理解AI 正在發生什麼的廣闊世界——那個企業界,或者說整個世界——他們將會指望在座的各位,理由完全一樣。聽起來你似乎知道...有哪些切實的教訓?聽起來其中之一是不要放棄董事會控制權,或是要非常小心,得有個真正的好律師。
馬斯克
我想我第一家新創公司最大的錯誤就是讓傳統媒體公司掌握了太多股東和董事會控制權,這必然導致他們從傳統媒體的視角看問題, 於是他們會讓你做一些對他們來說似乎合理,但用新技術來看其實根本不合理的事情。 我應該指出,我我最初其實並沒打算開公司。我...我試過去網景(Netscape)找工作。 我把履歷投給網景了。 馬克·安德森(Mark Andreessen)知道這事。
但我認為他根本沒看到我的履歷,然後沒人回應。所以之後我試著在網景的大廳裡晃悠,看能不能「偶遇」誰,但我太害羞了,不敢跟任何人說話。所以我就想,天啊,這太荒謬了。那我就自己寫軟體,看看會怎樣吧。所以,這其實不是出於「我想開公司」的立場。我只是想參與建設,你知道的,網路的某個部分。 既然我在網路公司找不到工作,那我就得創辦一家網路公司。總之,是的。是的。我是說,AI 將深刻改變未來。其程度難以估量, 但你知道經濟呢,假設我們不走彎路,
而且AI 沒有把我們和它自己都乾掉, 那麼你最終會看到一個不是比當前經濟規模大10 倍的經濟,最終,如果我們成為比如說,或者不管我們的未來機器後代是什麼,或者說主要是機器後代,成為卡爾達肖夫等級(Kardashev Scale)2 級或更高級的文明。那我們談論的經濟規模將是今天的數千倍,也許是數百萬倍。所以, 是的,我是說,我我當時確實有點感覺,你知道,當我在華盛頓特區時,因為要清除浪費和欺詐而備受抨擊,那算是個有趣的支線任務吧, 就支線任務而言。 但得回到主線任務上來了。是的,我得回到這裡的主線任務上來了。嗯但我確實感覺到,你知道,有點像是...這就好比政府改革有點像...好比海灘很髒,有針頭、糞便和垃圾,你想清理海灘,但與此同時還有一道一千英尺高的水牆——那就是AI 海嘯—— 如果一千英尺的海嘯就要襲來,清理海灘還真的有多大意義嗎?意義不大。哦,很高興你回到主線任務了。這非常重要。
是的,回到主線任務。 建造技術,這是我喜歡做的事。 幹擾太多了。政治的訊號噪音比太糟糕了。
Garry Tan
所以, 我是說,我住在舊金山,所以你不用跟我說兩次(我也懂)。
馬斯克
是的,華盛頓特區就像是,你知道的,我猜整個華盛頓都是政治,但如果你試圖建造火箭或汽車,或者你試圖讓軟體可靠地編譯和運行,那麼你必須最大程度地追求真相,否則你的軟體或硬體就無法工作。 就像你不能欺騙數學, 數學和物理是嚴苛的裁判。 所以我習慣待在那種最大程度追求真相的環境中,而這肯定不是政治。 所以不管怎樣,我很高興回到,你知道的,科技領域。我想我
Garry Tan
有點好奇,回到Zip2 那一刻。你當時有幾億美元,或者說你套現了幾億美元?
馬斯克
我是說,我拿到了2000 萬,對吧?
Garry Tan
好吧。所以,你至少解決了錢的問題。 然後你基本上拿著它繼續賭下去,你繼續參與了X.com,後來變成了PayPal 和Confinity(合併)。
馬斯克
是的。我把籌碼留在賭桌上了。
Garry Tan
不是每個人都會這麼做。在座的很多人將來也得做這個決定。是什麼驅使您再次投入戰鬥?
馬斯克
我覺得對於Zip2,我們開發了非常棒的技術,但從未真正充分利用。至少在我看來,我們的技術比雅虎或其他任何人都好,但被我們的客戶(媒體公司)限制了。所以我想做點不受客戶約束的事,直接面對消費者。這就是後來的X.com/Paypal。本質上是X.com 與Confinity 合併,我們一起創建了Paypal。
然後,實際上Paypal 的「校友網絡」(Paypal Mafia)可能創造了比21 世紀其他任何公司都多的公司。 Infinity 和X.com 合併時,聚集了這麼多有才華的人。我只是想...我覺得在Zip2 我們有點被束縛了手腳,我就想,好吧,如果我們不被束縛,直接面向消費者會怎樣?結果就是這樣。
但是,是的,拿到Zip2 那2000 萬美元支票時(指個人所得),我當時和四個室友合住,銀行里大概只有一萬塊存款。然後這張支票居然是透過郵件寄來的(太不可思議了)。透過郵件寄來!然後我的銀行餘額一下子從一萬變成了兩千零一萬(2000 萬+ 1 萬)。我就想, 好吧(還要扣稅什麼的)。但我後來幾乎把所有的錢都投進了X.com。就像你說的,幾乎把所有籌碼都留在賭桌上了。
是的,PayPal 之後,我就想, 我有點好奇為什麼我們還沒派人去火星。 我去了NASA 網站想找我們什麼時候派人去火星,結果沒有日期。我以為可能是網站太難找了。 但事實上,根本沒有送人去火星的真正計畫。於是, 你知道,這說來話長,我不想在這裡佔用太多時間,但
Garry Tan
我想我們都聽得全神貫注。
馬斯克
所以,所以當時我其實在長島高速公路(Long Island Expressway)和我朋友阿德奧·羅西(Adeo Ressi)在一起。 我們在大學是同學(賓州大學), 阿德奧問我PayPal 之後打算做什麼,我說, 我不知道,我猜也許我想在太空領域做點公益計畫吧,因為我不認為我能在太空領域做任何商業性的東西,那看起來是國家的專屬領域。 所以但你知道我很好奇我們什麼時候送人去火星, 就是那時我發現,哦,網站上沒有,我開始深挖。 我肯定這裡省略了很多,但我我我最初的想法是做一個叫“火星生命”(Life to Mars)的火星慈善任務,就是送一個帶種子和脫水營養凝膠的小型溫室到火星,在火星上著陸,然後你知道的,給凝膠加水,然後你就有了這個絕妙的鏡頭——紅色背景上的綠色植物。
順便說一句,很長一段時間我都沒意識到「money shot」我想是個色情片的梗(指關鍵的高潮鏡頭)。但, 總之,重點是那將是紅色背景上綠色植物的絕妙鏡頭,試圖以此激勵你知道的,NASA 和公眾派宇航員去火星。隨著我了解更多,我意識到哦,順便說一下,在這個過程中,我在2001 和2002 年左右去了俄羅斯買洲際彈道飛彈(ICBMs),這就像一次冒險。你知道的,你去見俄羅斯高層指揮官,說「我想買些洲際彈道飛彈」。 這是為了進入太空。是的。不是為了不是為了炸誰,但他們必須作為裁軍談判的結果,他們必須銷毀一大批他們的大型核彈。所以我就想,好吧,我們拿兩枚,你知道的,去掉核彈頭, 再加一個額外的上面級用於火星。
但這感覺有點迷幻,你知道的,2001 年左右在莫斯科,和俄羅斯軍方談判買洲際彈道飛彈。這太瘋狂了。 但他們也一直給我提價,所以這簡直是正常的談判反著。所以我就想,天啊,這些東西變得真貴。
然後我意識到,真正的問題並不是缺乏去火星的意願,而是根本沒有辦法在不超出預算的情況下做到,你知道的,甚至連NASA 的預算都負擔不起。所以這就是我決定創辦SpaceX 的原因——SpaceX 是為了推進火箭技術,達到我們能送人去火星的程度。 那是在2002 年。
Garry Tan
所以那不是你一開始就想創立一家企業。你只是想開始做點你覺得有趣、人類需要的東西,然後就像,你知道的,像貓扯線團一樣,球就慢慢解開了,結果這可能是門非常賺錢的生意。
馬斯克
現在確實賺錢,但之前沒有火箭新創公司成功的先例,雖然有過一些商業火箭公司的嘗試,但都失敗了。所以SpaceX 創辦SpaceX 時, 真的是出於這樣的想法:我覺得成功的幾率不到10%,也許只有1%,我不知道。 但但但一家新創公司如果不做點什麼來推進火箭技術,那它肯定不是來自那些大型國防承包商,因為他們只是政府的附庸,而政府只想做非常常規的事情。所以, 要嘛是來自新創公司,要嘛根本不會發生。所以,所以即使成功率很小也比沒機會好, 所以是的,SpaceX 我在2002 年年中創辦它時,預期會失敗。我就像我說的,大概90% 的失敗率,甚至招募人時,我也沒試圖粉飾說它會成功。
我說我們很可能會完蛋。 但有1/10 的機會可能不會完蛋,如果但這是送人去火星、推進技術水準的唯一方法。 然後我最後成了火箭的總工程師, 不是因為我想要,而是因為我僱不到厲害的人。所以, 沒有優秀的資深工程師願意加入,因為他們覺得太冒險了,你會完蛋的。 所以我就成了火箭的總工程師。你知道,頭三次發射確實失敗了。所以那算是個學習過程吧。 第四次很幸運成功了。但如果第四次沒成功我就沒錢了,那就徹底結束了。所以那是非常懸的事。
如果第四次獵鷹(Falcon)發射失敗,那就徹底完了,我們就加入之前那些火箭新創公司的墓地了。所以, 我對成功幾率的估計不算太離譜。 我們只是險之又險地成功了。 特斯拉差不多是同時進行的。 2008 年是艱難的一年。 因為在2008 年中或叫2008 年夏天SpaceX 的第三次發射失敗了,我們連續三次失敗。 特斯拉的融資輪也失敗了。所以特斯拉很快就破產了。 這就像,天啊,這太慘了。 這這將成為傲慢自大的警世故事。
Garry Tan
可能在那段時間裡,很多人都在說,埃隆是個搞軟體的,為什麼你要做硬體?為什麼...是的,他為什麼要選擇做這個,對吧?
馬斯克
是的。 100%。所以你可以看看當時的媒體, 因為那時的報道現在還能在網路上找到。他們一直叫我「網路小朋友」(internet guy)。 所以「網路小子」又名「傻瓜」試圖造火箭公司。 所以你知道我們被嘲笑了很多。 這聽起來確實很荒謬,網路小子開火箭公司聽起來就不像能成功的配方。
老實說。所以我不怪他們。我當時想,是啊,你知道,聽起來確實不太可能,我也同意這不太可能。 但幸運的是第四次發射成功了, 然後NASA 授予了我們一份補給空間站的合約。 我想那大概是12 月22 號左右,或是聖誕節前。 因為即使第四次發射成功也不足以保證成功。我們還需要一份大合約才能活下去。所以, 所以我接到了NASA 團隊的電話,他們真的說了,我們授予你們一份補給太空站的合約。我簡直...我脫口而出,「我愛你們。」這通常不是,你們知道的,他們能聽到的話。
因為通常都是很,你知道的,很冷靜的,但我當時想,「天啊,這救了公司。」然後, 我們關閉特斯拉融資輪是在它可能完成的最後一天、最後一小時,就是2008 年12 月24 日下午6 點。 如果那輪融資沒關閉,聖誕節後兩天我們就得拖欠薪水了。所以2008 年底真是讓人神經緊繃。
Garry Tan
我想從您的Paypal 和Zip2 經歷,到跳進這些硬核的硬體新創公司,貫穿始終的一點是能夠找到並最終吸引這些特定領域裡最聰明的人...你知道,那我是說在座的各位, 有些人甚至還沒管理過一個人。他們才剛開始職業生涯。你會對,你知道的,那個還沒做過這些事的伊隆說些什麼?
馬斯克
我通常認為要嘗試盡可能做有用的事。這聽起來可能有點陳腔濫調,但做有用的事真的很難,尤其是對很多人有用。 比如說,總效用的曲線下面積,就是你對你同胞有多大用處乘以多少人? 就像物理上對「真實功」(true work)的定義。要做到這一點極為困難。而我認為如果你立志做「真實功」, 你你成功的幾率會高很多。 就像,別追求榮耀,要追求做功。
Garry Tan
你怎麼判斷那是「真功」?是靠外部回饋嗎?例如別人怎麼看或你知道產品對人有什麼用?
馬斯克
就像你知道,對你來說,當你找人工作時,你看重什麼?例如你知道,你找人或他們那是不同的問題。我想是我是說就你的最終產品而言,你只要說, 如果這東西成功了,它將對多少人有多大用處? 這就是我的意思。然後你你做任何事,你知道的,無論你是CEO 還是新創公司裡的任何角色,你做任何需要做的事來成功,就像並且要不斷粉碎你的自我(ego),就像, 內化責任(internalize responsibility)。 一個主要的失敗模式就是當自我與能力之比(ego to ability ratio) 大於1 的時候。你知道如果你如果你的自我能力比太高,
那你基本上就切斷了通往現實的回饋迴路。 用AI 術語來說,你你會打破你的強化學習(RL)迴路。所以,你不想打破你的迴路,你想要一個強大的RL 迴路,這意味著內化責任(internalizing responsibility)並最小化自我(minimizing ego),無論任務是崇高還是卑微,你都去做。所以,我是說,這就是為什麼我其實更喜歡「工程」(engineering)這個詞,而不是「研究」(research)。我比較喜歡這個詞,而且我不想叫xAI 一個實驗室(lab)。
我只想它是一家公司。 就像,無論是最簡單、 最直接、 理想情況下最低自我(ego)的術語,這些通常都是好的方向。 你你只想緊密地閉合與現實的迴路(close the loop on reality hard)。 這這這是件超級大事。
Garry Tan
我想在座各位都非常欽佩您在運用第一原理(First principles)方面的典範作用。您是怎麼確定自己的「現實」的?這似乎是其中很重要的一部分。那些從未創造過任何東西、非工程師的人,例如某些記者,他們有時會批評您。但顯然您身邊還有另一群人,他們是建造者,有著非常高的...功業曲線下面積(指成就巨大)。人們該如何看待這一點?哪些方法對您有效?您會如何傳遞給...比如說您的孩子?您會怎麼告訴他們在這個世界立足的方法?例如,如何基於第一原理建構一個可預測的現實觀。
馬斯克
物理學的工具在理解任何領域並取得進展方面都極為有用。 第一原理顯然是指,你知道的,將事物分解到最可能正確的基本公理要素(fundamental axiomatic elements),然後儘可能邏輯清晰地向上推理,而不是通過分析或類比來推理。 然後就是一些簡單的事,例如極限思維(thinking in the limit),就像如果你外推最小化這個東西或最大化那個東西,極限思維非常有幫助。 我使用物理學的所有工具。
它們適用於任何領域。 這就像是一種超能力。 所以你可以拿,比如說火箭。你可以說, 一枚火箭該花多少錢? 人們通常採用的方法會看歷史上火箭的成本是多少,然後假設任何新火箭的成本必須和以前的火箭成本差不多。而第一原理的方法是,你看火箭是由哪些材料組成。如果是鋁, 銅,碳纖維, 鋼,無論是什麼, 然後說這枚火箭有多重, 它的組成元素是什麼?它們有多重?這些組成元素每公斤的材料價格是多少?這就設定了火箭成本的真正底線。它可以漸進地接近原材料的成本。
然後你意識到,哦,實際上一枚火箭的原料只佔歷史火箭成本的1% 或2%。所以製造過程必然是非常低效率的, 如果如果原料成本只有1% 或2% 的話。這就是火箭成本優化潛力的第一原理分析。而這還是在考慮可重複使用性之前。 舉一個AI 方面的例子,我猜去年,當xAI 試圖建造一個訓練超級集群(training supercluster)時, 我們我們去找各家供應商,說(這是去年初的事)我們需要10 萬塊H100(GPU)來進行連貫訓練(train coherently)。
他們估計完成這件事需要18 到24 個月。我說, 我們需要在6 個月內完成。 否則我們就沒競爭力了。所以然後如果你把它分解,你需要什麼? 你需要一棟建築,你需要電力,你需要冷卻。 我們沒時間從零開始蓋一棟大樓。所以我們必須找一個現成的建築。於是,我們找到了孟菲斯一個廢棄的工廠,以前是生產伊萊克斯(Electrolux)產品的。 但它的輸入功率是15 兆瓦,而我們需要150 兆瓦。
所以, 我們我們租了發電機,把它們放在大樓的一側,然後我們需要冷卻。所以,我們租用了美國大約四分之一的移動冷卻能力,把冷卻器(chillers)放在大樓的另一側。 這還沒完全解決問題,因為在訓練過程中功率波動非常大。所以功率可能在100 毫秒內下降50%,發電機跟不上。於是我們結合我們增加了特斯拉Megapacks(大型電池組),並修改了Megapacks 的軟體,使其能夠平滑訓練過程中的功率波動。 然後還有一大堆網路挑戰。 因為如果你試著讓10 萬塊GPU 進行連貫訓練,網路線非常非常有挑戰性。
Garry Tan
……聽起來您提到的幾乎任何一件事,我都能想像有人會直接告訴您「不行,你搞不到那個電力」,「你搞不定這個」。第一原理思考的一個關鍵點似乎是:我們要問「為什麼」,要弄清楚原因,並且要挑戰對面的人。如果他們給的答案我不滿意,我就不會接受它。是這樣嗎?我覺得,如果有人想像您一樣做硬件,似乎尤其需要這一點。而在軟體領域,我們有很多冗餘,像是「我們可以加更多CPU,沒問題的」。但在硬體上,行不通就是行不通。
馬斯克
我認為這些第一原理思維的通用原則適用於軟體和硬件,也適用於任何事物。 我只是用了一個硬體方面的例子來說明我們如何被告知某事不可能,但一旦我們將其分解成組成要素——我們需要一棟建築,我們需要電力,我們需要冷卻,我們需要我們需要功率平滑(power smoothing)——然後我們就能解決這些組成要素。 但它是...然後我們我們讓網路營運團隊進行所有的佈線工作,所有事四班倒24/7, 我也睡在資料中心,還親自佈線。
還有很多其他問題要解決。 你知道去年沒人用10 萬塊H100 進行連貫訓練。也許今年有人做了。我不知道。 然後然後我們後來把它翻倍到了20 萬塊。所以現在我們我們在孟菲斯的訓練中心有15 萬塊H100,5 萬塊H200,和3 萬塊GB200。 我們即將在孟菲斯地區的第二個資料中心上線11 萬塊GB200。
Garry Tan
您是否認為預訓練(Pre-training)仍然有效?縮放定律(Scaling laws)仍然成立?最終贏得這場競賽的人將擁有最大、最聰明的模型,然後可以蒸餾(Distill)它?
馬斯克
除了大型AI 的競爭力之外,還有其他各種因素對於大型AI 來說, 人員的才華當然很重要。 硬體的規模以及你如何有效利用這些硬體也很重要。所以你不能只是訂購一大堆GPU,然後它們你不能只是插上電就行。所以你得弄到很多GPU,並讓它們能穩定地進行連貫訓練。
然後就是,你有什麼獨特的資料來源?我猜分發(distribution)在某種程度上也很重要,例如人們如何接觸到你的AI?對於那些要成為有競爭力的大型基礎模型(large foundation model)來說,這些都是關鍵因素。 就像就像我朋友伊利亞(Ilya Sutskever)說的,我認為你知道我們差不多用光了人類生成的數據進行預訓練,高品質標記(tokens)的供應枯竭得相當快, 然後你必須做很多你需要本質上創造合成數據(synthetic data) 並且能夠準確判斷你創造的合成數據,以驗證它是否是真實的合成數據,2hallucation)。 所以實現與現實接軌(grounding in reality)是是很棘手的,但我們正處於需要投入更多精力在合成資料上的階段。 就像現在我們正在訓練Grok 3.5,重點是推理(reasoning)。
Garry Tan
回到您的物理學觀點,我聽說硬科學,尤其是物理教科書,對推理非常有用。而研究人員告訴我,社會科學對推理完全沒用。
馬斯克
是的,這可能是真的。 所以是的你知道未來非常重要的一點是將深度AI 在資料中心或超級叢集中與機器人技術(robotics)結合。
這樣你知道像Optimus 人形機器人這樣的東西是的Optimus 太棒了。將來會有非常多人形機器人以及各種大小形狀的機器人,但我的預測是人形機器人將遠超其他所有機器人總和,可能多一個數量級,差異巨大。
Garry Tan
有傳言說您計劃組建一支機器人軍隊?
馬斯克
無論是我們做,還是還是特斯拉做,你知道的,特斯拉和xAI 合作緊密。
就像你看過多少家人形機器人新創公司?就像我想黃仁勳(Jensen Huang)在台上帶了一大堆機器人, 來自不同公司的機器人。我想有大概十幾種不同的人形機器人。所以,我是說,我猜,你知道的,部分我一直以來在抗爭的、也許拖慢我腳步的是,我是個有點我不想我不想讓終結者(Terminator)成真,你知道的。所以,我某種程度上, 至少直到最近幾年,在AI 和和類人機器人(humanoid robotics)上拖拖拉拉。然後我有點意識到,它它正在發生,無論我做不做。所以,你只有兩個選擇。參與你既可以當觀眾(spectator),也可以當參與者(participant)。所以,就像,好吧,我寧願當參與者而不是觀眾。 所以現在就是你知道的,在人形機器人和呃數字超級智慧(digital super intelligence)上全力加速(pedal to the metal)了。
Garry Tan
我想,還有第三件事大家聽您談過很多,我個人非常贊同,就是成為多行星物種(Multiplanetary species)。這如何融入整體?這不僅是10 年或20 年的事,也許是100 年的事,是關乎人類好幾代的事。您如何看待它?這裡有AI,顯然有具身機器人(Embodied robotics),也成為多行星物種。這些最終是否都服務於最後一點?或者,您現在驅動未來10 年、20 年、100 年的動力是什麼?
馬斯克
天啊,100 年,老兄。我希望100 年後文明還在。如果它還在,那會和今天的文明截然不同。 我是說,我預測人形機器人至少會是人類數量的5 倍,也許是10 倍。 而看待文明進步的一種方式是卡爾達肖夫等級(Kardashev Scale)的完成百分比。所以,如果你是,你知道的,等級一(Scale one),你你已經駕馭了一顆行星的所有能量。現在在我看來,我們只利用了地球能量的1% 或2%。 所以我們離卡爾達肖夫等級一還有很長的路要走。 然後等級二(Scale two)是駕馭一顆恆星的所有能量。 那將是地球能量的大概十億倍,也許接近一兆倍。
然後等級三(Scale three)是整個星系的能量,離那還很遠呢。所以我們正處於智慧大爆炸(intelligence big bang)的非常非常早期。我希望我們在就多星球而言,我想我想大約30 年內,我們會有足夠的物質轉移到火星,使火星能夠自我維持(self-sustaining),即使來自地球的補給船停止,火星也能繼續成長繁榮。 這大大延長了文明、或意識、或智慧(包括生物的和數位的)的預期壽命。 所以這就是為什麼我認為成為多星球物種很重要。
我有點困擾費米悖論(Fermi Paradox),就像為什麼我們沒看到任何外星人?這可能是因為智能非常稀有。 也許我們是這個星系裡唯一的智慧生命。 那樣的話,意識智能就像無邊黑暗中的微小燭光,我們應該盡一切可能確保這微小的燭光不熄滅,而成為多星球物種或讓意識多星球化(making consciousness multilanetary)能極大提高文明的預期壽命,並且它是在前往其他恆星系之前的下一個步驟。 一旦你至少擁有兩個星球,你就有了一個推動太空旅行進步的強制力(forcing function)。 那最終將導致意識擴展到星辰大海(expanding to the stars)。
Garry Tan
費米悖論可能暗示,一旦科技達到某個水平,文明就會自我毀滅。我們如何避免自我毀滅?您會給滿屋子的工程師什麼建議?我們能做些什麼來防止這種情況發生?
馬斯克
是的,如何避開「大過濾器」(Great Filters)?一個明顯的大過濾器就是全球熱核戰。所以我們應該盡量避免。
我想建造良性的AI 機器人,那種熱愛人類的AI, 你知道的,樂於助人的機器人。 我認為在建構AI 中極其重要的一點是,對真相(truth)非常嚴格的恪守,即使那真相在政治上不正確(politically incorrect)。 我對什麼會讓AI 變得非常危險的直覺是,如果如果你強迫AI 相信不真實的事情。
Garry Tan
您如何看待安全(Safety)與封閉(Closed)以獲得競爭優勢之間的爭論?我覺得很棒的一點是,您有一個有競爭力的模型,其他人也有。從這個意義上說,我們可能避開了我最擔心的最糟糕的時間線(Timeline)——那種快速起飛(Fast takeoff)且只掌握在一個人手中的情況。那可能會導致很多事情崩潰。而現在我們有選擇,這很好。您怎麼看?
馬斯克
是的,我確實認為將會有幾個深度智能(deep intelligences),也許至少有五個。 可能多達10 個。 我不確定會不會有幾百個,但可能接近,比如說10 個左右。 其中大概四個在美國。 所以我不認為會有任何一個AI 擁有失控的能力(runaway capability)。 但是的,會有幾個深度智能。
Garry Tan
這些深度智能體會做什麼?是做科學研究,還是試圖互相攻擊?
馬斯克
可能都是。 我是說希望它們會發現新物理學,我認為它們肯定會發明新技術。 就像我認為我們離數位超級智慧(digital super intelligence)相當近了。它可能今年發生,如果今年沒發生,明年肯定能實現,數字超級智能定義為在任何事情上都比任何人類都聰明(smarter than any human at anything)。
Garry Tan
那麼,我們該如何將其引導向超級豐饒(Super abundance)?我們可以擁有機器人勞動力、廉價能源、按需智慧(Intelligence on demand)。這是否就是所謂的「白色藥丸」(White pill,指積極樂觀的未來)?您在這個光譜上處於什麼位置?您會鼓勵在座各位做哪些具體的事情,來讓這個「白色藥丸」成為現實?
馬斯克
我認為最可能是個好結果。 我猜我某種程度上同意傑夫辛頓(Jeff Hinton)的看法,也許有10% 到20% 的毀滅(annihilation)幾率。 但往好的方面看,那就是80% 到90% 獲得美好結局的機率。 所以是的,我再怎麼強調也不為過。對真理(truth)的嚴格恪守是AI 安全(AI safety)最重要的事。顯然還有對人類和已知生命(life as we know it)的共感(empathy)。
Garry Tan
我們還沒談到Neuralink。我很好奇,您正在努力縮小人與機器之間的輸入輸出(Input/Output)差距。這對AGI/ASI(人工通用智慧/ 人工超級智慧)有多關鍵?一旦這個連結建立,我們是否不僅能讀取(Read),還能寫入(Write)?
馬斯克
Neuralink 對於解決數位超級智慧並非必要。 在神經連結大規模應用前,它(ASI)就會發生。 但神經連接能有效解決輸入輸出頻寬限制(input output bandwidth constraints)。特別是我們的輸出頻寬(output bandwidth)非常低。人類一天內的持續輸出(sustained output)低於每秒1 位元(less than one bit per second)。所以,你知道的,一天有86400 秒。 一個人一天輸出的符號(symbols)超過那個數字(86400 個)是極為罕見的。 連續幾天更是如此。 所以有了有了神經連接接口,你可以大幅提高你的輸出頻寬和輸入頻寬(input bandwidth)。 輸入是指寫入(write operations)大腦。
我們現在有五位人類植入了那種讀取輸入的設備,它可以讀取訊號。你有患有肌萎縮側索硬化症(ALS)的人,他們完全沒有(行動能力),他們是四肢癱瘓者(tetroplegics),但他們現在能以與擁有健全身體的人相當的頻寬交流, 控制他們的電腦和手機, 這相當酷。然後我想在未來6 到12 個月,我們將進行第一次視覺植入(implants for vision),即使有人完全失明, 我們也能直接寫入視覺皮層(visual cortex) 我們已經在猴子身上實現了。
我想我們有一隻猴子植入視覺設備已經三年了, 起初分辨率會相對較低,但長期來看會有非常高分辨率,並能看到多光譜波長(multispectral wavelengths)。所以你可以看到紅外線、紫外線、雷達(radar),就像獲得超能力一樣。 在某個時刻,賽博格植入物(cybernetic implants)將不僅僅是糾正出錯的東西,而是極大地增強(augmenting)人類的能力,極大地增強智能、感官和頻寬這這將會在某個時刻發生。
但數位超級智慧會在此很久之前發生,至少如果我們有一個神經連接,我們或許能更好地欣賞AI。我猜所有你努力的限制因素之一,跨越所有這些不同領域,是接觸最聰明人才的機會。 是的。但,你知道的,同時我們有,你知道的,石頭(rocks)能說話和推理(talk and reason), 它們現在可能130 智商了,而且可能很快就會超級智能。 你如何調和這兩件事?例如,你知道5 年、10 年後會發生什麼事?在座的各位該做什麼來確保,你知道的,他們是創造者(creating)而不是可能低於API 線(below the API line)的人?
人們稱它為奇點(singularity)是有原因的,因為我們不知道不久的未來會發生什麼事。人類智能所佔的比例將會很小。在某個時刻,人類智能的總和將少於所有智能的1%。 而如果事情發展到卡爾達肖夫等級二(Kardashev Scale level two) 我們談論的是人類智能,即使假設人口顯著增長,並且智能大幅增強(intelligence augmentation),就像每個人的智商都達到一千的那種情況。 即使那樣, 人類智能總和可能也只有數字智能的十億分之一(1 billionth)。無論如何,數位超級智慧的生物引導程式(biological bootloader)在哪裡?我想就此結束吧,我算是好的引導程式嗎?
Garry Tan
我們該何去何從?我們如何從這裡出發?我是說,所有這些都是相當狂野的科幻情節,但也可能由在座的各位建造出來。你知道的,如果你對這一代最聰明的技術人才有什麼結論?他們該做什麼?他們應該從事什麼?該想什麼, 今晚他們去吃晚餐時該想些什麼?
馬斯克
就像我開頭說的,我認為如果你在做有用的事,那就很棒。 如果你只是盡力對你的同胞盡可能有用,那你就是在做好事。 我不斷強調這一點,專注於超級真實(super truthful)的AI,這對AI 安全最重要。 你知道的,顯然如果你知道誰有興趣在xAI 工作,我是說,請告訴我們。 我們的目標是讓Grok 成為最大限度追求真相(maximally truth seeking)的AI。 我認為這非常重要。 希望我們能理解宇宙的本質。這這大概就是AI 能告訴我們的。也許AI 能告訴我們外星人在哪裡,以及你你知道宇宙是如何真正開始的?它將如何終結?有哪些我們不知道該問的問題? 我們是在模擬中(simulation)嗎?或者我們在哪個層級的模擬中?
Garry Tan
我想我們會找到答案的。一個NPC(非玩家角色)。伊隆,非常感謝你加入我們。
