鏈遊的AI革命（二）：OpenAI是如何封神的？

瓜田实验室 W Labs ｜2023-05-01 14:59

ChatGPT 僅僅是OpenAI 在2022 年11 月中旬臨時開發出來的，全程只用了13 天時間。

驚堂木一拍！書接上文，我們說說現在爆炸全球的OpenAI 的傳奇歷程吧。故事的起點是2015 年7 月在加州門羅帕克的一場晚宴，在場的除了大家熟知的全球頂流大V 埃隆・馬斯克，堪稱豪華的飯局參加者還集齊了包括當時的YC總裁山姆・阿爾特曼（YC 是矽谷著名的創業孵化器，孵化了約1900 家公司）、頂級獨角獸Stripe 的首席技術官格雷格・布羅克曼、2019 年因為對深度學習的貢獻和傑弗里・辛頓、楊立昆一起獲得了圖靈獎的約書亞・本吉奧。這些人構成了OpenAI 的草創班子。

 山姆·阿爾特曼和埃隆·馬斯克

格雷格·布羅克曼和伊爾亞‧蘇茨克維

本吉奧又給列出了深度學習領域最好的研究人員名單，布羅克曼對著名單挨個聯繫勸說。雖然有了金主爸爸微軟10 億美元的投資承諾，但作為一家初創組織，OpenAI 還是無法開出能媲美谷歌、FB 這種大公司能給到的薪水，最後幾乎是依靠著偉大的願景和情懷說服了各個頂尖人才的加盟，就是這個方向（通用人工智能AGI）的開發能夠造福全人類，一起成為能銘刻在百年科技史上的人物吧！

僅僅有驚人的人才密度還不夠（很多大公司的一些部門也不乏高密度的人才儲備），能夠做出今天的成績，還要得益於OpenAI 自上而下對通用人工智能AGI 的堅定信仰，以及自下而上推動創新的實驗機制，上下通吃後才有修成正果的可能啊。

OpenAI 對AGI 的信仰有多堅定呢？ OpenAI 的員工每年都會投票預測通用人工智能AGI 的到來時間，這件事即使在內部，意見分歧也是比較大的，不同員工對此各有各的想法。但早在2020 年2 月，也就是還在GPT2 的時期（彼時距離GPT3 發布還有四個月，距離ChatGPT 發布還有兩年零九個月），已經有一半的員工打賭認為AGI 會在15 年內實現了——也就是2035 年，讓我們記住這個時間點，一起見證歷史。

早期的OpenAI 就像一個革命者，面對的是已經鋪開戰線的、有著充足的人力財力及各種資源的谷歌等巨頭，但它還是希望能夠成為第一個實現AGI 的組織——因為深知一家大公司會如何被利益驅使、被股價裹挾、被內部的山頭林立派系鬥爭拖累進度、一旦有了成果又將如何鞏固地位並嘗試壟斷，OpenAI 的願景是實現通用人工智能並將所產生的利益公平地分配給所有人。

OpenAI 從來都不想統治世界，只希望確保技術能夠安全發展，並最終造福全人類。我曾讀到一篇幾年前的深度報導，作者曾經到過OpenAI 公司做了大量一手採訪，並聊出了很多不為外人所知的OpenAI 組織秘密。文中提到：

組織的第一份聲明說，它將「為每個人，而不是股東創造價值」；它的章程——這份文件如此神聖，以至於員工薪水取決於他們對條款的遵守程度——進一步宣稱OpenAI的「首要承擔的責任是面向人類的，可以將全局利益放在個人自身利益之上」；此外，安全地實現AGI 非常重要，甚至如果另一個組織首先接近實現這一目標，OpenAI 將停止競爭，轉向與之合作。

我讀到這些的時候被深深打動了，這種思路已經開始向宗教式的價值觀進化了。我曾以為AI 和Crypto 是完全背道而馳的東西，在Crypto 嘗試還權於民並賦能個體的時候，AI 則是非常壟斷的象徵，暗含著一種更大的權力集中化。但我沒想到早期的OpenAI 章程讀起來竟然還有點像發明比特幣時的中本聰（一個有趣的時間線巧合是，2007 年出現了深度學習，2008 年出現了比特幣，前後腳的偉大發明）。

我非常相信這份章程的起草包含著馬斯克在內的第一批創始成員內心深處最美好的理想主義，當他們寫下這些話時，他們是足夠真誠並相信的。事實上馬斯克本人一直都是這種願意分享人類智慧成果的代表人物，他在特斯拉和推特都實現了最大限度的開源和協作。

當OpenAI 後來迫於現實壓力最終走向了妥協並一定程度上背叛了自己的革命理想時，馬斯克也直接離開了OpenAI 的董事會。或許是因為曾經在最前沿深度見識過了AI 的能力和潛力，這些年他對於AI 安全的呼籲從沒停過，利用自己的公眾影響力做了大量的發聲，甚至作為一個企業家去主動向政府要求監管。

可惜大部分人（這也包括了我們AI 鏈遊研究小組部分成員）狹隘理解為他的呼籲和叫停是“給自己留時間赶超對手”——實際上特斯拉早期研發的方向從來都不是AGI，而馬斯克的呼籲也並不是從ChatGPT 出現以後才開始的——這多少是有點“人類從不感謝羅輯”（來自於《三體》小說的名句，沒看過三體的朋友直接略過就好）的意味了。

鏈遊的AI革命（二）：OpenAI是如何封神的？

留下來並接任了CEO 的阿爾特曼也算是和Crypto 頗有淵源的，他在OpenAI 以外的另一個項目是加密項目Worldcoin，與OpenAI 希冀通過AGI 實現全人類的解放相比，Worldcoin 則是想從Crypto 這條路也能夠實現金融層面的人類公平和普惠。

說回OpenAI。 OpenAI 早期的發展方向其實選了三個，一個是機器人（實體或者說硬件形態的人工智能），一個是遊戲人工智能（打遊戲的），第三個才是語言模型，讓人工智能用文本語言學習理解世界，也就是GPT 系列。可以看出，這個階段做的探索是比較分散的，團隊並不是拿了天選之子的劇本直接悟出了AGI 的路該怎麼走，而是在各種嘗試過後最終完成聚焦。

機器人的路線大家可能比較好理解，也是一個很符合直覺的人類對人工智能的最常見的想像。

遊戲這條路是馬斯克推薦的，有很多寫遊戲相關的書都喜歡把人類在世界上做的任何事情比喻成某種遊戲，事實上人類學習和理解世界的過程、以及產生的行為，和遊戲確實也有頗多相似之處，也不知該說世界本來就是一場遊戲，還是遊戲本來就是一個世界。之前的AI 已經成功挑戰過的象棋、圍棋等運動，其實也算是遊戲的範疇。 OpenAI 團隊選擇了Dota2，最終也是挑戰成功，一路打到世界冠軍。下一篇我們就會八卦到遊戲是如何推動科技生產力發展的。

轉折點發生在2019 年。這一年，用800 萬篇Reddit 論壇帖子、總計40 GB 文本訓練出來的15 億參數的GPT-2 讓整個公司真正意識到了自己正走在沒人走過的正確道路上。方向確認無誤，接下來就是大力加碼。為了集中資源，團隊非常有魄力地砍掉了已經頗有些成果的做其他兩個方向的團隊，全力以赴的搞大模型。這一次使用了數千億單詞的英文資料（英文維基百科全部只佔數據量的3%）和數千萬美元的計算資源開發了GPT-3，而後馬不停蹄又開發了又大了一個數量級的GPT -4。

大家可能很難想像，ChatGPT 僅僅是OpenAI 在2022 年11 月中旬臨時開發出來的，全程只用了13 天時間。忍不住感慨一下，有時候歷史的進程就是這樣不經意被改寫——急於發布ChatGPT 是因為擔心谷歌搶先發布同類產品給自己帶來威脅，沒想到直接引爆全球，反倒給谷歌帶來了真正巨大的威脅，並徹底改寫了行業格局。

很多人形容說OpenAI 走通大模型之路的意義不亞於哥倫布抵達了新大陸，在這之後入場的公司可以用相對低得多的成本和很小的風險開發出自己的類ChatGPT 大語言模型。

而今天當我們回顧OpenAI 短短數年卻波瀾壯闊的發展歷程時，一面感慨於競爭壓力和商業環境迫使它背離了自己最初的誓言，一面又能看到它對於現實的妥協仍然在足夠的限度之內，仍然在盡最大的努力推動實現一個通用人工智能造福全人類的偉大願景。

一個就像當年計算機和互聯網的出現一樣重要、即將再次深度改變人類社會的人工智能時代從2022 年的最後一個月正式開啟了。大家興奮地玩著最新的模型，討論著人類和人工智能的未來。有人樂觀，覺得從此有了迄今最強的生產力好幫手；有人悲觀，覺得人類已經走在了自我毀滅的路上。而無論持有哪種觀點，和非常不確定的未來相比，當下唯一能確定的一點是，能夠生逢其時，我們已經是多麼的幸運。

未完待續。本系列由W Labs“AI 鏈遊研究小組”集體創作，感謝小組成員瓜哥、嘉然、包包、Brian、小飛、華哥的努力付出！本篇主筆為包包。