Anthropic CEO萬字訪談：AI成為超級武器後，如何在商業與安全之間找平衡？

整理：Felix, PANews

彭博社近日對 Anthropic CEO Dario Amodei 進行了一次訪談，探討了他的舊金山創業歷程、與 OpenAI 的競爭以及 AI 的最終目標。

PANews 就訪談精華進行了整理。

主持人：你現在正處於 AI 宇宙的中心。那是什麼感覺？

Dario：在我的整個職業生涯中，尤其是在 Anthropic 的這段時期，我體驗到的是一種平滑的指數曲線。這種平滑指數曲線的體驗就是：什麼都沒發生，什麼都沒發生，發生了一點小事，然後「嗖」地一下瘋狂增長。這就是世界的體驗，也是公司規模相較於其他公司和世界的體驗。我觀察這張圖表很長一段時間了，我曾說「我們大概會在這個時間點成為擁有最高收入和估值的 AI 公司」，這確實發生了。所以一方面我並不驚訝，因為圖表上就是一條平滑的線；但另一方面，當事情真實發生時，你會看到更多的細節和色彩，這絕對令人驚訝。我們始終需要牢記那些最根本的問題：如何訓練好模型？如何將它們投入到好產品中？如何確保安全？如何幫助人們，同時管理技術帶來的社會風險？一切都是同樣的問題，只是被放在了更大的顯微鏡下審視。

主持人：你在舊金山長大，小時候是什麼樣的？我知道你父親是一位皮革工匠，母親在圖書館工作。這對你有什麼影響？

Dario：當時第一次網路革命正在我周圍發生，但我對此毫無興趣。我只對做數學題、塗鴉、理解宇宙和科幻小說感興趣。那就是我當時的整體環境，我對這個世界充滿了好奇。

主持人：你在這個科技中心城市長大，現在它又是 AI 的中心。這個城市有什麼影響了你的世界觀嗎？

Dario：這裡普遍存在的那種不墨守成規、個人主義以及「瘋狂也沒關係」的精神確實影響了我。你去歐洲或者哪怕是這個國家的其他地方，你會發現用不同的方式思考問題或有一些瘋狂的想法是不被鼓勵甚至被認為很奇怪的。雖然我對矽谷有很多批評，但我認為它有一點很好：即使所有專家都反對你也沒關係，如果你對世界有連貫的願景，你就應該去追求它。也許它完全行不通，但如果成功了，它就會產生一種長尾效應，你可能會在某些礦脈中發現巨大的金礦。我認為這種精神非常重要。

主持人：你決定離開 OpenAI 已經成了矽谷的傳說。到底發生了什麼？除了外界的傳聞，實際的問題是什麼？你們在哪些方面存在分歧？

Dario：我說得簡單點。當你在開發強大的技術時，會面臨許多困難的問題，Anthropic 每天也會面臨這些我們不知道決定是正確還是錯誤的難題。所以在安全問題上有很多合理的分歧，我們確實和他們有一些這樣的分歧，但這本身不足以成為離開的理由。即使在 Anthropic，人們與我、人們彼此之間也有分歧。但是，當你覺得無法信任某人，當你覺得他們的價值觀並不如他們所說的那樣，當你覺得他們不誠實，不是出於他們所宣稱的動機在做事，當你看到令人不安的欺騙行為模式時，你很難繼續與這家公司合作並信任它。歸根結底，如果你和別人願景不同且互不信任，為什麼還要去爭論呢？解決辦法就是各走各的路。我完全能平靜地接受我們用我們的方式做事，他們用他們的方式做事。看看誰在市場上獲勝，誰在公眾輿論中獲勝。這比任何關於誰離開的戲劇性八卦都更有說服力。我們正在展示一個如何以負責任的方式部署這項技術的例子。如果他們不同意，可以提出他們的論點。我認為要說的就只有這些。

主持人：在印度的 AI 峰會上，你和 Sam Altman 似乎拒絕在台上牽手。那裡發生了什麼？

Dario：真實情況是那次峰會極其無組織。我們都是在最後一刻才上台，他們臨時改變了我們的站位順序，拍了照，然後又突然命令我們所有人牽手。如果你去過這種有國家元首參加的國際峰會，你就會知道它們往往超級混亂（我這不是專門針對印度）。

主持人：但是其他人都牽手了。

Dario：我不知道該怎麼跟你解釋。就是 Narendra Modi 突然在台上叫大家牽手。

主持人：好吧。Sam 和 Elon 正在互相起訴。你不喜歡 Sam。如果世界上構建最重要技術的人不能在台上牽手，我們怎麼能相信你們會在事關人類生存的風險上進行合作？

Dario：我想告訴你的是，構建這項技術的人在素質和可信度上存在巨大差異。那種「誰也不信任誰」的說法是不對的。我認識開發 Gemini 模型的 Demis Hassabis 15 年了，他們是 Claude 模型的競爭對手，但我們在許多問題上合作過。我們從谷歌購買算力，也經常交換關於安全的想法。所以我認為，第一，有些參與者確實比其他人更值得信任；第二，Anthropic 之外也有我信任的參與者。我認為需要發生的是，值得信任的參與者團結起來，讓不值得信任的參與者處於一種不得不採用相同標準的境地。根據我的經驗，有些人自己不會主動做正確的事，但如果行業內的大多數人都在做正確的事，其他人就沒有太多選擇了。這分為兩個方面：積極的一面是互相啟發（即競爭向上），比如 Demis 做 Alpha Fold 啟發了我們，我們做生物研究，我們做可解釋性研究也啟發了他們，這不是零和競爭。這是比賽中積極的「胡蘿蔔」一面；而「大棒」的一面是，如果你不做正確的事就會顯得很糟糕。他們可能會很不情願地做正確的事，同時假裝在做別的事，甚至覺得我們有什麼不可告人的陰險目的，這在預料之中，但這正是讓行業團結和合作的方式。

主持人：早期其他人專注於有趣的、引人注目的消費端應用，而你把賭注押在了編碼和企業端。Claude Code 和 Claude Cowork 非常成功。你為什麼做這個賭注？這是價值觀的決定還是商業的決定？

Dario：當我們創立 Anthropic 時，最基本的是我們想要以正確的方式做事。但為了資助極度昂貴的模型創建，它需要有一個商業模式。如果商業模式從根本上與價值觀衝突，你就會很難辦：要麼背叛價值觀，要麼變得無關緊要。選擇與價值觀相容的商業模式要好得多。我們看過社群媒體和消費者世界，那往往在鼓勵用戶參與度甚至成癮（比如我們看到的 AI 影片模型亂象），只為了最大化用戶停留時間來獲取廣告收入。相反，在企業端，我們希望用 AI 治癒以前無法治癒的疾病（與生物技術、製藥和學術機構合作）、讓能源更便宜高效、幫助教育和非營利組織、促進經濟增長。這些本質上都是企業端應用。另一個因素是，企業非常看重信任和長期關係。消費端有時帶有噱頭性質，而企業端要求你建立多年信任，交付你所承諾的東西。這與我們以積極、安全的方式部署模型的目標非常協同。

主持人：一個開發者在一個下午就能從 Claude 切換到 ChatGPT 或 Gemini。在這個行業真的可能保持長期的領先地位嗎？一個強大的競爭對手需要多久才能複製你們所構建的東西？

Dario：模型品質是最重要的。我們現在在模型品質上遙遙領先。雖然存在一定的切換慣性，但我（和 Anthropic）從來不依賴產品的「黏性」讓人們不切換。你需要擁有一個更好的模型，一個更好的產品。我們看到增長率根本沒有發生轉折下降。至少在錄製這次採訪時，如果有變化的話，那就是它還在上升。所以我傾向於認為模型品質是最重要的事情。

主持人：在 Claude Cowork 發布後不久，市場上有 2850 億美元的市值一夜蒸發，交易員稱之為「SaaSpocalypse（SaaS末日）」。如果 AI 以這種速度繼續進步，有多少傳統軟體會被取代，速度有多快？

Dario：這很難提前準確預測。所有傳統軟體公司都有各自的護城河。其中一些護城河會消失，但其他會保留。「快速編寫複雜軟體」作為護城河肯定會消失，你無法再依靠這個防守。但客戶關係、行業運作知識和獨特的領域專門知識依然重要。我建議這些公司：不要自滿，列出你所有的護城河，看清哪些會消失，哪些會變強，因為也會有新的護城河出現。靈活應對的人會做得很好，而那些自欺欺人、滿足於過去經驗的人日子會很難過。總體而言，我認為軟體行業會變得更大而不是更小，儘管肯定會有一些大輸家。

主持人：解釋一下這一點。

Dario：因為「蛋糕」在變大。如果 AI 讓行業天花板提高了 10 倍，現有的企業很容易就能實現 1.5 倍的增長，儘管它在整個大蛋糕中的相對份額變小了。但如果那些不適應、把頭埋在沙子裡的人，他們將經歷艱難的時期甚至倒閉。

主持人：你們最大的支持者是像亞馬遜、谷歌、微軟和輝達這樣的公司。它們都有自己的議程，既是合作夥伴又是競爭對手。你們巨大的商業里程碑與融資掛鉤，到底是誰在真正做主？

Dario：在很多情況下，我們都直言不諱地表達了我們真正的想法。大家都是成年人，我們可以求同存異，在某件事上合作而在另一件事上存在分歧。

主持人：有報導稱你們的估值高於 OpenAI。對一家成立五年的初創企業來說，估值接近一萬億美元。你是如何理解這個數字的？如果你在算力上更自律且有更快的盈利途徑，你為什麼需要那麼多錢？

Dario：算力的需求增長非常快。業務基本面很好，但可能一年內你需要的算力就會翻三四倍，增長極快。我們完全期望收入的增長能達到甚至超過這些算力增長。籌集資金是為了緩衝這種不確定性帶來的影響，這是非常理性的，對公司的股權稀釋也很小，這絕不代表業務基本面出了問題。

主持人：超越你的主要競爭對手感覺好嗎？

Dario：我們面前還有許多艱難的挑戰。我們在推行「競相向上」的理念，試圖拉動其他公司與我們並肩前行。雖然有時他們不承認，有時一邊攻擊我們一邊抄襲我們，但這種拉動效應極具價值。成為領先的公司的價值不在於單純的擊敗對手，而在於有能力帶動整個生態系統。

主持人：但獲勝必須要感覺好一點才對。

Dario：我們當然總是在努力取得成功，並不想失敗。我不認為我們應該關閉這項技術，我們在自由企業制度中競爭，只需要減輕模型的風險。我們始終在兩極之間尋找平衡。

主持人：你們的產品開發速度非常驚人。你們是怎麼做到的？

Dario：兩個原因：第一，我們擁有統一的文化和組織效率，大家步調一致；第二，是 Claude 本身。我們現在正在使用 Claude 來幫助開發我們的模型和產品，使其更加高效。這產生了大量且越來越可靠的加速效果。

主持人：你見過 AI 做的最瘋狂的事情是什麼？

Dario：都是關於生物和醫學方面的。我見過好幾次，Claude 診斷出了一些高級醫生漏掉的醫療問題。在生物學方面，模型在藥物設計或計算化學方面開始變得驚人地出色。作為一名前生物學家，我深知那需要極高水平的專業訓練。這是 AI 的巨大積極面，它將極大地提升人類的生活品質。想像從 1900 年到現在的百年科學進步，然後再想像如果再來一次百年進步會怎樣。如果我們能順利度過現在的挑戰，我們將擁有一個好得多的世界。

主持人：我知道你很喜歡寫作。你會用 Claude 幫你寫嗎？

Dario：會，但我還沒有讓它直接替我寫成文的文本，因為我對特定的風格有點挑剔。我主要是用 Claude 進行頭腦風暴，理清主題，或者提供參考文獻。它現在起的是支持作用，雖然距離它寫得比我好還有距離，但這遲早會到來。

主持人：寫作能幫助人理清思緒，包含大量批判性思考。如果我們讓 Claude 代勞，我們會失去這種思考能力嗎？

Dario：我確實對此有點擔心。我堅持自己寫作，一半是為了讀者，但同樣也是為了理清我自己的思路。如果僅僅要求它「寫一篇關於 AI 風險的文章」，這不僅寫不出我真正想表達的內容，也會讓我喪失那種思考的益處。未來，隨著模型變得更好，我們可能需要找到一種既能更直接利用它們、又能保留思考益處的微妙使用方式。

主持人：你曾直言不諱地談及失業，預測 AI 可能會在 1 到 5 年內消滅一半的初級白領工作。那是一年前的事了，現在這個比例是 50% 還是更高了？

Dario：如果你去看原來的完整影片，我的真實表述是：我不知道會發生什麼，但這代表了一個衡量事情會有多瘋狂的數量級。然而，人們的心理總是傾向於剪輯出那三秒鐘的「末日將至」，而忽略了我同時探討的所有應對解決方案（比如 token 稅、企業調整、宏觀經濟政策等）。我的訊息絕不是「末日將至」，而是我們需要提前看到、關注並積極應對它。短期內 AI 會讓人們效率更高，但這只是一個過渡階段。就像我們在自動化的歷史中看到的，AI 最終可能包攬這部分工作。以 Anthropic 的軟體工程師為例，現在 AI 幫他們寫大部分程式碼讓他們更高效，但也開始出現乾脆直接讓 AI 來執行特定任務更好的情況。另一方面，這也催生了新需求，比如兼具技術與客戶溝通能力的「應用 AI 解決方案架構師（前端部署工程師）」。工作崗位的破壞與調整將會同時發生。

主持人：你們發布了一張圖表，顯示了潛在的工作破壞，哪些會消失，哪些會產生？

Dario：這很難準確預測，就像預測股市一樣。但總體來說，初級白領職位（銀行、金融等）被 AI 替代的可能性很大。我們在與企業客戶溝通時，發現他們面臨選擇：是裁員以節省成本，還是利用同樣的資源去做更多新事情？我們總是試圖推動他們走向「正和博弈」：利用效率提升去做更多事情，而不是裁員。隨著「蛋糕」擴大，人們可能會找到新的去處，這就是一個尋找匹配速度的問題。破壞的規模將會很大，所以我才試圖警告人們。

主持人：如果出現那麼高規模的失業率，這難道不是革命爆發的原因嗎？

Dario：這絕對是我們想要避免的結果。我認為有幾個領域會保留機會：一是物理世界（因為機器人的發展慢於 AI 資訊處理速度，製造和建築仍需要大量人力）；二是所有人類為中心的工作。即使 AI 比醫生看病更準或在客服上做得更好，人們依然希望並需要在重要事務上與其他人類交談和建立聯繫。人類也會保留引導 AI 價值觀和意圖的角色。

主持人：有很多人對你的觀點表示反對，比如黃仁勳說你混淆了「任務」和「工作」，還有人說這是一種對 Anthropic 有利的「末日行銷」。

Dario：我要明確地反駁這一點。我們在報告和論文中用了整整五頁詳細闡述任務和工作的區別、說明這次為何不同，並提出了六種涵蓋私人和政府的解決方案。但我發現，矽谷和社群媒體的弊病就是懶惰，人們只看一年前三秒鐘的短片就不負責任地發表評論。將嚴肅的智力勞動稱為「廉價行銷」，這本身就是一種拒絕嚴肅討論的廉價行銷和極其懶惰的行為。

主持人：作為一家全球領先的 AI 公司，你們深深介入了美國國家安全的諸多領域。你從在加州理工學院起就有長期的反戰立場，但你們卻是首批與國防部簽訂機密網路運行合約的 AI 公司之一。請解釋一下。

Dario：原因是世界在變。當我看到俄羅斯入侵烏克蘭，我擔心威權集團的復甦。我們需要保衛自己。我們絕對不希望對手使用 AI 來分析情報、攻擊烏克蘭，而我們卻無法防禦。所以我們在跨政府部門提供支援。順便說一句，我們做這些絕不是為了錢，在政府網路上運行其實是個大麻煩，利潤也很少。正因為我們是出於「在乎」才做，所以對技術的使用必須有明確的限制和紅線，即：不能進行大規模監控和開發完全自主的武器。如果為了贏得競爭而放棄我們的民主價值觀，那也是不值得的。這是我們堅持的平衡和立場。

主持人：你們從 2024 年開始與 Palantir 合作，他們的技術被美國移民和海關執法局、警察部門，甚至在加薩使用。Claude 在被用於監控嗎？

Dario：我們不與 ICE 和 CBP 合作，無論是直接還是透過 Palantir。據我所知，我們也沒有在加薩開展業務。我們非常謹慎地將參與範圍限制在我們認同的價值觀內。

主持人：所以你劃定了紅線，總統禁止了你們的某些聯邦政府許可，五角大廈將你們貼上供應鏈風險標籤，而 OpenAI 則介入並簽了你們不願簽的合約。贏得這場鬥爭到底是什麼樣的？

Dario：我不認為這是一場論「輸贏」的鬥爭，這是關於政府如何合理使用 AI 的社會辯論。我們正在努力就令人擔憂的場景建立使用先例，並引發了對於該問題的關注。我們看到國會出現了試圖禁止高風險應用並設定護欄的跨黨派努力。如果非要說贏，促使我們的國家更謹慎地思考新技術的合適使用邊界，這就是勝利。

主持人：有人形容你是個不該擁有如此大權力的意識形態瘋子，或者左翼狂熱分子，你介意嗎？

Dario：我經常被罵，而且比這難聽多了。別人怎麼叫我和 Anthropic 都可以，我在乎的只有兩件事：公司取得成功，以及我們堅持了自身的價值觀。其實這讓我的生活變得很簡單，我一直都清楚自己的立場。

主持人：AI 戰爭是更可能阻止第三次世界大戰，還是更容易引發它？

Dario：總體來說更有可能阻止它。但如果缺乏使用限制，它就有可能引發戰爭。如果沒有適當的監管，雙方很容易因誤解爆發衝突。如果我們在情報收集和回應能力上具備壓倒性優勢，對手在發動行動前就會三思。優越的智能可以有效威懾衝突。

主持人：Anthropic 幾乎每週都上頭條，最近是關於 Mythos 模型。你說過 Mythos 太強大了不能向公眾發布。關於它最讓你吃驚的是什麼？

Dario：讓我最吃驚的是，它不僅能發現漏洞，而且能將漏洞轉化為實質性的攻擊工具，出現了這種能力的巨大躍升。一些早期測試它的公司甚至要求我們不要發布它，並稱它為「超級武器」，認為需要有持槍許可證才能使用它。我們不向公眾發布並不是想永遠鎖住它，而是目前的網路防禦機制依然容易被「越獄」破解。我們要等到防禦機制足夠有信心應對它時，再伴隨強有力的保障措施進行發布。

主持人：但外界有很多反對意見：有研究人員稱能用更便宜的開源模型複製它，還有人說這完全是盛大的公關和行銷手段。你怎麼回應？

Dario：說能用開源模型複製它的說法是極其荒謬的。Mythos 模型在 Firefox 瀏覽器中發現了 271 個新漏洞，在許多不便公開的私營公司中發現了數千個新漏洞，之前的模型根本找不到這些。那個在 Twitter 上說能用開源模型複製的人，只是在我們指出具體哪行程式碼有問題後，用開源模型重新定位了那行程式碼而已。這根本不是一回事。

至於「行銷」的說法，不發布這個超級強大的模型讓我們在商業上承受了巨大的損失，它本來可以極大加速內外部的研發。如果這能幫助防禦者，那它對攻擊者的幫助也是同等的。所以我們目前的策略是先把它交給防禦方去修補系統漏洞。一旦所有的漏洞「窟窿」被補上，未來的網際網路生態將變得極其安全。那些在 X 上進行狙擊和反向操作的人（包括某些競爭對手），未能嚴肅對待全社會的風險權衡，是一種極度不成熟的體現。

主持人：你們是否已經做出了你不完全滿意的權衡？

Dario：Anthropic 的整個歷史充滿了權衡。如果在一個理想世界中，你可能會花上數年研究聊天機器人的每一個隱患再發布。雖然我們確實推遲了最初版本的 Claude 幾個月，但一切仍然是權衡。現在我們處於商業領先地位，我和 Daniela 正在盡一切所能將指針進一步向「謹慎行事」方向撥動。這就是限制 Mythos 發布的初衷，如果你不是領先的玩家，你很難做出那樣的決定。

主持人：既然這項技術如此強大，為什麼政府不直接接管你們？

Dario：這是一個非常嚴肅的擔憂。縱觀歷史，所有前所未有的強大技術（核武器、網際網路、GPS、手機）最初都誕生於政府和聯邦實驗室。AI 是第一個完全在私營部門構建且政府涉足較晚的技術，這種狀況其實危險且不穩定。但現在政府不做的隱患確實比私營部門做的隱患更大。所以我們需要權力的制衡：我們設立了「長期利益信託基金」，他們有權罷免絕大多數董事甚至解僱我，這引入了公共治理的元素。

在政府層面，我們需要立法和司法部門實施強制性的發布前測試與紅線監管。我既害怕公司掌控它，也害怕政府壟斷它，雙方必須相互制衡。非常可笑的是，矽谷裡有一群人，他們從極端反對任何監管甚至透明度要求（說這會扼殺創新），在看到第一次真正的危險後，立刻搖擺到宣稱「政府應該將其國有化」。這種在極端兩極反覆橫跳的反應非常不成熟，我們需要的是理性的中庸之道。

主持人：你們領域總在談論 AI 變得好到足以進行「自我改進」的時刻。你們的研究人員認為這快到了，具體還有多遠？

Dario：我認為它不是一個特定的「時刻」，而是一個持續加速的指數過程。我們已經看到 AI 開始協助提出下一代 AI 的架構。一年前 AI 讓全要素生產率提高了 10-15%，現在可能是 20-30%。它不會在某一時刻突然失控，而是在這條平滑的指數曲線上，我們需要在每一個節點評估是否應該放慢速度並施加更多控制。理智的應對措施是讓我們的反制措施隨著技術力量的增長平滑地逐步升級，而不是驚慌失措。

主持人：你曾說人類文明有 10-25% 的機率崩潰。這並非微不足道。會不會有這樣一種情況：Anthropic 製造的某樣東西導致了這種崩潰？

Dario：我當然希望不會。這種風險機率源於技術的內在不可預測性，以及世界格局的複雜性。我們採取的種種措施正是為了降低、而不是增加這個崩潰機率。就像航空業，即使你造的飛機比別人的安全十倍，你也不可能向別人絕對保證它「永遠不會墜毀」。

Anthropic CEO萬字訪談：AI成為超級武器後，如何在商業與安全之間找平衡？

熱門文章