Anthropic CEO 發長文：AI 跑太快，政策追不上了

2026 年6 月，Anthropic CEO Dario Amodei 發布了一篇題為《Policy on the AI Exponential》的公開文章。在這篇長文裡，他提出了一個具體建議：美國政府應該建立一個類似聯邦航空管理局（FAA）的監管機構，對所有前沿AI 模型進行強制性的第三方測試。測試涵蓋網路安全、生物武器、失控風險和自動化研發四個維度。政府有權阻止未通過測試的模型發布。

同一篇文章中，Amodei 還寫了一句在矽谷CEO 群體中相當罕見的話：AI 可能導致“顯著且持久的失業”，這可能是“技術廣泛複製人類認知的內在屬性”，傳統的經濟學適應機制可能被技術速度壓垮。

對於一個長期以「負責任的規模化」（Responsible Scaling Policy，簡稱RSP）為對外旗幟的CEO 來說，這些表述不是隨口一提。過去三年，他的公開立場一直是企業透明揭露、等待風險具象化再立法。現在他不僅主動呼籲政府介入，還宣布Anthropic 將投入總計約3.5 億美元的資金，用於推動這項監管框架的落地。

從“企業自律等政府”到“主動出錢出力推立法”，這個姿態轉變本身就是一個信號。過去幾年，Amodei 的主張經歷了什麼樣的修正？什麼因素迫使他從「向內約束」轉向「向外索取」？

一封樂觀信、一份預警、一次求救

Amodei 在《Policy on the AI Exponential》中的診斷是：AI 技術呈指數級發展，已顯著超越既有政策制定流程的反應速度。他在文中提到，Anthropic 今年4 月發布的Claude Mythos Preview 模型，在網路安全領域展現出了國家層級的漏洞發現能力。根據Anthropic 官方發布的系統卡，該模型在零日漏洞發現等任務上的表現，已經觸及需要向國家安全機構報告的門檻。

藥方是建立類似FAA 的強制監管機制。前置模型須經四個維度的第三方測試，政府有權阻止未通過測試的模型發布。這個建議的激進之處在於，它要求的不是行業自律或自願承諾，而是具有法律約束力的前置批准。

Amodei 明確承認AI 可能導致大規模持久失業。他寫道，這可能是“技術廣泛複製人類認知的內在屬性”，傳統的經濟學適應機制可能被技術速度壓垮。這個判斷與他先前在《The Adolescence of Technology》中的立場一脈相承，但表達更確定。

與文章同步，Anthropic 宣布了三項新舉措：2 億美元的經濟未來研究基金，用於實證研究與政策試驗；1.5 億美元的全國獎學金項目，面向早期職業專業人士；以及為前沿模型測試立法提案及失業政策框架提供資金支持。第三項措施的官方命名尚未公佈，綜合多家媒體報道，其核心是直接資助立法推動工作。

這三項措施的總金額約3.5 億美元。作為參照，Anthropic 在2026 年2 月完成了300 億美元的Series G 融資，公司估值達3,800 億美元。 3.5 億美元約佔該輪融資金額的1.2%。

2 億美元的經濟未來研究基金並非憑空出現。 Anthropic 在2025 年6 月啟動了Economic Futures Program，當時承諾的金額是1000 萬美元。從1,000 萬到2 億，一年內規模翻了20 倍。這個躍升幅度說明，Amodei 對AI 經濟衝擊的判斷在加速收緊，他不再把這當成一個遠期課題。

從樂觀願景到政策呼求

Amodei 的政策轉向不是突然發生的。把他過去兩年發表的三篇主要長文放在一起看，一條修正軌跡就會浮現出來。

2024 年10 月，Amodei 發行了《Machines of Loving Grace》。這篇長文的基調是樂觀的。他在文中描繪了一個AI 極大造福人類的未來：在生物學和健康領域，AI 可以將原本需要數十年的科學發現壓縮到幾年內完成；在經濟發展領域，AI 可以帶來前所未有的生產力提升；在更廣泛的社會層面，AI 有潛力幫助人類解決氣候變遷、貧窮等宏大問題。

這篇文章的核心訊息是：AI 的風險真實存在，但只要人類能夠安全度過科技發展的關鍵窗口期，回報將是巨大的。 Amodei 當時將這一窗口期定位在2026 年前後。

到了2026 年1 月，Amodei 發布了《The Adolescence of Technology》。這篇長文的基調發生了明顯變化。他將當前的科技發展階段比喻為人類文明的「青春期」：危險、不可預測，但無法跳過。他開始從純粹技術安全轉向更廣泛的社會經濟風險，呼籲徵收財富稅以應對AI 可能帶來的經濟衝擊。

Amodei 在文中不再將AI 的經濟風險描述為“需要管理的過渡期陣痛”，而是開始使用“結構性衝擊”這樣的表述。他寫道，AI 對勞動市場的影響可能不是漸進的，而是階躍式的，一旦某些認知能力被模型複製，對應的職業群體可能在短時間內面臨大規模替代。

然後是2026 年6 月的《Policy on the AI Exponential》。 Amodei 的立場完成了從「預警」到直接開出政策藥方的轉變，並且願意出錢出力去推動。

《Machines of Loving Grace》的樂觀願景，被《The Adolescence of Technology》的現實風險擠壓；後者對勞動市場的預警，又在《Policy on the AI Exponential》中升級為對政策工具的直接呼求。這不是立場搖擺，而是技術能力外溢到經濟和國家安全的後果，一步步倒逼出來的判斷調整。

RSP 從1.0 到3.0，什麼被拿掉了

要理解Amodei 為什麼從“向內約束”轉向“向外索求”，還需要看Anthropic 內部的自律框架發生了什麼。

2023 年9 月，Anthropic 發布了RSP 1.0 版本。這是一個企業內部的安全治理框架，核心承諾是：如果模型達到某些預先定義的危險能力閾值，且沒有足夠的安全措施，Anthropic 將暫停訓練或部署。 RSP 1.0 代表了典型的「向內約束」想法：企業自己設定紅線，自己監控，自己承諾遵守。在當時，這個框架被安全社群視為前沿AI 企業自律的標竿。

2026 年2 月24 日，Anthropic 發布了RSP 3.0 版本。這個版本放棄了早期的一些嚴格承諾，包括對硬性暫停訓練條件的修改。安全社區迅速做出了反應。長期追蹤AI 安全的評論者Zvi Mowshowitz 在Substack 上發表分析文章，批評這項修改是向商業競爭壓力讓步。有效利他主義論壇上也出現了類似的批判聲音，認為Anthropic 在安全承諾上的後退，說明單純依靠企業自律在現實中難以持續。

RSP 從1.0 到3.0 的演變，揭露了一個結構性問題。當商業競爭和技術加速同時施壓，企業單方面承諾的硬性安全條款就很難維持。如果一家公司因為安全顧慮放慢腳步，而競爭對手沒有同樣的約束，安全自律就會變成競爭劣勢。

這個困境直接為Amodei 6 月的政策呼籲做了邏輯鋪墊。他在《Policy on the AI Exponential》中實際上承認了這一點：既然內部自律不夠用，就需要外部強制力來設定行業底線。

但這裡有一個信任悖論。 Amodei 呼籲外部監管的同時，Anthropic 自己的自律框架剛剛經歷了一次被安全社區批評為「後退」的修改。部分安全社群成員因此質疑：一個在內部自律上讓步的公司，是否有資格呼籲政府建立強制監管？在Hacker News 的討論中，有評論者將其形容為「既當運動員又當裁判」的嫌疑。

3.5 億美元在買什麼

Anthropic 宣布的三項新舉措，表面看是慈善和公益投入。但如果把它們放在Amodei 的政策呼籲旁邊一起看，這些資金的實際功能會更清晰。

2 億美元的經濟未來研究基金，用途是實證研究和政策試驗。 1.5 億美元的獎學金項目，對象為早期職業專業人士。第三項措施直接資助立法提案和政策框架的推動工作。

這些資金精準投向了Amodei 在長文中劃定的政策方向。經濟未來研究基金可以用來資助那些支持其「AI 導致結構性失業」判斷的研究，為政策立法提供學術背書。獎學金計畫可以培養一批認同其治理理念的專業人才。立法推動資金則是最直接的：出錢幫忙起草和遊說符合Anthropic 安全理念的法案。

在Hacker News 的討論中，有開發者提出了「監管俘獲」的質疑。這個概念指的是，企業透過推動監管來提高產業進入門檻，從而鞏固自己的市場地位。強制性的第三方測試和高昂的合規成本，對像Anthropic 這樣已經具備完善安全團隊和紅隊測試能力的頭部企業來說，是可控的支出。但對於資金和人才有限的新創公司，這可能構成一道難以跨越的障礙。

Medium 上的一篇分析文章直接提出了這個問題：Amodei 的提議到底是安全計劃，還是監管俘虜的藍圖？文章指出，Anthropic 在RSP 3.0 中放棄了硬性暫停承諾，現在卻要求政府用法律強制力來約束整個產業。

從Amodei 的思想邏輯來看，他可能不認為這是一個矛盾。在他的框架裡，內在自律的妥協正是因為缺乏外在強制力所導致的囚徒困境。如果政府設定了統一的產業底線，企業就不需要在「安全」和「競爭」之間做選擇。從這個角度，3.5 億美元是在試圖打破這個困境。

但這個邏輯有一個前提：監管架構的設計必須公平，不能偏袒任何一家企業。 Anthropic 作為框架的推動者和資金提供者，能否保持這個距離，是一個尚未被回答的問題。

安全社區買單嗎

Amodei 的政策呼籲在開發者和安全社區引發的反應，可以用「分裂」來形容。

一部分人認為，這是前沿AI 企業首次以如此具體的政策建議和真金白銀的投入，承認行業自律的局限性。在AI 能力快速溢出到網路安全、生物安全等敏感領域的背景下，政府介入設定底線是必要且迫切的。

另一部分人的質疑則集中在兩個點上。第一個是信任問題。 Anthropic 在RSP 3.0 中的讓步，讓一些安全社群成員認為這家公司已經透支了公信力。 Zvi Mowshowitz 在Substack 上的分析文章對Anthropic 的承諾後退進行了逐條批評。在這種背景下，Amodei 呼籲政府監管的姿態，被一些人解讀為「自己做不到，就讓政府逼大家一起做」。

第二個質疑是監理俘獲風險。強制第三方測試的合規成本，可能成為頭部企業的護城河。 Anthropic 在安全基礎設施上的投入在行業內是領先的，如果監管標準以Anthropic 現有的實踐為藍本，其他企業要達到同等水平需要付出巨大的追趕成本。

但Amodei 的呼籲中有一個因素讓「什麼都不做」的選項變得越來越不可接受。 Claude Mythos Preview 在2026 年4 月發布後，其展現的網路安全能力超出了許多觀察者的預期。根據Anthropic 官方系統卡，該模型在零日漏洞發現任務上的表現，已經觸發向國家安全機構報告的內部協議。英國AI 安全研究所隨後發布了對Mythos Preview 的獨立評估報告，確認了其網路能力的量級。

當一個模型的能力已經觸及國家安全層面，而企業內部的RSP 框架又在商業競爭壓力下被迫妥協，剩下的選項確實不多。要嘛政府介入設定強制底線，要嘛接受一個沒有任何硬性約束的競賽。這個張力不是Anthropic 一家的問題。

三年立場改變了什麼

從“負責任的規模化”到“政策指數級鴻溝”，Amodei 的治理思想最核心的變化是：他不再相信企業自律足以應對AI 的發展速度。

這個判斷被一連串事件逐步推出來。 2024 年的樂觀願景，在2025 到2026 年的技術現實面前被修正。 RSP 從1.0 到3.0 的妥協，證明了內部自律框架在商業競爭壓力下的脆弱性。 Claude Mythos Preview 的能力溢出，讓「等待風險具象化再立法」的漸進思維顯得不再可行。

Amodei 的因應方案是轉向外在強制力。他不僅呼籲政府建立類似FAA 的監管機制，還投入3.5 億美元推動框架落地。這個姿態轉變的實質是：當科技發展速度超過企業自律的承載能力時，唯一還能跟上的約束力量，只剩下政府。

但這個方案本身也帶來了新的問題。監管俘獲的風險、自律承諾後退帶來的信任赤字、以及「AI 必然導致大規模持久失業」這一判斷在經濟學界的爭議，都是Amodei 的政策呼籲需要面對的現實阻力。

對於觀察前沿AI 行業的人來說，Amodei 的這篇長文提供了一個清晰的信號：當一家以安全為旗幟的AI 公司的CEO，公開承認自己的自律框架不夠用，並且主動向政府求救，這本身就是一個值得追踪的節點。