約翰·克里森、埃拉德·吉爾和皮查伊
作者:蘇揚,騰訊科技
編輯|徐青陽
近日,GoogleCEO桑達爾·皮查伊在執掌公司十週年之際,接受了支付巨頭Stripe聯創約翰·克里森(John Collison)和科技天使投資人埃拉德·吉爾(Elad Gil)的聯合訪談。
訪談中,皮查伊回顧了Google在AI浪潮中從被動到領先的歷程。他正面回應了那段令Google人「意難平」的歷史:明明Transformer架構誕生於谷歌,最後卻成了OpenAI推出ChatGPT,成為顛覆搜尋產業的基石。
他承認,外界對此“有點誤解”, Transformer從一開始就是為了解決翻譯品質而生,並非紙上談兵的研究。之所以沒有及時發布,部分原因是谷歌對搜尋品質有“更高門檻”,內部早期版本“毒性太強”不敢發布。
面對當前AI競賽,皮查伊認為市場遠非零和遊戲,「價值成長曲線極為陡峭」。他也透露,自己每周至少花一個小時親自審批算力分配,「這是當下最重要的事」。
在皮查伊看來, Google的全端垂直整合是核心優勢,包括從第七代TPU到模型再到應用,並透露2026年資本支出將達1750億至1850億美元。
關於資源瓶頸,他認為晶圓產能是“根本約束”,警告2026年將是一個“供給緊縮之年” 。但美國必須學會「以10倍速度建設實體基礎設施」。
他也證實, Google正在探索太空資料中心,「這就是2010年的Waymo」 ,看似遙遠,但已從小團隊、小預算起步。
皮查伊堅信,搜尋功能不會死,而是會進化成「智能體管理器」。你只要下達指令,AI智能體就能幫你完成任務。他甚至大膽預言:到2027年,Google內部的業務預測將完全由AI自動完成,不再需要人類插手。
以下為皮查伊訪談精煉版:
01、“我們不是慢,是門檻高”
Q:大家總是會提起那段歷史:Transformer是Google發明的,最後卻成了ChatGPT的基石。現在怎麼回頭看這件事?
皮查伊:這件事其實有點被誤解了。 Transformer不是憑空冒出來的。當時我們有一個很現實的需求:把翻譯做得更好。 TPU也是一樣。語音辨識技術已經有了,但問題是,我們要服務二十億用戶,現有的晶片根本跑不動,必須先解決推理效率的問題。
Q:所以Transformer一開始就是衝著產品去的?
皮查伊:是的,我們的研究團隊從一開始就是奔著解決實際問題去的。 Transformer一出來,我們立刻就把它用到了搜尋裡。後面又做了BERT(雙向編碼器表示)和MUM(多任務統一模型),搜尋品質在那段時間實現了巨大飛躍。其實我們內部也做出了類似LaMDA(對話式語言模型)的產品,只不過沒有搶在第一個推向市場。
問:換句話說,你們做了研究,也看到了回報,只是沒有用它包打天下。
皮查伊:還不只這樣。 ChatGPT那種產品形態,我們內部其實也研究過,就是LaMDA。你還記得嗎?當時有個工程師覺得LaMDA有了意識(後來因此被停職、辭退lol),那其實就是早期版ChatGPT的雛形。我們內部的產品版本早就有了,只不過比ChatGPT晚了大概九個月才發售。
事實上,早在2022年I/O大會上,我們就推出了AI Test Kitchen,背後跑的就是LaMDA。但我們做了很多限制,因為那個版本沒有經過RLHF(基於人類回饋的強化學習),說話「毒性」比較大,根本不敢直接放出去。
另外,Google對搜尋品質的要求一直極高,產品發布的門檻也更高。即便OpenAI發布ChatGPT的時候,他們和微軟的合作才剛敲定不久。所以回過頭看,ChatGPT的成功並不是一件那麼「理所當然」或「板上釘釘」的事。
我覺得OpenAI有一個很幸運的地方:他們透過GitHub,在程式場景裡先看到了機會。這個訊號,我們當時可能漏掉了。
在程式設計這件事上,模型能力的進步比純語言場景明顯得多。從GPT-2到GPT-3,再到GPT-4,你拿它寫程式碼,每一步的躍升都比聊天更突出。這些因素疊在一起,才有了後來的局面。所以我覺得,這事跟什麼「研究轉化不成產品」關係不大,而是別的因素湊在了一起。
Q:我記得有人說,ChatGPT發佈的時候其實很低調,選在感恩節那一周,誰也沒覺得它會變成後來的樣子。就是個有趣的實驗。
皮查伊:這就是消費網路的常態,總是會有意外。我們在谷歌的時候,做過Google Video Search,後來YouTube出來了。 Facebook也是一樣,Instagram突然就冒出來了。沒人會帶著那種「我要被顛覆了」的戲劇感去看這些事,Facebook的做法是直接把Instagram買了。
我的意思是,總有三、五個人窩在一起搞原型,每天往外丟幾百萬個想法。我不是貶低誰,但這種事一定會發生。你不可能在車庫裡隨手就造出下一個iPhone,但消費網路就是這樣。關鍵是你必須意識到這一點,並且把它真正內化到組織的基因裡。
02、搜尋不會死
Q: Google一直以「快」著稱。最早的搜尋把回應時間秀在結果頁上,Gmail、Chrome都比對手快一截。現在Gemini在TPU上跑,速度依然快得驚人。這是刻意的產品策略,還是有更複雜的原因?
皮查伊:速度其實分為兩種。一種是反應速度,也就是使用者感知到的快慢;另一種是迭代速度,也就是我們推出新功能、改進產品的快慢。兩者都重要。
你剛才問的是延遲。難就難在,我們要一邊不斷增加新功能,一邊還要保持快速反應。搜尋團隊現在是有毫秒延遲預算的,例如你省下3毫秒,其中1.5毫秒要讓給用戶體驗,另外1.5毫秒才算你給自己爭取到的額度。
問:人類能感知到的延遲也就幾百毫秒吧?
皮查伊:確實。但過去五年我們在增加一堆功能的同時,還把搜尋延遲降了30%。 Gemini也一樣,Flash模型擁有Pro模型的九成功力,但速度快得多、價格也便宜得多。垂直整合在這方面發揮了重要作用。
問:那你覺得搜尋10年後還在嗎?現在有人說聊天就是新介面,也有人說以後每個人都有自己的智能體,你可以直接命令它執行操作,不用親自搜尋了。
皮查伊:每次科技變革,搜尋能做的事情更多。用戶的預期在變,你也得跟著變。以後很多「查一下」都會變成代理式的──你給個任務,智能體幫你完成。搜尋會變成一個智能體管理器。我現在用的Antigravity,裡面已經有一堆智能體在工作了。
Q:那種輸入一行關鍵字、返回一堆連結的形態,還會存在嗎?
皮查伊:現在的搜尋AI模式裡,已經有人在上面做深度研究了,跟你說的不太一樣,但大家就這麼用起來了。以後會有越來越多久運行的任務,而且可以是異步的。
問:你剛剛說搜尋會變成智慧體管理器。但十年後,那個搜尋框會不會還在,只是大家已經不拿它當一回事了?
皮查伊:設備形態會改變,輸入輸出的方式也會改變。不過說實話,現在想十年後容易把自己想癱瘓。我們很幸運,處在一個只看未來一年就夠興奮的時刻。曲線太陡了,一年後模型已經完全不同。光是跟著曲線跑,本身就夠激動人心了。
而且很多人沒意識到,這是個擴張性的時刻,不是一場零和遊戲。你看YouTube,TikTok和Instagram都發展起來了,我們不照樣活得好好的?你越覺得別人起來就得死,它就真的會變成零和遊戲。但只要你自己在創新,就不會。
我們現在同時做搜尋和Gemini,兩者有重疊,也會逐漸分化。同時擁有它們,我覺得是有益的。
Q: 2025年春夏之際,市場對Google的未來悲觀到極點,都說搜尋完了,你們的股價跌到150美元左右。現在回頭看,那顯然是個誤解。谷歌在整個技術堆疊上,無論是應用、模型還是TPU,以及Waymo、YouTube和所有那些很酷的押注,都表現出色。你覺得投資人當時看錯了什麼?
皮查伊:當時大家的注意力全在「反轉」上,也就是所謂的「OpenAI逆襲」。但對我來說,那一刻反而讓我覺得,Google就是為這個時刻而生的。這種垂直整合並非偶然或隨意為之。 2016年我們在I/O大會上發布了TPU,並承諾要建AI資料中心,如今已經更迭到第七代。那一年,公司也確定了「AI First」的方向,這不僅僅是口號。
我們在前沿大模型上確實落後了一步,但內部有所有必需的能力,剩下的就是執行。讓我興奮的是,從全端看,我們有研究團隊、基礎設施團隊,還有各個業務平台。而AI恰好能同時加速所有這些業務,包括搜尋、YouTube、雲端、Waymo,它們全都在一條曲線上。這是非常有效率的槓桿。
我當時就不覺得這是零和遊戲。一切都會擴大十倍,其他人也會有空間。谷歌崛起之後,亞馬遜和Facebook不也做得很好嗎?我們總低估成長帶來的空間。所以我的重點很簡單:執行得更好。
Q:有沒有一個標誌性的時刻,讓外界覺得「Google終於回來了」?是Gemini 3嗎?
皮查伊:大家真正開始注意到這個趨勢,應該是Gemini 2.5。尤其是多模態能力,直接站到了前沿。這要歸功於Google DeepMind團隊。我們一開始就為多模態付出了不少固定成本,Gemini從第一天起就是奔著這個方向設計的。等到Gemini 2.5的時候,優勢開始顯現了。例如Nano Banana,你能看到所有東西整合在一起的效果。
不過這個領域變化太快了。兩三個頭部實驗室互相推著跑,這個月你覺得“太好了,這塊我們領先了”,下個月就“糟糕,那邊落後了”。幾個月後格局可能又不一樣。前沿競爭就是這麼激烈。
03、一年砸1800億美元探索AGI
Q:有些外部研究員覺得,Google和其他頭實驗室有個差別:Google沒那麼「迷AGI」。換句話說,Google不太相信AGI馬上就能實現,也不太圍著這個想法加速狂奔。你覺得這個觀察對嗎?如果對,會不會影響你們對未來方向的判斷?
皮查伊:你看我們的資本支出,從300億美元漲到了1800億美元。不真心相信這個曲線,誰會這麼砸錢?
我覺得這事很大程度是語意問題。我們是一家大公司,產品涵蓋太多人、太多層面,說話的方式可能不一樣。但你要說Google不懂AGI,那說不通。許多創辦人本身就是AGI迷,德米斯·哈薩比斯(Demis Hassabis)、傑夫·迪恩(Jeff Dean)、伊利亞·蘇茨克維(Ilya Sutskever)以及達裡奧·阿莫代伊(Dario Amodei),這些人當年都曾在谷歌效力。
我覺得,之所以外界看起來覺得我們有分歧,部分原因可能是由地理位置決定的,像是舊金山聚集了更多年輕公司和研究實驗室。但這些只是表象。在根子上,大家對技術曲線的判斷、對如何理解和應用AI,其實沒有本質的不同。
真正的差距在於,你有沒有在一線見證過改變。在我們公司,有一群人天天跑在最前面,親手部署和測試AI智能體,看著它們一步步獲得新技能、搞定複雜任務。你再回頭看看三個月前它們那點本事,就能實實在在地感受到指數級成長帶來的衝擊。
Q:我很好奇,你最近感受到AGI時刻即將到來是什麼時候?
皮查伊:我第一次有那種感覺,是在2012年。當時,迪恩示範了最早版本的Google Brain,這個神經網路辨識出了一隻貓。後來我和拉里·佩奇(Larry Page)去了DARPA挑戰賽,看汽車自動駕駛。德米斯示範早期模型,模型展現出我們稱為「想像力」的東西。
這樣的時刻還有很多。最近的話,最直觀的是程式設計領域的快速進步。你給程式設計智能體一個複雜任務,從頭到尾不用開啟IDE(整合開發環境),就看著它在管理器裡完成任務。那種感覺,你可以叫它AGI時刻。
問:我前幾天自己做個小項目,跑起來之後才發現,我連它用的什麼程式語言都不知道,還得專門問它。感覺就像魔法。
皮查伊:沒錯。曲線的斜率(變強的速度)才真正讓人吃驚。回頭看三個月前,就知道進步有多大。
Q:說到這種親身體驗,我很好奇你是怎麼保持跟產品的真實觸感的。科技產品太抽象了,你不能光看報告和PPT。除了每天用Gmail這些常規操作,你要怎麼確保自己不脫離使用者?
皮查伊:我會用內部版本,專門安排時間密集使用。兩週前我在健身房鍛煉,手機開著Gemini Live,接下來30分鐘就一個話題跟它死磕。有的體驗很好,有些令人沮喪,但你學到東西。我會逼自己用「超級用戶」的方式去用。我強迫自己以那種「超級用戶」模式使用它們,以此來保持接觸。 X(推特)也有幫助,因為有時你能得到最直接的回饋。
另外,我現在會去Antigravity(我們的內部版本)裡直接問AI:「我們發了這個功能,大家覺得怎麼樣?告訴我最糟糕的五條和最好的五條評論。」它直接給你拉出來。我的生活變得容易了嗎?確實。
過去我得花很多時間試著去了解狀況,現在AI智能體幫我做這部分工作。當然我自己該花的體驗時間還是得花,這是個學習過程。我也在努力適應這個未來。
問:你剛剛說這不是零和遊戲,生產力的提升也實實在在。但回顧之前的技術週期,網路、行動、SaaS,都是花了很長時間才體現在GDP裡。 AI這邊,我們已經看到資料中心建設在拉動GDP成長了。你覺得未來三、五年,美國經濟會因為AI變得更大嗎?會成長多少?
皮查伊:為了讓這些回報有意義,總得在某個地方體現出來。我記得紅杉有個人寫過一篇文章,說大家投了這麼多錢,回報要對得上才行。
當然,這已經是兩年半前的事了。當時有人說這不合邏輯,因為回報率必須達到某一水平才算合理。但現在,投資規模可能已經成長了10倍,我們需要重新審視這些數字。在某個節點上,帳必須算過來。非常明確的是,我們現在是供給受限,我們在所有應用領域都看到了強勁的算力需求。
問:我毫不懷疑這是個巨大的市場。問題是,很多人算帳的方式可能不對。例如他們拿Token預算去比工程師薪水,我覺得軟體工程的市場比任何人想的都大,供給增加反而會讓市場擴張十倍。我不是質疑資本支出和回報的關係,我就是好奇,你覺得成長到底能有多大?
皮查伊:回顧網路的發展,GDP成長的數字其實沒完全反映出我們感受到的那種變化。也許沒有互聯網,GDP成長會是負的。很難做出精準的預測,社會各層面都有自然的抑制機制。
最明顯的例子:算力建設曲線和模型改進曲線截然不同,前者較慢。然後你還要考慮,怎麼把科技擴散到社會? Waymo就是個例子。它比人類駕駛安全,但你推出的速度還是得謹慎,所有這些層面都存在著限制。美國經濟比十年前大得多,即使成長率只提高半個百分點,也是巨大貢獻。我覺得會朝這個方向走。
04、供應鏈警報:內存、電工
問:你提到供給限制,這確實是2026年的決定性特徵。你說谷歌的資本支出大概是1800億美元?
皮查伊: 1750億美元到1850億之間。
Q:有趣的是,就算Google想花4000億美元,也花不出去,因為內存不夠,電力不夠,各種組件都不夠。可以談談這些瓶頸嗎?
皮查伊:你甚至連需要的電工都找不到。
Q:說說都有哪些瓶頸。
皮查伊:說到底要回到晶圓產能上,那是根本限制。電力和能源相對更容易解決,但許可和監管環境是個大問題,拖慢了你做事的速度。
Q:德州、內華達、蒙大拿等州有的是土地,但還是不夠?
皮查伊:我們正取得巨大進步,但美國確實需要學學怎麼建得更快。你看中國的建設速度,讓人驚嘆。我們需要改變心態,想想怎麼把實體世界的建設速度提升十倍。這會是真正的限制因素。而且阻力會越來越大,不是幾個人說「我們要加快建設」就能解決的。
Q:還有資料中心暫停令這類問題。
皮查伊:晶圓產能、核准許可、建造速度,這些都是瓶頸。政府已經做了不少事,大家也意識到需要改進。然後是供應鏈裡的關鍵元件,記憶體就是個典型。短期內所有人都被卡在這裡。
我們這些做公司的,不管你多“迷戀AGI”,都得面對一個現實問題:你的判斷不可能百分之百準確,總有一個誤差範圍。你得想清楚,到底有多看好未來的發展?你能承受多大的利潤壓縮空間?因為外部因素隨時都可能出問題。每個人都在根據這些不確定因素做出調整。
Q:所以記憶體是你覺得最大的組件瓶頸?
皮查伊:絕對是目前最關鍵的之一。
問:你說這是短期的。市場會透過漲價來刺激供應嗎?
皮查伊:領先的記憶體廠商不可能大幅擴產。短期會受限,但慢慢緩解。而這個限制會倒逼創新──我們會把效率提高30倍。這些事是同時發生的。
Q:這是不是會強化寡頭格局?模型自我改進、自己寫程式碼、自己標註數據,算力就是搶椅子遊戲。誰的算力多,誰就能跑得更遠。但如果大家的算力按比例分配,那其實就給人設了上限。你覺得這個說法對嗎?
皮查伊:有一定道理。但我們剛剛發布了Gemma 4,一個非常好的開源模型。中國的模型非常好,但我認為在中國以外,這也是一個非常好的開源模型。 Gemma 4的前沿水平,與Gemini 3的架構相比,雖然差距非常大,但從發佈時間上看,兩者相隔並不算太久。它不像SpaceX火箭那種龐然大物。
Q:我一直覺得很震撼:你跑一個資料中心好幾個月,最後出來的就是一個平面文件,一個Word文檔一樣的東西,那就是你的模型,太神奇了!
皮查伊:這件事的特殊性讓我想挑戰剛才那個框架。至少從推理角度來看,你說的有道理。但每個人都在想辦法用資本的力量去突破這些限制,而這個誘因是巨大的。
問:可你剛才也說了,世界上的內存就那麼多。 2026、2027年的供應問題,光靠資本誘因解決不了。這可能正是模型出現更多分化的時候。
皮查伊:對,但要跟晶圓產能、核准許可這些因素放在一起看。整體平衡下來,限制可能沒有想像中那麼嚴重。你得通盤考慮所有東西,包括資本。
問:照理說大家願意投更多錢,但撞上2026、2027的現實瓶頸了。就像霍爾木茲海峽,你油價定多高都行,但每天減少2000萬桶供應,就必須有2000萬桶的需求被消滅。內存也一樣,最後一定有人拿不到。
皮查伊:當然,還有安全等其他限制。但關鍵在於,這些模型很快就會突破幾乎所有現有軟體的承載極限——或許它們已經突破了,只是我們坐在這裡,還渾然不覺。
問:所以供應限制反而逼你做優化,變得更有效率。
皮查伊:對,它逼著你去進行一些必要的對話。就拿安全來說,我們需要更多的協調,但今天這種協調還遠遠不夠。總有一天會有一個時刻──可能來得還很突然。你不能一廂情願地希望這些問題自己消失。
05、三顆“隱藏寶石”
Q:說到這,Google的投資組合確實讓人印象深刻。你們投了SpaceX,我記得很久以前大概佔了10%?還有Anthropic,也是10%左右。 Waymo持有多數股權。內部還有TPU、量子運算,還有其他人們可能不知道、或低估了的「隱藏寶石」嗎?
皮查伊:我們一直在做各種長期項目,剛宣布的時候,稍微邊緣一點的看起來都有點荒唐。例如太空資料中心,我們現在就在最早階段。你剛才說限制激發創造力,正好就是這個道理。
從20年的長遠視角來看,你打算把這些資料中心建在哪裡?這個問題很難,但這就是我們今天在思考的事情,就像2010年我們開始做Waymo一樣。量子計算也是其中之一,我們正在堅定地推進,我對此感到很興奮。
Q:你覺得量子計算最大的影響會在哪些領域?大家主要聊聊分子建模和密碼學。但也有人在開發抗量子密碼學(指能抵禦量子運算攻擊的新型密碼技術),而分子建模這邊,深度學習已經很強了,AlphaFold就是例子。量子真的會很重要嗎?如果會,它將在哪裡產生最大的影響?
皮查伊:從抽象層面來說,我覺得量子電腦比較適合用來模擬大自然。因為自然本身遵循的就是量子力學的規律,用量子系統模擬它,會更直接、更有效率。當然,經典電腦加上足夠的壓縮演算法,理論上也可能做到,但我直覺上覺得量子會更有優勢。
舉個例子:我們到現在都還沒完全搞懂化肥生產中的「哈伯法」(Haber process),還有很多複雜的自然現象。我的直覺是,在模擬天氣、模擬現實這些領域,量子運算最終會勝出。
科技史告訴我們一個道理:你把一個東西做到能用之後,人們會在它上面找到各種你當初完全沒想到的應用。我總喜歡舉這個例子:手機加上GPS,後來成就了Uber。當年做手機的人,誰也想不到這個。所以我相信,只要把量子電腦真正做出來,它的應用就會多到超越所有人的想像。
Q:抱歉打斷你,請繼續談談你剛才提到的那些超前項目。
皮查伊: Google DeepMind團隊正在深入做機器人。谷歌其實很早就涉足機器人領域,但當時太早了。現在回頭看,AI就是當年缺的那塊拼圖。 Gemini Robotics模型在空間推理上已經是頂尖水準。有趣的是,我們現在反過來跟波士頓動力、Agile這些公司合作,一起往前推。
還有Wing,無人機配送。我們在擴大規模,不久將來會有4000萬美國人能用上Wing的服務,這不是多少年後的事,而是很快就能實現。這些長期項目,都是一點一點累積出來的。
另外還有Isomorphic。
Q: Isomorphic確實很讓人興奮。
皮查伊:對,我們專注於用模型去改進藥物發現的每一個環節。雖然後面還有三期臨床試驗等程序,但有了AI的幫助,讓我們更有把握走向成功。
06.後悔沒早投Waymo
Q: Google的資本到底是怎麼分配的?教科書上說,資本配置就是把錢放進回報最高的地方。波音的例子就很典型:國防合約內部報酬率(IRR)為16%,新客機19%,所有人都會選後者。但谷歌的項目根本沒辦法這麼算。給YouTube多投錢,演算法一優化,用戶停留時間變長,收入就會增加。給Waymo多投錢,加速擴張,但不知道什麼時候才能大規模賺錢。投一個AI研究項目,五年後都未必有結果。這三個項目的報酬曲線完全不一樣,你怎麼比較?
皮查伊:這是個好問題。諷刺的是,現在比以往任何時候都更常遇到這個問題,因為TPU的分配。某種程度上,連Waymo都需要TPU,算力讓資本配置問題變得格外突出。
順便說一句,我特別期待AI能幫我做這件事。一旦我們把所有資料打通,模型其實已經能勝任了,現在卡在資料解鎖上。我覺得這很快會有幫助。
回過頭看,Google有一個很大的優勢:我們經常在非常早期的階段就做出決定。這和公司的技術基因有很大關係。
對於長期專案來說,早期階段其實比較容易,因為一開始需要的資金並不多。真正困難的是長期持續投入,並且不斷評估基礎技術的進展。拿量子計算來舉例,我們怎麼判斷該不該繼續投?我們會看邏輯量子位元的錯誤率,看看什麼時候能達到穩定的大規模邏輯量子位元的閾值,看看團隊能不能突破這些技術難關。
我學到的一個很重要的經驗是:要在早期就深度押注技術。
從長期來看,你其實是在用直覺判斷一個專案5到10年後的選擇權價值和潛在市場大小。你先假設一個非常激進的成長曲線,然後反過來推演:這個決策到底合不合理?
TPU的投資就是這樣做的,我們一直在穩步投入。 Waymo也是,大約兩、三年前,全世界都對自動駕駛悲觀到了極點,我們反而加大了投資。別人在退縮,我們在加註。
問:回到你剛才說的資本配置。谷歌確實會砍項目,Loon(熱氣球網絡計劃)就停了,但Waymo熬了那麼久你們一直沒放棄。你們當時看到了什麼?這是個定性判斷還是定量判斷?怎麼決定砍這個留那個項目?
皮查伊:我們確實有一些量化指標。例如看Waymo的駕駛系統,看看它的安全性和可靠性在如何進步。這是一條長期的曲線,你先設定好目標,然後持續追蹤執行情況。我們的團隊一直都非常出色。有些階段進展確實比較慢,但你要相信團隊能夠突破。你越能在深層技術層面做出評估,決策就越準確。至少我是這麼做的。
Q:我聽過一種說法:Waymo早期是靠手繪地圖和啟發式規則,能處理的情況很有限。真正的突破是幾年前轉向端到端深度學習,正好趕上Transformer浪潮。如果Waymo是五年前才開始做,會不會跟現在差不多?還是說那十幾年的累積其實不可或缺?
皮查伊:你可以把Waymo當成機器人。照理說,過去三年才開始當機器人的人,進展應該更快。但Waymo不一樣,它是一個高度整合的系統,不像台積電或SpaceX那樣,只在單一維度上拼技術複雜度。對於這種系統整合來說,時機和製程的累積非常關鍵。話雖這麼說,但端到端的方法確實會成為一個加速器。
Q:所以持續培養一個團隊,本身就是巨大的優勢。你們一直在投資,等到技術起飛的那一刻,就值得了。這很聰明。那延伸到其他領域呢?例如機器人,你們會重新自己搞硬件,還是主要靠合作夥伴?
皮查伊:我們保持開放心態。但從Waymo和TPU我學到一點:在涉及安全、監管的領域,你需要第一手的產品回饋循環。擁有第一方硬體最終會變得非常重要。
07、每週親自評估分配算力
問:以前研發主要花在人員薪資上,技術成本是次要的。現在TPU算力成了預算的大頭。谷歌內部具體怎麼運作?有一個總的TPU預算嗎?分項目的時候,以前按人頭給預算,現在是「人頭+算力」預算?季度評審怎麼搞?
皮查伊:我們一直都有算力預算,但現在算力真的很嚴重受限。我每週至少花一個小時,很細緻地看各專案各團隊用了多少算力,評估怎麼分配。這件事現在是重中之重。
Q:所以算力成了稀缺資源,你要確保它花在最值得的地方。
皮查伊:沒錯。
Q:那谷歌雲呢?你們一邊自己要用算力,一邊還要賣給客戶。這個矛盾怎麼處理?
皮查伊:靠提前規劃。雲端團隊做前瞻性規劃,我們對客戶的承諾是堅決要履行的。大家都在受限的世界運作,雲端團隊也總說算力不夠,但事先規劃能解決大部分問題。
Q:說到Google雲,GCP/MCP(AI助理與Google雲互動協定)很好用,你們的AI可以直接透過程式呼叫谷歌雲,幾乎什麼都能做,就差核心權限設定了。以前谷歌雲端最大的痛點是功能太多太雜,登入之後要建組織、建專案、找服務,非常麻煩。現在這些都不重要了,你直接說「加這個功能」就好。 AI讀懂了所有API文檔,成了一個導航層。這個體驗太好了。
皮查伊: AI作為編排層,能處理你想到的任何事。企業內部也一樣,CEO不缺數據,缺的是把數據放一起的方法。以前得搞個大ERP項目,現在AI就是那個編排層。
Q:產品越複雜,AI導航的好處越大。 Stripe也有這個體會,但GCP的效應應該更明顯。
皮查伊:我們還能做得更好,但你說得對,機會很大。
Q: OpenClaw這類產品讓我感興趣的是,它們允許消費者使用有狀態的AI。例如“每天早上把我感興趣的新聞匯總發給我”,這種需要持久記憶的事情,主流AI應用都做不了。這個功能快來了嗎?
皮查伊:方向上是肯定的。使用者需要以可靠、安全的方式運行持久、長期的任務。身份、權限這些問題要想清楚。但這就是AI智能體的未來,為消費者帶來這種能力,是我們正在探索的、令人興奮的前沿。
問:這也是我想提的。 Dreamer,就是前Stripe CTO的公司,剛被Meta收了,他們在有狀態AI(Stateful AI)這方面做得特別好。你可以自己做小應用,體驗很流暢。讓人有驚喜感。 (註:有狀態AI是指在多步驟互動或複雜工作流程中,AI能保留並利用歷史脈絡、記憶和狀態資訊的AI系統。 )
皮查伊:消費級介面底層會有完整的編碼模型,加上適當的工具與技能,再加上雲端安全持久運作的能力。這些基礎元件正在匯聚。今天大概只有0.1%的人活在這個未來裡,他們在為自己做東西。但把它推向大眾市場,是一個令人興奮的前沿。
問:我參與的那些公司,即使是最近才成立的,都徹底改變了產品開發、工程實務、甚至設計團隊的定位。谷歌也在重新思考這些嗎?工作流程有大變動嗎?
皮查伊:可以用同心圓來理解。有些團隊已經深刻轉變了,我的任務就是把這種變化擴散出去。早期很多東西是半殘廢的,想推也推不動。但今年曲線在急劇轉變。 Google DeepMind和有些軟體工程團隊已經活在智能體管理器裡了,他們用的內部工具叫Jet Ski,其實就是Antigravity。上週我們剛把它推給搜尋團隊。在大公司裡,變更管理是科技擴散的最大困難點,小公司切換起來快得多。
Q:我想補充幾個AI實際落地中遇到的問題。第一,工程師需要時間學會怎麼有效提示AI,而且每個公司還有自己特定的知識。第二,AI產生的程式碼庫共享很難,因為改動範圍大、程式碼變動快,多人協作變得複雜。第三,除了工程領域,數據權限是大問題——你想讓智能體回答“這個交易狀態怎麼樣”,公司知道這些信息,但權限引擎需要重寫。第四,角色定義也在改變,工程、產品、設計這些角色可能需要合併。總之,模型能力已經達到了相應水平,但我們用得還遠遠不夠。你怎麼看?
皮查伊:你提到的這些問題,Gemini企業團隊和Antigravity團隊正在一個一個解決。這就是我們的路線圖。我們在內部使用、遇到障礙、克服障礙,然後變成產品外推。身分存取控制是真實存在的難題,我們對安全的要求特別高,所以必須謹慎。但也因為如此,當我們解決問題的時候,推出來的東西會更穩健。我們現在就在經歷這個固定成本階段。
08、AI接棒人類時間表
Q: Google每年會做幾次正式的業務預測。理論上,你可以讓AI完全自動完成這件事,不需要任何人參與。你覺得Google第一次實現完全由AI智能體來做預測,會是在哪個季度?
皮查伊:我預計2027年會是重要的轉捩點。一開始還會有人負責查,但會慢慢切換過去。 2027年,這些轉變會非常明顯地發生。
問:所以除了工程流程之外,那些非工程的流程,你覺得2027年也會真正啟動AI化?
皮查伊:對。這也是新創公司的優勢,他們可以招募AI原生的團隊,從頭開始就是這套玩法。而我們要做再培訓、做轉型。年輕公司在這方面確實有優勢,我們必須自己推動這個轉型。
Q:現在谷歌內部有什麼讓你興奮的小專案?
皮查伊:說出來可能讓人意外。太空資料中心,我們就是從幾個人的小團隊開始的,拿著很小的預算去實現第一個里程碑。大想法也要從小處著手。


