來源: AI寒武紀
距離上一屆I/O又過了一年。
Google CEO在開場就定了基調:過去這一年,AI產業進入了新階段,人們不再只關心技術本身,而是想看到AI真正為日常產品帶來價值。 Google的回答,是今天這場發表會。
token數量:從480兆到3千萬億
衡量AI採用規模,token是一個直覺的指標。
兩年前,Google旗下各產品每月處理的token總量是9.7兆。去年I/O時,這個數字成長到約480兆。今年,直接跳到每月超過3.2千萬億(quadrillion),成長了7倍。
開發者和企業側的資料同樣亮眼:
每月使用Google模型建立應用程式的開發者超過850萬
模型API目前每分鐘處理約190億token
過去12個月,超過375家Google Cloud客戶各自處理了超過1兆token
產品規模:13款產品用戶破十億
Google目前有13款產品月活用戶超過10億,其中5款超過30億。
Search依然是覆蓋範圍最廣的AI產品入口。 AI Overviews月活已超過25億。 AI Mode作為Search有史以來最大的升級,上線僅一年月活就突破10億,人們對它的使用方式也在變化,從單條查詢逐漸演變成持續對話。
Gemini app去年I/O時月活4億,今年已超過9億,翻了一倍多,每日請求量增長超過7倍。其中Nano Banana圖像生成模型已累積產生超過500億張圖片。
對話式AI進入更多產品
Ask YouTube
YouTube上有大量視頻,但找到真正相關的內容並不容易。 Ask YouTube重新設計了這一體驗,不只是展示匹配的視頻,還會直接跳到視頻中最相關的片段。目前正在開始測試,今年夏天將在美國全面推出。
Docs Live
Google Docs新增語音功能Docs Live。以前用Gemini寫文件需要輸入明確的指令,現在只要對著麥克風把想法說出來,Gemini會自動整理成文件。未來也將支援直接用聲音新建和編輯文件。 Docs Live今年夏天向訂閱用戶推出,同期Gmail和Keep也將加入語音功能。
Ask Maps
Maps迎來十年來最大升級,其中包括Ask Maps功能,支援更複雜、更長的問題。
基礎建設:資本支出從310億到1800億美元
支撐這些產品規模運轉,需要大規模基礎設施投入。
2022年,Google每年的資本支出是310億美元。今年預計達到約1800億至1900億美元,約是當年的6倍。
晶片層面,Google在Cloud Next上發表了第八代TPU,首次採用雙晶片策略,訓練和推理各有專屬架構:
TPU 8t用於大規模預訓練,原始算力約為上一代的3倍。結合JAX和Pathways,訓練不再受限於單一資料中心,可跨多個站點分散式訓練,全球可呼叫超過100萬塊TPU,構成全球最大訓練集群。模型訓練時間從數月縮短到數週。
TPU 8i專為推理設計,在速度上做了全面最佳化。兩款晶片的能源效率均比上一代提升約2倍。
全新模型:Gemini Omni與Gemini 3.5 Flash
Gemini Omni
AI正在從預測文字轉向模擬現實。 Gemini Omni是Google新發布的多模態世界模型,可以接受任意模態的輸入,產生任意模態的輸出。首發版本以視訊輸出為主,後續會支援影像和文字。 Gemini Omni Flash今天起可以在Gemini app、Google Flow和YouTube Shorts上體驗,開發者和企業客戶也將在未來幾週透過API獲得存取權限。
1)用自然語言編輯視頻
Omni支援透過對話逐步編輯視頻,每個指令都建立在上一條的基礎上,角色保持一致,物理規律成立,場景前後連貫。
2)物理理解與世界知識
Omni對重力、動能、流體動力學等物理法則有更精確的直覺理解,生成的場景物理表現更真實。同時,它也能召喚Gemini的歷史、科學和文化背景知識,把語言、圖像和意義連結起來,而不只是模式匹配。
3)任意輸入組合
Omni支援把圖片、文字、影片、音訊同時作為參考輸入,產生統一風格的輸出。
4)數字Avatar
使用者可以用Omni創造自己的數位Avatar,產生看起來和聽起來都像自己的影片。在修改影片中的音訊和語音方面,Google表示還在測試
不過有網友初步測試發現,omini的影片生成很拉胯,和seedance2.0差的比較遠
Gemini 3.5 Flash
Google今天推出Gemini 3.5 Flash,定位為將前沿智慧與行動能力結合的新一代模型。
與3.1 Pro相比,3.5 Flash在多項基準測試上領先,具體包括:Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%),在多模態理解上CharXiv Reasoning達到84.2%。其中GDPVal專門衡量現實世界中具有經濟價值的任務,進步尤其明顯。速度方面,輸出token每秒是其他前沿模型的4倍
3.5 Flash配合Antigravity可以調度多個子Agent協同工作,處理規模化的複雜任務
前端生成能力依舊非常能打,在多模態基礎上,3.5 Flash還能產生更豐富的互動式網頁UI和圖形,例如直接在AI Studio中為一篇研究論文生成互動動畫。
價格方面,3.5 Flash的成本不到同等前沿模型的一半。 Google給了一個估算:頭部企業每天處理約1兆token,如果將80%的工作負載從其他前沿模型切換到3.5 Flash,每年可以節省超過10億美元。
Gemini 3.5 Flash今天起對所有使用者和API開放。 Gemini 3.5 Pro目前在Google內部使用,下個月推出。
Google內部數據顯示,借助Antigravity平台和3.5 Flash,AI開發工具的token處理量從3月的每天5,000億,已經翻倍成長至如今每天超過3兆。
Antigravity 2.0:Agent開發平台
Antigravity原本是AI程式設計環境,現在正在擴展為一個完整的自主AI Agent開發和管理平台。
Antigravity 2.0是一個新的獨立桌面應用,作為Agent互動的中心,使用者可以在其中協調各類Agent處理不同任務。在速度上,這個版本使用了專門優化的Flash版本,比其他前緣模型快12倍。 Antigravity 2.0 和Codex 長的簡直一模一樣,😂
Antigravity用戶從今天起可以開始體驗。詳細內容請見官方介紹:
https://deepmind.google/technologies/antigravity/
Gemini Spark:24小時運行的個人AI Agent
Gemini app即將推出個人AI Agent-Gemini Spark,在使用者授權下取代使用者在數位世界中採取行動。
幾個關鍵特點:
• 運行在Google Cloud專用虛擬機器上,7×24小時持續運行,不需要保持電腦開啟
• 由Gemini 3.5和Antigravity驅動,可以在後台輕鬆處理長週期任務
• 從Google自有工具開始整合,未來幾週透過MCP接取第三方工具
• 支援在Gemini app中交互,未來也可以透過郵件和即時通訊使用
• 在Android上,可以透過新UI空間Android Halo查看Agent的即時進度,今年稍後上線
• 今年夏天晚些時候,Spark將直接在Chrome中運行,成為跨網頁的Agent瀏覽器
本週起Spark向受信測試用戶開放,下週Beta版向美國Google AI Ultra訂閱用戶推出。
Search進入Agent時代
Search也在向Agent方向進化。
資訊Agent :使用者可以設定個人化AI Agent在後台持續運行,在適當的時機主動找到所需資訊並協助採取行動。今年夏天起向Google AI Pro和Ultra訂閱用戶推出。
生成式UI :結合Gemini 3.5 Flash和Antigravity,Search將為每個問題動態產生客製化介面,包括個人化佈局和互動式視覺內容。今年夏天向所有用戶免費開放。
持久化自訂看板:對於需要持續追蹤的長期任務,Search可以為使用者建立專屬看板或追蹤工具,類似為特定任務客製化的迷你應用程式。未來幾個月起開放美國Google AI Pro和Ultra訂閱用戶。
其他發佈內容
Daily Brief :Gemini app即將推出的開箱即用Agent,整合收件匣、日曆和任務,產生個人化的每日摘要,不只是匯總訊息,還會做優先排序、整理和下一步建議,以便於快速瀏覽的形式呈現。
Google Flow :今天向所有使用者推出新Agent,可以在使用者參與和控制下規劃並處理複雜任務。支援在Flow中直接vibe code各類創意工具,例如影片特效設計、手繪動畫或文字疊加工具。
Google Pics :基於最新Nano Banana模型的AI圖像創建和編輯工具。它將圖片中每個元素視為獨立物件而非平面圖像,支援對特定細節進行精確創建、替換和調整。目前向受信測試用戶開放,今年夏天晚些時候向Workspace中的Google AI Pro和Ultra訂閱用戶推出。
智慧眼鏡:去年初登場的AI眼鏡產品有了更多細節,分為音頻眼鏡(耳機形態,語音提示)和顯示眼鏡(可顯示資訊)兩種,均支援免持使用Gemini。音頻眼鏡今年秋天率先上市。
Gemini for Science :科學研究的AI工具集,整合了Gemini的深度推理和研究能力、Deep Think和Deep Research,並新增了可以將Antigravity等Agent平台連接到超過30個主要生命科學資料庫和工具的Science Skills。使用者可以在Google Labs申請試用Gemini for Science實驗功能,Science Skills今天起在Github和Antigravity中直接可用。
從TPU 8i到Gemini 3.5,再到Antigravity和Spark,Google在這屆I/O上所呈現的,是一套從晶片到應用全面朝Agent方向演進的完整體系。




