微軟Build 2026開發者大會一口氣發七款自研模型，「Agent優先」時代到來

作者丨李海倫，騰訊科技

編輯丨徐青陽

美國當地時間6月2日，微軟Build 2026開發者大會在舊金山梅森堡拉開序幕。此次大會主題聚焦於前沿AI技術的實戰應用，微軟發布了一系列涵蓋自研AI模型、智能體應用、作業系統安全、開發者工具、雲端服務及新型硬體平台的產品與更新。

在2025年的開發者大會，微軟確立了「AI智能體時代」方向，發布了Copilot Studio多智能體編排、Windows AI Foundry，並宣布全面支援Model Context Protocol，GitHub Copilot 推出程式設計智能體Coding Agent。

在微軟的敘事中，2025年解決的是“智能體時代，該用什麼標準和框架”，2026年聚焦的是“如何用自家的模型和產品，真正跑起來”——模型層補上了能挑大樑的自研主力，產品層把智能體從演示推向了系統、硬件和雲的全棧落地。

這次發表會，核心發布可分為六個板塊：MAI自研模型家族、以Scout和GitHub Copilot應用為代表的智能體生態、Windows系統級AI安全沙箱MXC、以開發者為導向的Surface RTX Spark Dev Box與系統最佳化、Project Solara新型智能體設備平台，以及包括Microsoft IQ、Rayfin、開發者與管理架構。

01 七款模型從零訓練，拒絕蒸餾

整場主題演講以微軟CEO薩提亞·納德拉的願景陳述為主線徐徐展開。他拋出「智能體優先」的策略框架後，各業務線高層依序登台，推出具體產品把這套框架落實。

在大會上，蘇萊曼宣布推出七款由微軟AI內部開發的全新模型，統一歸入MAI家族。

他將MAI的使命描述為構建一台“爬山機器”，透過持續投入計算量、更優數據和更精準評估，實現循環往復的自我改進，讓用戶始終保持在技術前沿。

在訓練運算規模方面，蘇萊曼指出，用於訓練前緣模型的運算量已成長一兆倍，預計未來三年內將再成長一千倍。微軟所有MAI模型均“從零開始進行爬山，零蒸餾”，不依賴第三方模型輸出進行訓練。

微軟AI部門負責人蘇萊曼介紹七款自研模型

具體模型如下：

旗艦推理模型MAI-Thinking-1 ，這是一個中型模型。微軟表示，它在關鍵的軟體工程測試中，效能可以跟市面上最好的模型打平。在盲測對比中，人類評判者對它的偏好程度跟Sonnet 4.6不相上下。這個模型是從零開始、用乾淨資料訓練，沒有使用第三方模型蒸餾。

程式設計模型MAI-Code-1-Flash ，是一個推理高效的agentic編碼模型，擁有50億參數，專為GitHub Copilot、VS Code和微軟技術堆疊量身定制並深度整合。微軟表示可與Haiku媲美但成本更低。

文生圖模型MAI-Image-2.5及其超高效Flash變體，支援文生圖和圖像編輯，微軟稱其在Arena評分上超越了GoogleNano Banana Pro。

轉錄模型MAI-Transcribe-1.5 ，具備SOTA等級準確性。據稱速度比競品模型快五倍，內建支援43種語言的領域特定術語識別。

語音生成模型MAI-Voice-2 ，提供高品質、自然聽感的語音生成，支援15種語言，能夠根據短樣本適配聲音，具備防濫用保護措施。其Flash變體即將推出，以更低成本實現同樣功能。

所有模型共享相同的資料規格、基礎設施和評估框架。除了在Azure Foundry上分發並為微軟第一方產品優化外，這些模型還將在Open Router以及Fireworks和Baseten上提供給開發者。開發者首次能夠自行調整模型權重。

在會議上，納德拉介紹了Microsoft Frontier Tuning，一種讓企業用自身工作資料客製化模型的方法。其邏輯是，最有價值的數據不是通用語料，而是智能體在企業裡執行任務的真實軌跡、步驟和決策。

微軟CEO納德拉介紹Frontier Tuning

這套機制把MAI模型連接到實際業務流程，讓模型在真實環境中邊做邊學。蘇萊曼說：“你正在建立自己的模型：在你的環境中，用你的數據訓練，由你控制。你的機構知識會成為模型的一部分，並且只屬於你。”

效果方面，微軟為Excel調整的MAI模型與GPT-5.4水準相當，同時效率提升10倍。麥肯錫採用Frontier Tuning後，MAI在所有測試模型中達到最高勝率，成本降低約10倍。

在醫療健康領域，微軟宣布與梅奧診所合作，共同打造一個用於醫療保健的前沿AI模型。該模型將梅奧診所的臨床專業知識、去識別化的臨床數據和縱向洞察，與微軟的基礎AI能力結合。

微軟同時透露，MAI模型正與自研的Maia 200晶片進行協同設計，透過軟硬體聯合優化已實現1.4倍的效率提升。

02 智能體生態全面落地

微軟在大會上宣告了向「Agent優先」的宏大轉型，旨在自動化知識工作者使用軟體的方式，將AI助理植入日常辦公室互動中。

Scout是此次發表的核心智能體產品。這款被稱為「永遠在線」的AI Agent，構建於OpenClaw框架之上，可在Microsoft Teams中像人類同事一樣互動。

Scout能瀏覽使用者的工作訊息、行事曆和電子郵件收件匣，自動完成任務、重新安排衝突會議，並起草聽起來很專業的回覆。使用者可在Teams中直接向它發送指令，也可以為它命名。

微軟新任命的企業副總裁奧馬爾·沙欣解釋了Scout的設計理念：“你的公司本質上就是僱用了你的助理。擁有私人助理的全部意義在於，當你不在工作時，他們還在工作。”

Scout透過微軟Frontier方案提供，需GitHub Copilot訂閱。微軟正測試一款Scout桌面應用，將向選擇「前沿」功能存取權限的訂閱用戶推出。在微軟內部，沙欣說銷售部門是使用該工具最大、成長最快的族群。

GitHub Copilot桌面應用程式是另一個重要發布。 GitHub首席產品長馬裡奧·羅德里格斯（Mario Rodriguez）介紹，這是一款「構建在GitHub之上的、Agent原生的桌面體驗」。

透過統一的「My Work」視圖，開發者可看到跨連接倉庫的動態工作，包括活動會話、議題、拉取請求和後台自動化。每個會話在自己的Git worktree中運行，並行Agent互不干擾。應用程式具備Agent Merge功能，可帶領拉取請求完成審查、檢查和合併。 Canvas介面用於人機之間的雙向交互，開發者可檢查、引導和驗證Agent代表自己執行的工作。

GitHub Copilot應用程式針對Windows 11、Windows 11 on Arm、Mac和Linux提供技術預覽版，需要GitHub Copilot訂閱，未來將向Copilot Free用戶開放。該應用程式支援雲端和本地沙箱、程式碼審查，兩者均附帶策略支援。

在智能體安全治理方面，微軟發布了Agent控制規範（ACS），這是一個新的開源標準，旨在為開發者提供更一致、更細微的方法來控制AI Agent的行為。 ACS讓開發、合規和安全團隊能夠為Agent定義策略文件，規定Agent可以做什麼、絕對不能做什麼、何時需要人類批准，以及應記錄哪些證據供審查。

ACS以一個SDK發布，附帶LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft.Extensions.AI、MCP工具等的插件。由於策略可寫成單一文件，可以與Agent捆綁在一起，跟隨Agent穿越不同框架和環境。

ASSERT（Adaptive Spec-driven Scoring for Evaluation and Regression Testing）是另一個測試工具。這是一個開源框架，透過使用AI將對目標、策略或預期行為的高級自然語言描述，轉化為結構化的評分測試。

ASSERT接收關於AI模型預期行為的簡明語言描述，產生可接受與不可接受行為集合、問題場景和測試案例，針對目標系統運行測試並評分。它還能記錄AI系統所採取的路徑，包括中間操作和工具調用，以便開發者檢查失敗位置。

03 Agent越自主越危險，微軟用MXC在系統層劃紅線

隨著AI Agent日益強大且自主，微軟辨識出一個關鍵問題：Agent越自主越有用，讓它不受護欄約束地在企業網路上運作就越危險。微軟官方部落格將此描述為一個“多層系統問題”，Agent與人類、工具、應用、模型以及其他Agent之間的每一次互動“都會暴露新的攻擊面，並引入不同的故障模式”。

針對這個問題，微軟推出了Microsoft Execution Containers（MXC），這是一個內建在Windows作業系統本身的、由策略驅動的執行層。微軟Windows和設備執行副總裁帕萬·達武魯裡強調，這對於使AI Agent具有商業可行性至關重要，它們“圍繞安全性、包含、隔離和讓用戶控制”，將使Agent對普通消費者和企業部署來說足夠安全。

微軟CEO納德拉介紹系統級安全沙箱MXC

MXC本質上是一個SDK和策略模型，嵌入在Windows和Windows Subsystem for Linux中，提供微軟所稱的「可組合的沙箱頻譜」。此頻譜範圍從輕量級進程隔離（已被GitHub Copilot的命令列介面採用），延伸到微型虛擬機器、Linux容器，以及在Windows 365上運行的完整雲端執行個體。

系統將Agent的執行與使用者的桌面、剪貼簿、使用者介面和輸入設備分開。每個Agent被綁定到一個身份，要么是本地ID，要么是由Microsoft Entra支援的雲端預配身份，確保Agent的每個動作都可歸因、審計和治理。

MXC現已提供早期預覽版。與微軟企業安全堆疊整合的Agent 365將於2026年7月推出預覽版，將Entra身分服務、Intune裝置管理、Defender威脅防護和Purview資料治理能力層疊到MXC之上，使IT部門能集中管理Agent隔離。

在合作夥伴方面，OpenAI、英偉達、Manus、Nous Research（Hermes Agent製造商）以及OpenClaw開源專案已宣佈在MXC上建置。

值得一提的是，OpenClaw的合作，是創作者彼得‧史坦伯格（Peter Steinberger）主動聯繫微軟表達合作興趣，最後這事發展成了全面的平台級夥伴關係。

04 三項更新，讓Edge的AI"不連網也能跑"

微軟Edge瀏覽器也獲得了本地AI能力升級。微軟表示，自Build 2025引進Phi-4-mini後，團隊根據網頁開發者回饋擴展了端側AI能力。

第一項是Aion-1.0-Instruct，一個比Phi-4-mini更小、更快、更有效率的本地小語言模型。它可在GPU和CPU能力較弱的PC上運行，現以開發者預覽版提供，將於7月登陸Hugging Face。

第二項是語言偵測和翻譯API，隨Edge 148版本提供。這兩個API由Edge內建的端側AI模型驅動，用於JavaScript，允許網站和瀏覽器擴展識別文字語言並在語言對之間翻譯。微軟稱其“提供快速、高品質的翻譯，支援超過145種語言，並針對網路上的翻譯工作負載進行了最佳化”，此服務免費。

第三項是透過Web Speech API實現語音識別，在Edge Canary和Dev頻道中以實驗形式提供。此API可協助開發者將語音或音訊輸入整合到網站和瀏覽器擴充功能中，在裝置本地運行，也可基於雲端語音轉文字和文字轉語音服務作為後盾。

05 開發者工具與雲端服務迭代

在資料智慧層面，微軟發布了Microsoft IQ，把先前各自獨立的四個上下文來源合併成Agent的共享基礎。

微軟Fabric技術長阿米爾‧內茨打了個比方：《駭客任務》裡那些綠色代碼瀑布不是裝飾，而是建造那個世界的地基。他說，「我們在數據世界做的事，就是為Agent創造一個基於數據的現實」。

Microsoft IQ的四個上下文來源分別為：Work IQ，捕獲組織日常運作方式，利用電子郵件、文件、會議和日程安排；Foundry IQ，管理機構知識，策劃和索引知識庫；Fabric IQ，透過資料對業務的即時營運狀態進行建模，定義基於Fabric即時智慧的即時訊號所錨定的實體、連網關係和業務規則，該功能預計在未來幾個月內正式發布的實時訊號

有了這套上下文體系，Agent就不再是只會執行指令的工具，而是一個了解公司運作的虛擬員工。

光有共享的「地基」還不夠。當Agent開始產生應用程式時，每個應用程式都需要一個後端，如果放任不管，這些應用程式就會在上下文層之外形成新的資料孤島。為此微軟發布了Rayfin，一個開源SDK和CLI，它把Agent構建的應用直接部署到Fabric平台作為受治理的生產後端，應用數據默認進入統一的OneLake數據湖，再反饋回Microsoft IQ，而不是在外部堆積。

微軟把它定位為Supabase和Neon的競爭對手，核心差異就是治理：所有應用程式都走同一套資料和合規通道。內茨說這是個雙向過程，Agent建應用時從企業的資料規則裡取訊息，應用跑起來產生的資料又反過來更新這套規則，下一個Agent就能用上最新的東西。

微軟同時推出的WSL容器功能，讓開發者能在Windows上直接建立和管理Linux容器，微軟也為它配了命令列介面和API，允許在本機Windows應用程式中運行Linux容器，這個功能將在未來幾個月提供公開預覽。

為了不讓開發者在環境配置上浪費時間，微軟也發布了Windows Developer Configurations，可以快速設定一台新機器並套用開發者最佳化配置，自動安裝WSL、PowerShell 7和Visual Studio Code，同時在檔案總管中啟用Git版本控制並顯示隱藏檔案。

06 兩款新硬件，把AI重活拉回本地端

這場Build不只是模型、Agent和開發工具的軟體秀，硬體也沒缺席。當AI運算越來越吃算力、Agentic工作流程又需要持續不斷地跑，微軟索性把目光投向了開發者手邊的設備，與其每次都去租昂貴的雲端GPU，不如讓這些活兒直接在本地機器上完成。

Surface產品公司副總裁安德魯希爾宣布了兩款新設備：

Surface RTX Spark Dev Box是一款緊湊型開發者PC，搭載NVIDIA RTX Spark超級晶片，結合NVIDIA Blackwell RTX GPU和NVIDIA Grace CPU，提供高達1 Petaflop的AI算力，配備128 GB統一記憶體。

該設備採用鋁製機殼兼作散熱器，專為長時間運行的訓練任務、大模型推理和複雜Agentic流程設計。裝置預先設定Windows 11 Pro，並在鏡像層級為開發者預先配置：深色主題、為開發簡化的工作列、移除小工具、開啟「請勿打擾」模式、開發者模式已啟用、PowerShell 7為預設Shell。 WSL 2已配置好GPU直通和CUDA支持，VS Code、GitHub Copilot、Git、Python和Node.js均已安裝。

安全性方面，Surface RTX Spark Dev Box建立在符合微軟零信任原則的晶片到雲端安全性之上，包括Secured-core PC架構、BitLocker加密和Microsoft Defender保護，並可與Entra ID和Intune整合實現大規模管理和治理。

希爾解釋：「開發者建立軟體的方式正在發生根本性變化。AI模型的能力和複雜性日益增長，Agentic工作流程需要持續的運算能力，而且即便是那些不需要最先進模型的任務，每一次迭代也可能產生雲端成本」。

另一款Surface Laptop Ultra專為開發者、創作者和技術專業人士設計的高性能筆記型電腦，已經於早些時候推出，兩者共同代表Surface的下一步：為構建未來的人們打造專用設備。 Surface RTX Spark Dev Box將於今年稍晚在美國上市，僅在Microsoft.com獨家銷售。

07 讓設備運作AI Agent而非應用程式的新平台

微軟應用科學部門負責人史蒂維·巴蒂什介紹了被稱為Project Solara的內部專案。

這是一個從晶片到雲端的新平台，基於Android而非Windows，旨在讓裝置運行AI Agent而非應用程式。巴蒂什解釋其出發點：“界限正在崩塌。你不一定需要傳統的應用模式。你不需要傳統的方式來開發體驗。”

首批兩款概念設備已在Build大會上展示：

桌面中心設備，放在PC旁邊，回應語音命令，透過臉部辨識登入用戶，呈現當天最緊急的事項。連接顯示器後可變成一台在雲端運作的完整Windows機器。

穿戴式工牌設備，重新構想了標準員工ID卡。一鍵按下指紋即可喚醒Agent，輕觸可錄製和轉錄對話，內建攝影機讓Agent能根據使用者所見採取行動。

在醫療保健演示中，這款工牌運行了為醫護人員設計的Agent，能掃描患者二維碼、記錄和轉錄就診過程、記錄生命體徵並開出處方。在另一個應用中，內建攝影機掃描了寫著辦公室改造創意的腦力激盪板，並提出了添加綠植的建議。

巴蒂什表示，微軟不會自己生產這些設備，而是設想硬體製造商和其他產業夥伴將這些參考設計轉化為自己的產品，每個都針對特定產業、公司或場景。

08 量子晶片升級，可靠性提升千倍

微軟也發布了下一代拓樸量子晶片Majorana 2。

相較於前代Majorana 1，這次的核心變化是超導體材料從鋁換成鉛，這項調整使量子位元可靠性提升1000倍，平均量子位元壽命達到20秒，部分實例可持續一分鐘。

其他技術路線的量子位元壽命通常僅微秒。基於這項進展，微軟將可擴展量子電腦的預期實現時間縮短一半，目前預計在2029年前達成。

此晶片的研發全程使用了Microsoft Discovery平台的Agentic AI能力。 AI智能體承擔了製造管理、量子態自動化測量和跨學科數據分析等任務，將原本數週的測量週期壓縮了幾個數量級，並從近二十年積累的數據中識別出人類難以察覺的關聯。

微軟技術院士切坦·納亞克說：「Agentic AI幾乎滲透到我們所做的一切事情中。」但他強調AI只提供指導，「始終是科學家在迴路中」。

Microsoft Discovery平台也於本次大會正式發布，這是一個面向前沿研發的組織級平台，讓研究人員部署由人類指導的自主Agent團隊，進行假設生成、實驗優化和理論驗證。微軟同時推出了Microsoft Discovery應用程式的早期預覽版，個人可免費下載，並使用GitHub Copilot帳號在本地運行。