Siri獨立成App,蘋果AI終於不再只做“潤飾工具”

蘋果WWDC 2026:Siri變身獨立App,跨應用程式與iCloud情境記憶加持,Apple Intelligence全面升級,與Gemini深度合作,AI代理時代到來。

十年後,Siri終於從系統浮層走了出來。

6月8日的WWDC上,蘋果預覽了iOS 27、macOS 27等新一代作業系統,幾乎所有的軟體更新都指向同一件事:AI正在從輔助功能變成系統級的互動入口。最顯眼的變化是Siri從一個呼之即來的語音浮窗,變成了一個擁有獨立圖標的App,支援iCloud同步對話歷史,形態上第一次向ChatGPT這類獨立AI應用看齊。

上一代Apple Intelligence把Siri限制在系統層的被動響應裡。它能幫你潤飾文字、總結通知,但沒辦法跨應用辦事,也記不住你上回問過什麼。這次,蘋果試圖把Siri從一個「聽得懂你」的助手,升級為一個「能替你動手」的代理。這場AI更新的輻射面遠不止Siri本身。從相簿的空間重建修圖,到Safari自動幫你盯商品降價,再到密碼管理應用程式替你登入網站並改掉弱密碼,系統角落裡幾乎到處是新的AI能力。

Siri有了獨立入口,對話終於能記住上下文

Siri變成獨立App,首先要解決的是「用戶去哪找AI」這個問題。

過去,Siri的入口分散在語音喚醒、側邊按鈕和鎖定螢幕長按之間,缺少一個固定的視覺錨點。 ChatGPT和Gemini以獨立App形態佔據使用者桌面之後,Siri的無形狀態反而成了一種劣勢:使用者不知道它到底能做什麼,也不習慣反覆打開一個沒有介面的工具。

有了獨立App和對話歷史iCloud同步,體驗完全不同了。用戶在iPhone上請Siri分析一份合約的關鍵條款,中午在Mac上繼續追問細節,Siri能記住上下文。這建立了一個長會話資產,也讓Siri在功能認知上更接近“一個能持續對話的AI”,而不是“一個回答單次問題的語音工具”。

底層驅動引擎也換了。 Wired和多家科技媒體在現場確認,蘋果已啟動第三代Apple Foundation Models,並與Google Gemini達成了多年深度合作,利用Gemini技術客製化開發下一代模型。 2024年WWDC時,蘋果的合作方還是OpenAI,Siri可以在特定場景下呼叫ChatGPT。兩年後,合作夥伴名單上加入了Google。蘋果在基座模型上不再單一依賴某家第三方,選擇了更靈活的多方客製路徑。

從“幫你查一下”到“幫你辦妥”

上一代Apple Intelligence的核心能力是理解和產生內容。它能總結長訊息、重寫郵件語氣、從照片庫找出特定圖片。但它無法跨應用程式做事。這是兩代產品之間最根本的分界線。

新版Siri AI透過App Intents框架和Spotlight個人資料索引,實現了跨應用程式上下文理解和任務執行。蘋果官網給了幾個典型場景:Siri能從郵件裡提取酒店預訂確認號,從信息App裡找到朋友推薦過的餐廳並直接預訂,甚至在通話過程中自動從郵件裡抓取驗證碼顯示在Phone應用界面上。

這個名為Call Context的功能讓使用者不需切割螢幕、不手動搜索,Siri在通話介面直接彈出所需的那串數字。它解決的是一個具體且高頻的痛點:接電話時需要同時查看簡訊或郵件裡的訊息,手忙腳亂。

密碼管理App的升級同樣指向這一點。新版Passwords不僅能偵測弱密碼和重複密碼,還能代理用戶自動導航至對應網站、完成登錄,然後產生一串強密碼並儲存。改密碼這件事的繁瑣程度眾所周知,大部分用戶選擇不改。蘋果把這件事交給AI代理商去做,降低的是用戶的安全維護成本。

Safari也塞進了類似的能力。新增的Notify Me功能可以監控指定網頁的變更,例如某件商品降價、某個頁面補貨,然後主動推播通知。用戶在後台等就行,不用隔三差五手動刷新。另一個更徹底的功能是用自然語言描述需求,讓AI直接產生一個自訂瀏覽器插件。用戶說“幫我把這個網頁裡所有表格自動高亮顯示金額超過500的行”,Safari就會產生對應插件來完成這件事。這等於是給一般使用者開了一條零代碼自訂瀏覽器的通道。

Shortcuts快捷指令應用也獲得了相同的自然語言化改造。 “Describe a Shortcut”允許用戶只寫一句“每天早上8點自動播報今天的日曆安排和天氣”,AI就能自動組裝出對應的快捷指令步驟。這些改動指向同一個目標:把原本只有進階使用者或開發者才會使用的系統功能,壓到一般使用者說一句話就能搞定的門檻。

相機裝上Siri,擴圖和透視重構一起進相冊

Visual Intelligence在本次更新中大幅擴充了覆蓋範圍。相機應用程式裡新增了一個“Siri模式”,用戶可以對準餐廳帳單讓Siri算出AA每人多少錢,Siri識別圖片內容後直接透過Apple Cash發起分帳請求。對準一本書查評價,對準食物顯示營養成分,這些場景和Google Lens多年來的功能路徑高度重疊。

差別在於蘋果把這個視覺理解能力鋪到了更​​多設備上。 iPad截圖後可以直接用Siri分析,Mac上透過快捷鍵調起,Vision Pro也能呼叫。相機不再是唯一入口,蘋果正在建構的是一個覆蓋所有裝置的通用視覺理解層。

相簿應用程式也拿到了兩個基於AI的新功能:Spatial Reframing空間重構透視和Extend擴圖。擴圖即AI在照片邊緣自動產生擴充內容。 Spatial Reframing則有實質差異,它利用空間計算模型來改變照片的透視關係,不是簡單裁切或拉伸,而是重新計算畫面中物體的前後關係。蘋果在發表會上用一張側面拍攝的建築照片做了演示,經過處理後畫面變成了正面正視的角度。目前官方尚未公佈該功能對非建築類場景的處理效果,但從技術路徑來看,這比普通生成式擴圖多了一步空間理解的計算。

Image Playground的升級則是另一個維度。第一代只能產生卡通風格或插畫風格的影像,這次直接支援了照片級真實影像生成。由於對算力要求較高,蘋果把它放在了Private Cloud Compute雲端運行,而非設備端。每產生一張圖片都會強制嵌入SynthID隱形浮水印,用來識別AI產生內容。同時功能設定了每日使用限制,具體配額在正式版會隨iCloud+訂閱方案有差異,目前尚未揭露具體數字。

五金門檻和地區限制是繞不過去的現實

AI功能的支援範圍遠比系統更新的支援範圍窄。

iOS 27的相容裝置從iPhone 11起步,但Apple Intelligence和Siri AI的核心功能僅限iPhone 15 Pro以上機型、M1以上晶片的iPad和Mac。部分更進階的功能,例如更具表現力的語音和高階聽寫,還需要更新的硬體:iPhone Air、iPhone 17 Pro系列,或是12GB以上統一記憶體的M4 iPad和M3 Mac。

地區限制同樣嚴格。受歐盟《數位市場法案》影響,Siri AI在歐盟地區的iOS和iPadOS上暫不可用。中國大陸則因監管要求暫不支援Apple Intelligence。照片級影像產生這類基於PCC雲端的AI功能,在有地區限制的市場也一併被鎖。對於長期習慣蘋果全球統一體驗的用戶來說,這種按地區和設備雙重切割功能的做法可能會帶來困惑。

蘋果AI這一年:跳票交了學費,合作名單換了

2024年WWDC,蘋果首次推出Apple Intelligence概念時,Siri被描繪成一個能深度理解個人資料並跨應用執行任務的智慧助理。但這些功能隨後數次延後交付,用戶發起虛假宣傳集體訴訟,蘋果最終支付了2.5億美元和解金。

這段經歷直接影響了本次發布的內容密度和承諾謹慎程度。一年前畫過的餅,現在必須端上桌。

整個2025年,蘋果在消費級AI功能的發布上明顯放慢了節奏,外界稱之為蘋果AI的「Gap Year」。期間,蘋果重新調整了AI部門的組織架構,為2026年的集中大改版做內部準備。根據Yahoo Finance報導,蘋果2026年的資本支出計畫為140億美元。和亞馬遜、微軟動輒數千億美元的AI基礎設施開支相比,這個數字顯得克制。蘋果不參與算力軍備競賽,依賴自有晶片生態和端側運算來做差異化。

最值得注意的變化是合作夥伴的轉向。 2024年Siri接入的外部模型是OpenAI的ChatGPT,到了2026年,蘋果與Google Gemini建立多年深度合作,利用Gemini技術客製開發下一代Apple Foundation Models。這種從單一合作到多方並行、從直接調用到深度定制的路徑變化,反映出蘋果在基座模型上不再願意綁死在單獨一家第三方身上。對使用者來說,這意味著Siri背後的模型能力來源更加多元,也有可能在特定任務上切換不同模型的長處。

分享至:

作者:OmniTools

本文為PANews入駐專欄作者的觀點,不代表PANews立場,不承擔法律責任。

文章及觀點也不構成投資意見

圖片來源:OmniTools如有侵權,請聯絡作者刪除。

關注PANews官方賬號,一起穿越牛熊
PANews APP
TON第一季Telegram產品營收達8,850萬美元,跨鏈NFT市佔率升至35.5%
PANews 快訊