作者:Zen,PANews
我們如今接觸的人工智慧,幾乎都生活在螢幕裡。它們回答問題、生成圖片、寫程式碼,或被包裝成各種Agent進入企業工作流程。它們極大改變了資訊處理方式,卻很少進入現實世界,參與生產、服務和輔助勞動。
而隨著生成式AI從眼前一亮轉為習以為常,業界又開始思考下一階段的問題:真正的人工智慧,是否還需要具備感知環境、規劃行動、操作物體並從現實回饋中學習的能力?
今年上半年,資本市場已經開始給出自己的答案,據TechTimes援引Dealroom數據,Physical AI與機器人公司在2026年迄今融資已達558億美元,幾乎是上一年度全年紀錄的兩倍。
此外,一些加密貨幣行業熟知的crypto原生風投機構,也開始轉向這一領域。Framework Ventures日前剛剛完成4億美元四期基金募集,並宣布投資範圍擴展至AI、機器人領域。
目前幾乎所有科技領域的資本,都在將下一輪技術革命的想像投向物理世界。而資本、產業和輿論的共同轉向,指向一個更深層的判斷。即Physical AI不僅僅是AI的又一個應用賽道,更是人工智慧從「資訊處理系統」走向「現實控制系統」的範式變化。
Physical AI重新定義了智慧
過去兩年人們所見的AI飛速發展,主要發生在數位資訊世界。大語言模型擅長處理文字,圖像模型擅長生成視覺內容,程式碼模型擅長在既定規則中完成程式任務。不過,這些輸入和輸出仍停留在數位空間,即便多模態模型可以「看圖說話」,它理解的也主要是圖像、文字和語義之間的對應關係。
正如早期科幻小說中就開始描繪的那樣,人類長期暢想的智慧,從來不只是會推理、寫作和對話。對於生活在物理世界的人來說,智慧更接近一種完成任務的能力:看見環境,理解限制,規劃行動,操作物體,並在回饋中不斷調整。
我們需要的不僅僅是一個能夠預測「杯子會從桌上掉下去」的模型,還需要它在判斷杯子的材質、重量和受力變化後,最終能在真實環境中伸手拿起杯子,通過調整力度和姿態,穩定完成一個看似簡單卻包含多重變量的動作。
這種需求和想像,也正是Physical AI受到科技界關注的原因。今天的AI大模型已經在語言、圖像和程式碼任務中展現出很強的能力,但一旦進入物理世界,問題就不單單是理解指令,更關鍵的是能否把感知、判斷和動作連成一個穩定系統。它需要看清環境,理解物體狀態,規劃動作路徑,並在執行過程中根據回饋不斷調整。
a16z曾以摺毛巾為例說明這種複雜性。這種人類的日常動作,對機器而言需要系統理解柔性材料的形變,控制連續動作,識別手部與布料之間的接觸狀態,並在摺疊失敗時重新調整。對人來說這類動作幾乎不需要思考,但讓機器人完成,就涉及到了柔性材料建模、運動控制、觸覺回饋、仿真訓練等多項技術難題。
Nvidia的佈局也在應對這一變化。黃仁勳在GTC 2026上提出Physical AI已經到來,並稱每一家工業公司都將成為機器人公司。Nvidia推出Cosmos、Isaac、GR00T等模型和仿真工具,正是為了搭建一套從模擬訓練到真實部署的基礎設施:讓機器人先在虛擬環境中學習物理規律和動作策略,再遷移到工廠、倉庫等真實場景中執行任務。
Physical AI:從「軟體生產力」進入「物質生產力」
生成式AI已經改變了都市白領的工作模式,它可以代寫郵件、做PPT、生成文案、總結會議紀錄,也可以在客服、設計、教育和法律輔助中提升效率。但這些場景本質上仍屬於資訊勞動,改變的是處理資訊的方式。
Physical AI面向的是另一類任務。它面對的不再是辦公室裡的文件和程式碼,而是工廠裡的零件、倉庫裡的包裹、醫院裡的器械、農田裡的作物、礦山裡的設備、道路上的車輛和能源系統中的基礎設施。過去的AI主要提高腦力勞動效率,Physical AI試圖進入體力勞動和工業流程。
這也是資本高度關注該領域的原因。軟體AI主要切入企業軟體預算和知識工作者時間;一旦機器人能夠穩定執行真實任務,它觸及的就是製造業、物流業、建築業、醫療護理、農業和國防工業中的勞動力成本、產能瓶頸、設備利用率和供應鏈效率。它爭奪的不是一個新的SaaS品類,而是真實經濟中最核心的成本項。
Figure AI推出的人形機器人與人類比拼選揀快遞包裹的公開競賽,提供了一個直觀案例。這場演示展示了人形機器人處理重複性物流任務的可能性,以及Physical AI可能的落地路徑:先從重複、高頻、半結構化、勞動強度高的場景切入,再逐漸進入更複雜的工業流程。
相比家庭機器人,倉庫和工廠更容易部署,因為場景更可控,任務更明確,投資回報也更容易計算。Figure在BMW工廠部署的Figure 02機器人,曾在BMW Spartanburg工廠參與汽車裝配相關工作,並幫助完成約3萬輛汽車的生產任務。最新一代Figure 03則進入BMW工廠的裝配和物流大廳,執行更複雜的sequencing任務,包括拉動重型小車、重新定位身體並搬運零部件。
這也是為什麼人形機器人雖然成本高、難度大,卻仍然吸引資本。傳統工業自動化擅長處理高度標準化的任務,例如固定工位上的焊接、搬運和裝配。但在真實工廠和倉庫中,仍有大量工作處在標準化與非標準化之間,也就是任務本身重複發生,但物體尺寸、位置、姿態、順序和環境狀態會不斷變化。
包裹大小不同,零件位置會偏移,料車需要臨時調整,生產線也會根據訂單變化重新排布。而當前不少Physical AI企業試圖切入的,正是這類半結構化、高頻、具備商業價值的非完全標準化的場景。
從這個角度看,Physical AI某種意義上是讓AI進入勞動力市場。它最終改變的可能不是某個單一崗位,而是一種勞動組織方式。過去,企業通過招聘、排班、培訓和管理來調度人類勞動。而在未來,一部分勞動可能通過模型、機器人和遠程監控系統來調度。老齡化、勞動力短缺、製造業回流、供應鏈安全和國家工業能力,也都因此被納入同一條技術主線。
Physical AI的核心競爭:「現實世界數據」
表面上看,Physical AI賽道比拼的是機器人硬體。誰肢體動作更穩,誰的手更靈巧,誰的續航更長,似乎就更有優勢。但在硬體之外,更關鍵的競爭正在轉向現實世界數據。
上一輪AI競爭建立在網際網路數據之上。文本、圖片、影片、程式碼和網頁內容已經被大規模用於訓練模型,支撐了大語言模型在寫作、翻譯、總結和生成任務中的泛化能力。但Physical AI面對的是一個全新的數據環境,機器人需要學習的是如何在現實空間中移動、抓取、搬運、裝配,並根據環境變化調整動作。
下一代稀缺資產,很可能是現實世界中的動作數據。比如人類如何完成物理任務的數據:手怎樣抓取,身體如何平衡,力度如何調整,失敗後如何糾錯,什麼時候改變策略。這些數據不像網頁一樣可以直接爬取。它們需要真實場景、機器人硬體、感測器、動作捕捉和長期部署。
這也是很多機器人公司正在把數據採集建成核心能力的原因。Apptronik近日宣布推出新的機器人訓練設施Robot Park,並發布Apollo 2人形機器人。該訓練中心與Google DeepMind合作,目標是收集大規模真實世界數據,推動機器人從試點走向規模化部署。
近期獲Tether、Nvidia、Amazon 等公司共計14億美元投資的德國機器人公司NEURA Robotics,其佈局同樣直接指向這一問題。
NEURA推出的NEURA Gym,定位為Physical AI訓練設施,其核心是在真實或接近真實的物理環境中,讓機器人反覆練習抓取、分揀、裝配等任務,生成視覺、觸覺、力回饋和空間感知數據。與之配套的Neuraverse則承擔平台作用,將機器人、開發者、數位孿生和訓練數據連接起來,使一個場景中訓練出的能力可以在更多機器人和應用中複用。NEURA與慕尼黑工業大學還宣布在慕尼黑機場建設TUM RoboGym,稱其為歐洲最大的Physical AI科研與訓練中心。
基於這一趨勢,圍繞機器人數據的創業方向也開始出現。例如Roborecs將自己定位為「Physical AI背後的數據設施」,透過招募和訓練操作員,讓人類遠端操控機器人完成雙手裝配等接觸密集型任務,並採集視覺、力和觸覺數據,再授權給機器人製造商使用。
可見,Physical AI生態正在分工,有的公司造機器人身體,有的公司做機器人「大腦」,有的公司做模擬平台,還有的公司專門採集訓練機器人所需的數據。
學術界也在圍繞這一問題快速推進。近期關於人形機器人遙操作和動作遷移的論文大量出現,例如基於IMU動作捕捉服將人類動作即時映射到Unitree G1機器人,或透過VR裝置構建可攜式人形機器人數據採集系統。這些研究共同指向如何將人類身體經驗轉化為機器人可以學習和復用數據的問題上。
不過,雖然資本和想像力已足夠豐富,但對於仍處於早期的Physical AI而言,今天的人形機器人距離通用部署還有很長距離,很多展示仍依賴受控環境、遠端操作和精心設計的任務。
但它至少說明,人工智慧的發展正在邁入一個新的階段。這個過程不會一蹴而就,甚至未必會以今天最流行的人形機器人型態完成,但AI從螢幕走向現實世界,已經成為下一輪技術競爭中越來越清晰的方向。


