作者:Zen,PANews
我们如今接触的人工智能,几乎都生活在屏幕里。它们回答问题、生成图片、写代码,或被包装成各种Agent进入企业工作流。它们极大改变了信息处理方式,却很少进入现实世界,参与生产、服务和辅助劳动。
而随着生成式AI从眼前一亮转为习以为常,业界又开始思考下一阶段的问题:真正的人工智能,是否还需要具备感知环境、规划行动、操作物体并从现实反馈中学习的能力?
今年上半年,资本市场已经开始给出自己的答案,据TechTimes援引Dealroom数据,Physical AI与机器人公司在2026年迄今融资已达558亿美元,几乎是上一年度全年纪录的两倍。
此外,一些加密货币行业熟知的crypto原生风投机构,也开始转向这一领域。Framework Ventures日前刚刚完成4亿美元四期基金募集,并宣布投资范围扩展至AI、机器人领域。
目前几乎所有科技领域的资本,都在将下一轮技术革命的想象投向物理世界。而资本、产业和舆论的共同转向,指向一个更深层的判断。即Physical AI不仅仅是AI的又一个应用赛道,更是人工智能从“信息处理系统”走向“现实控制系统”的范式变化。
Physical AI重新定义了智能
过去两年人们所见的AI飞速发展,主要发生在数字信息世界。大语言模型擅长处理文字,图像模型擅长生成视觉内容,代码模型擅长在既定规则中完成程序任务。不过,这些输入和输出仍停留在数字空间,即便多模态模型可以“看图说话”,它理解的也主要是图像、文字和语义之间的对应关系。
正如早期科幻小说中就开始描绘的那样,人类长期畅想的智能,从来不只是会推理、写作和对话。对于生活在物理世界的人来说,智能更接近一种完成任务的能力:看见环境,理解限制,规划行动,操作物体,并在反馈中不断调整。
我们需要的不仅仅是一个能够预测“杯子会从桌上掉下去”的模型,还需要它在判断杯子的材质、重量和受力变化后,最终能在真实环境中伸手拿起杯子,通过调整力度和姿态,稳定完成一个看似简单却包含多重变量的动作。
这种需求和想象,也正是Physical AI受到科技界关注的原因。今天的AI大模型已经在语言、图像和代码任务中展现出很强的能力,但一旦进入物理世界,问题就不单单是理解指令,更关键的是能否把感知、判断和动作连成一个稳定系统。它需要看清环境,理解物体状态,规划动作路径,并在执行过程中根据反馈不断调整。
a16z曾以折毛巾为例说明这种复杂性。这种人类的日常动作,对机器而言需要系统理解柔性材料的形变,控制连续动作,识别手部与布料之间的接触状态,并在折叠失败时重新调整。对人来说这类动作几乎不需要思考,但让机器人完成,就涉及到了柔性材料建模、运动控制、触觉反馈、仿真训练等多项技术难题。
Nvidia的布局也在应对这一变化。黄仁勋在GTC 2026上提出Physical AI已经到来,并称每一家工业公司都将成为机器人公司。Nvidia推出Cosmos、Isaac、GR00T等模型和仿真工具,正是为了搭建一套从模拟训练到真实部署的基础设施:让机器人先在虚拟环境中学习物理规律和动作策略,再迁移到工厂、仓库等真实场景中执行任务。
Physical AI:从“软件生产力”进入“物质生产力”
生成式AI已经改变了都市白领的工作模式,它可以代写邮件、做PPT、生成文案、总结会议纪要,也可以在客服、设计、教育和法律辅助中提升效率。但这些场景本质上仍属于信息劳动,改变的是处理信息的方式。
Physical AI面向的是另一类任务。它面对的不再是办公室里的文档和代码,而是工厂里的零件、仓库里的包裹、医院里的器械、农田里的作物、矿山里的设备、道路上的车辆和能源系统中的基础设施。过去的AI主要提高脑力劳动效率,Physical AI试图进入体力劳动和工业流程。
这也是资本高度关注该领域的原因。软件AI主要切入企业软件预算和知识工作者时间;一旦机器人能够稳定执行真实任务,它触及的就是制造业、物流业、建筑业、医疗护理、农业和国防工业中的劳动力成本、产能瓶颈、设备利用率和供应链效率。它争夺的不是一个新的SaaS品类,而是真实经济中最核心的成本项。
Figure AI推出的人形机器人与人类比拼选拣快递包裹的公开竞赛,提供了一个直观案例。这场演示展示了人形机器人处理重复性物流任务的可能性,以及Physical AI可能的落地路径:先从重复、高频、半结构化、劳动强度高的场景切入,再逐渐进入更复杂的工业流程。
相比家庭机器人,仓库和工厂更容易部署,因为场景更可控,任务更明确,投资回报也更容易计算。Figure在BMW工厂的部署的Figure 02机器人,曾在BMW Spartanburg工厂参与汽车装配相关工作,并帮助完成约3万辆汽车的生产任务。最新一代Figure 03则进入BMW工厂的装配和物流大厅,执行更复杂的sequencing任务,包括拉动重型小车、重新定位身体并搬运零部件。
这也是为什么人形机器人虽然成本高、难度大,却仍然吸引资本。传统工业自动化擅长处理高度标准化的任务,例如固定工位上的焊接、搬运和装配。但在真实工厂和仓库中,仍有大量工作处在标准化与非标准化之间,也就是任务本身重复发生,但物体尺寸、位置、姿态、顺序和环境状态会不断变化。
包裹大小不同,零件位置会偏移,料车需要临时调整,生产线也会根据订单变化重新排布。而当前不少Physical AI企业试图切入的,正是这类半结构化、高频、具备商业价值的非完全标准化的场景。
从这个角度看,Physical AI某种意义上是让AI进入劳动力市场。它最终改变的可能不是某个单一岗位,而是一种劳动组织方式。过去,企业通过招聘、排班、培训和管理来调度人类劳动。而在未来,一部分劳动可能通过模型、机器人和远程监控系统来调度。老龄化、劳动力短缺、制造业回流、供应链安全和国家工业能力,也都因此被纳入同一条技术主线。
Physical AI的核心竞争:“现实世界数据”
表面上看,Physical AI赛道比拼的是机器人硬件。谁肢体动作更稳,谁的手更灵巧,谁的续航更长,似乎就更有优势。但在硬件之外,更关键的竞争正在转向现实世界数据。
上一轮AI竞争建立在互联网数据之上。文本、图片、视频、代码和网页内容已经被大规模用于训练模型,支撑了大语言模型在写作、翻译、总结和生成任务中的泛化能力。但Physical AI面对的是一个全新的数据环境,机器人需要学习的是如何在现实空间中移动、抓取、搬运、装配,并根据环境变化调整动作。
下一代稀缺资产,很可能是现实世界中的动作数据。比如人类如何完成物理任务的数据:手怎样抓取,身体如何平衡,力度如何调整,失败后如何纠错,什么时候改变策略。这些数据不像网页一样可以直接爬取。它们需要真实场景、机器人硬件、传感器、动作捕捉和长期部署。
这也是很多机器人公司正在把数据采集建成核心能力的原因。Apptronik近日宣布推出新的机器人训练设施Robot Park,并发布Apollo 2人形机器人。该训练中心与Google DeepMind合作,目标是收集大规模真实世界数据,推动机器人从试点走向规模化部署。
近期获Tether、Nvidia、Amazon 等公司共计14亿美元投资的德国机器人公司NEURA Robotics,其布局同样直接指向这一问题。
NEURA推出的NEURA Gym,定位为Physical AI训练设施,其核心是在真实或接近真实的物理环境中,让机器人反复练习抓取、分拣、装配等任务,生成视觉、触觉、力反馈和空间感知数据。与之配套的Neuraverse则承担平台作用,将机器人、开发者、数字孪生和训练数据连接起来,使一个场景中训练出的能力可以在更多机器人和应用中复用。NEURA与慕尼黑工业大学还宣布在慕尼黑机场建设TUM RoboGym,称其为欧洲最大的Physical AI科研与训练中心。
基于这一趋势,围绕机器人数据的创业方向也开始出现。例如Roborecs将自己定位为“Physical AI背后的数据设施”,通过招募和训练操作员,让人类远程操控机器人完成双手装配等接触密集型任务,并采集视觉、力和触觉数据,再授权给机器人制造商使用。
可见,Physical AI生态正在分工,有的公司造机器人身体,有的公司做机器人“大脑”,有的公司做仿真平台,还有公司专门采集训练机器人所需的数据。
学术界也在围绕这一问题快速推进。近期关于人形机器人遥操作和动作迁移的论文大量出现,例如基于IMU动作捕捉服将人类动作实时映射到Unitree G1机器人,或通过VR设备构建便携式人形机器人数据采集系统。这些研究共同指向如何将人类身体经验转化为机器人可以学习和复用数据的问题上。
不过,虽然资本和想象力已足够丰富,但对于仍处于早期的Physical AI而言,今天的人形机器人距离通用部署还有很长距离,很多演示仍依赖受控环境、远程操作和精心设计的任务。
但它至少说明,人工智能的发展正在迈入一个新的阶段。这个过程不会一蹴而就,甚至未必会以今天最流行的人形机器人形态完成,但AI从屏幕走向现实世界,已经成为下一轮技术竞争中越来越清晰的方向。


