作者:Mike Kalil
編譯:Felix, PANews
在中國,一批由 AI 驅動的人形機器人正在一條平板電腦組裝線上自主工作,這場直播被稱為業內首創。
在這場具有歷史意義的多日直播中,這些人形機器人與人類同事並肩進行品質檢測工作。它們由一家成立僅三年的初創公司開發,該公司的崛起正給全球頂尖的機器人企業帶來巨大的競爭壓力。
隨著投資者投入數十億美元重新定義未來的工作模式,這或許預示著未來工廠的發展方向。在 AI 物理領域的淘金熱潮中,機器人公司正採取大膽舉措,以證明他們的機器已經準備好投入實際工作。
企業開始讓機器人負責那些長期以來被認為太難、太精細且充滿變數而無法自動化的任務。在日益複雜的工作流程中,不同形態的機器人正變得越來越擅長協同合作。隨著其更加智能,它們正以一種愈發像人的方式進行學習,但其規模是任何個人或勞動力都無法比擬的。
智元機器人的六日直播秀
在上海,新興機器人初創公司智元機器人(AgiBot)啟動了一場堪稱業內首創的直播,展示了一系列自主人形機器人在真實的平板電腦生產線上運行。
這家機器人公司由前華為「天才少年」彭志輝於 2023 年 2 月創立,該公司表示,計劃在 2026 年上半年生產超過 1 萬台機器人。據報導,智元機器人正積極拓展其全球業務,並計劃與深圳的眾擎機器人(EngineAI)和普渡機器人(Pudu Robotics)以及北京的銀河通用(Galbot)等競爭對手一起在香港上市。
智元機器人的崛起對總部位於杭州的宇樹科技(Unitree Robotics)以及 Figure AI 等西方公司構成了挑戰。宇樹科技曾於 2025 年在人形機器人和四足機器人領域處於全球領先地位。
來源:智元機器人
在矽谷公司 Figure 多日直播而爆紅的幾週後,智元機器人也開始了為期 6 天的直播。Figure 的直播展示了其一小批雙足人形機器人 Figure 03 在模擬物流場景中輪流分揀包裹。它們在受控環境中連續 8 天 24 小時不間斷工作。當其中一台機器人工作約 4 小時後電量不足時,它會自動走到充電站充電,另一台機器人則接替其工作。
相比之下,智元機器人的直播展示了一支規模更大的輪式雙臂移動操作機器人。它們在南昌龍旗科技的平板電腦製造工廠裡與人類協同工作。它們按照標準工廠班次從早上 8:00 工作到下午 6:00(含午休),主要進行品質檢測。
平板電腦裝配線上的機器人是智元機器人的 G2 型號,專為工業應用而設計。G2 身高 1.7 米,重量可達 100 公斤。據報導,G2 全身擁有 26 個自由度,並可集成可選的靈巧機械手。
在發佈會直播中,AgiBot G2 準備用弓箭射中一個粉色氣球(來源:智元機器人)
這款人形機器人搭載了智元機器人自主研發的 AI 系統,該系統將運動、交互和操作智能整合到一個統一的架構中。據稱,G2 可以通過現實世界的強化學習以及來自其世界模型 Agibot World 的大規模數據集不斷提升性能。
這款機器人被設計為全天候運行,其輪式底座內置可熱插拔電池。每次充電可支持 4 至 8 小時的持續運行,具體時長取決於有效載荷和運動強度。電池可在幾分鐘內完成更換,無需關閉機器人。但目前它還無法像優必選 (UBTECH) 的 Walker S2、海克斯康 (Hexagon) 的 AEON 和波士頓動力 (Boston Dynamics) 的 Atlas 那樣自主完成更換。
在龍旗裝配線上工作的機器人使用專用機械臂抓取平板電腦,利用感測器進行檢測,然後將其放入托盤中。這家廠商為小米、三星和聯想等科技巨頭生產電子產品。
智元機器人 G2 人形機器人抓手(來源:智元機器人)
據報導,智元機器人的 G2 起售價約為 13.8 萬美元,這實際上是目前工廠部署中較為實惠的選擇之一。
這家初創公司最受關注的其實是靈犀 X2(Lingxi X2)機器人,起售價約為 1.3 萬美元(高端型號接近 5 萬美元)。X2 身高 1.3 米,重 34 公斤,專為輕度操作和娛樂應用設計。然而,智元機器人最近分享了一段高端型號在受控環境中移動迷你冰箱的視頻。
智元機器人的 X2(左)和波士頓動力公司的 Atlas 在不同的演示中舉起了迷你冰箱(來源:智元機器人/波士頓動力)
這顯然是在向波士頓動力「隔空喊話」。前一週,這家馬薩諸塞州的機器人企業剛展示了 Atlas 人形機器人完成類似任務的過程。
兩場演示的總體思路相同,但存在一些關鍵差異。在波士頓動力的演示中,Atlas 用其靈巧的機械臂抓取一台迷你冰箱,過程中造成了明顯的損壞;而 AgiBot 的 X2 則利用冰箱上的定製把手,用機械臂將其提起。此外,Atlas 抓取的冰箱看起來也比 AgiBot 實驗室裡的那台更大。
然而,Atlas 的重量也超過了 X2 的兩倍,達到 90 公斤。它的身高也比 X2 高出許多,接近 2 米。兩款機器人均利用其內置 AI,通過大量的模擬訓練和即時感測器反饋來完成任務,但 Atlas 的優勢在於其超乎常人的旋轉關節。
目前,隨著智元機器人計劃在 2026 年實現 2 萬台機器人的產能目標,你更有可能在公共場合看到 AgiBot 的人形機器人。波士頓動力公司也在積極推廣其 Atlas、另一款知名機器人 Spot 以及物流解決方案 Stretch,將其推向勞動力市場。據報導,其母公司現代汽車正尋求完全收購波士頓動力公司,以期實現 3 萬台機器人的產能。
Sanctuary AI 宣稱線束技術取得突破
加拿大初創公司 Sanctuary AI 表示,他們訓練了一套 Universal Robots 雙臂協作機器人系統,成功完成了汽車製造中最難自動化的任務之一。
Sanctuary AI 最為人熟知的產品是通用人形機器人 Phoenix,但現在該公司正將業務拓展至所有工業機器人領域。他們正在開發一種名為 Carbon 的物理 AI 模型,該模型適用於各種外形尺寸的機器人。
Sanctuary AI 表示,其 Carbon AI 模型賦能這套雙臂協作機器人系統,使其能在汽車製造中完成線束和連接器的插入工作(來源:Sanctuary AI)
這家總部位於溫哥華的機器人公司分享了 UR 機器人為一家一級汽車供應商進行線束和連接器插入工作的視頻。對於人類來說,反覆插入連接器輕而易舉,但對於機器人而言卻十分困難,因為它們的靈活性有限。
Sanctuary 公司表示,該系統以超過 99.5% 的成功率和 2.5 秒的時間完成了任務。這意味著它的性能足夠快速可靠,能夠滿足這家未透露名稱的客戶的生產線需求。
靈啟萬物的通用 AI 機器人大腦
另一家致力於研發通用 AI 機器人大腦的初創公司:「靈啟萬物」 (MindOn Tech)近日發佈了一段演示視頻,展示了一組人形機器人和協作機器人完成物流工作流程的過程。
這家總部位於深圳的公司由前騰訊研究人員於 2025 年創立,該公司表示,這些機器人能夠完全自主運行。影片中,一臺 Unitree G1 人形機器人從貨箱中取出物品,並將其放置在傳送帶上,由兩臺雙臂協作機器人進行包裝,以便發貨。包裝完成後,另一臺 Unitree 雙足機器人會取走待發貨的物品。包裝上印有亞馬遜 Prime 的品牌標識,但目前尚無證據表明雙方存在官方合作關係。
靈啟萬物的演示影片顯示,人形機器人和協作機器人利用同一個 AI 大腦協同工作(來源:靈啟萬物)
靈啟萬物表示,其 Mind0 模型基於以人為中心的數據進行訓練。這些數據包括頭部攝影機拍攝的以人為中心的影片、手持抓取設備收集的操作數據,以及動作捕捉服捕捉的全身動作。此外,該模型還結合少量物理機器人測試數據,以縮小模擬行為與真實世界行為之間的差距。
這家新創公司稱,Mind0 是該系統的早期版本。他們計劃進一步提升 AI 機器人大腦的規模、智慧程度和通用性,使機器人團隊能夠在工廠、倉庫乃至最終的家庭中承擔更長時間、更複雜的工作。
EgoEngine 讓影片對機器人更有用
目前,各個實驗室正在研究如何利用網際網路上大量的影片素材。例如,喬治亞理工學院的研究人員剛剛推出了一款名為 EgoEngine 的 AI 系統,該系統能夠透過現有的第一人稱視角影片片段,來訓練機器人操作技能。
EgoEngine GitHub 主頁
其規模可能非常龐大,光 YouTube 每天就有超過 2000 萬部影片上傳。即使只有極小一部分是以自我為中心的影片,也意味著數千萬部影片可用於教機器人學習從烹飪到電子產品組裝等各種技能。
EgoEngine 首先識別並移除每個影片幀中的人類手臂和手部。然後,它在數位孿生模型中重建場景,生成機器人執行相同任務的新影片。人類動作被轉換為機器人運動數據並進行最佳化,以確保機器人能夠安全地執行這些動作。
研究人員使用 Rainbow Robotics 的雙臂機械手臂(配備兩個五指機械手)測試了該系統。他們表示,該系統的效能幾乎與透過遠端操作訓練的機器人一樣出色。
加州大學柏克萊分校與輝達聯合開發的 T-Rex 系統
加州大學柏克萊分校和輝達的研究人員共同開發了一種新的 AI 系統,該系統利用以自我為中心的記錄,使機器人的眼手觸覺協調能力更接近人類水準。
他們將這套名為 T-Rex 的系統安裝在 Dexmate Vega-1 機器人上進行測試,該機器人整合了 Sharpa 的 Wave 機械手。Wave 機械手是目前市場上最先進的末端執行器之一,據稱每個執行器都擁有 22 個自由度。
T-Rex 系統訓練 Sharpa Wave 機械手
據研究人員稱,T-Rex 完成了 12 項需要大量觸覺操作的任務,例如為牙刷擠牙膏和擰燈泡。它依靠 AI 大腦自主工作,該大腦經過超過 2.2 萬小時的第一人稱影片和 100 小時的觸覺數據集的訓練。
該機器人遵循自然語言指令,利用頭部攝影機理解場景,並利用手腕攝影機監控每隻手的動作。同時,其手部的觸覺感測器持續測量不斷變化的力。
T-Rex 追蹤這些訊號的瞬時變化,其所謂的「變形金剛混合架構」猶如一個由多個專業 AI 代理組成的團隊協同工作。其中一個代理負責規劃人形機器人的動作,而另一個代理則利用觸覺進行快速修正。
T-Rex 的平均成功率達到了 65%,比目前最強的系統高出約 30%。然而,該團隊表示,這項技術仍需更先進的感測器和更精準的控制才能實現全面自主運行。
史丹佛大學、松下公司、羅馬大學和 ItalAI 的研究人員也參與了這項研究。


