近日,阿里巴巴集團旗下高德正式釋出具身操作基座模型ABot-M0與具身導航基座模型ABot-N0,補齊了具身機器人規模化落地的兩塊核心能力——操作的通用性和導航的長程性,並重新整理了全球多項權威評測紀錄,高德也成為全球首個在具身導航與具身操作上同步達到SOTA(目前最好、最先進的模型)的廠商。
ABot-M0:全球首個統一架構的機器人基礎模型,讓機器人擁有"通用大腦"
長期以來,機器人技術的規模化應用面臨諸多挑戰,其中關鍵之一在於資料的割裂、動作表示的不統一以及空間理解能力的不足。不同廠商、不同形態的機器人往往使用各自獨立的資料體系,導致模型難以跨平臺複用,訓練效率受限,部署成本高。
高德推出的 ABot-M0 作為一款通用的具身操作基礎模型,從「資料統一—演算法革新—空間感知」三個方面進行了系統性重構,致力於提升模型在多樣化機器人形態和任務場景下的泛化能力。
ABot-M0模型架構圖
ABot-M0 基於全球開源資源,整合超過 600 萬條真實操作軌跡,構建了目前規模最大的通用機器人資料集。通過統一動作表示、座標系與控制頻率,並採用增量式動作建模,實現了跨平臺資料融合,支撐了完全基於公開資料的預訓練。
演算法革新上,ABot-M0 提出了全球首個動作流形學習:有效的機器人動作受限於物理規律、任務目標與環境約束,集中分佈在低維結構化的流形上。設計了 AML(Action Manifold Learning)演算法,使模型能夠直接預測結構合理、物理可行的動作序列,提升策略的穩定性與解碼效率。
為增強空間感知,ABot-M0 引入 3D 感知模組,增強模型對「前後、遠近、遮擋」等空間語義的理解,在複雜環境中實現更精準的操作決策。
在 Libero、Libero-Plus、RoboCasa 基準測試中,該模型在包含複雜任務組合與動態場景擾動的設定下,平均任務成功率均達到 SOTA。其中,Libero-Plus 基準上達到了 80.5%,較業界先進方案pi0提升近30%,展現了其在高擾動高難度具身操作任務中的領先效能。
ABot-M0在Libero-Plus的評測
通過系統的工程設計與演算法改進,ABot-M0 探索了一條通向通用具身智慧的技術路徑,也為未來開放、共享的機器人生態提供了可復現、可擴充套件的基礎支援。
ABot-N0:全球首個五大導航任務統一的全棧導航基座模型
導航是機器人進入物理開放世界的核心基礎能力,機器人需要在動態且存在干擾的環境裡展現出通用的行動能力,如跨場景送物或跟隨服務,這同時也是具身智慧演進的終極命題。
然而,當前的具身導航研究普遍深陷「碎片化」:主流方法往往針對特定任務構建孤立的專用架構,這不僅限制了模型的跨任務泛化能力,更阻礙了智慧體從海量異構資料中提取統一物理先驗的可能性。
這也是當前機器人常陷於「環境看不懂、動作做不準」的核心原因,複雜指令(如「去門口幫我看看快遞」)更是難以執行。
高德推出的具身導航基座模型ABot-N0,以「全任務一統」為核心目標,並實現全球首次在單一模型中完整整合Point-Goal(點位導航)、Object-Goal(目標導航)、Instruction-Following(指令跟隨)、POI-Goal(興趣點導航)與Person-Following(人物跟隨)五大導航任務,有效突破了傳統架構中任務割裂的瓶頸。
比如,當用戶對搭載ABot-N0的具身機器人說:「帶我去奶茶店買一杯奶茶,再幫我佔個座。」時系統會自動分解為具體的導航任務:首先執行Point-Goal,根據地圖記憶接近奶茶店區域;之後切換至POI-Goal,精準鎖定店鋪入口並靠近;隨後觸發Instruction-Following,進入店鋪並導航至櫃檯;最後執行Object-Goal,在店內尋找空沙發並停靠。
相較於只能支援部分任務的具身導航模型,高德ABot-N0所實現的五大導航任務給長程複雜任務的執行提供了可行的解決方案。這一能力背後,是高德在架構設計、資料引擎和系統框架上的關鍵革新。
ABot-N0的資料、效能、任務概覽
在模型架構上,ABot-N0採用層次化的「大腦‑動作」設計哲學:由「認知大腦」理解指令並做推理,由基於流匹配(Flow Matching)的「動作專家」生成精確且多峰分佈的連續軌跡 。訓練上,先讓模型做認知訓練熱身,再用部分認知資料和海量導航動作進行聯合監督微調,最後用強化學習把導航決策對齊到人類偏好的行為價值,最終打造出真實環境中更通用的VLA基座模型。
在資料側,依託高德長期沉澱的場景資產和專家示例,高德構建了業內最大規模的具身導航資料引擎,涵蓋約 8000 個高保真 3D 場景等海量時空資料與近1700萬條專家示例,從而增強模型在真實環境中的泛化能力與魯棒性。
基於ABot-N0的系統性創新,其在CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大權威基準測試中全面重新整理了世界紀錄。其中在SocNav閉環模擬中,成功率(SR)飆升40.5%,在HM3D-OVON評測中成功率(SR)提升8.8%,均顯著強於之前的SOTA模型。
Point-Goal任務:在CityWalker及SocNav上分別進行開環和閉環評測
此外,爲了解決機器人在執行長程複雜任務時的任務拆解與容錯問題,高德提出了可落地的Agentic Navigation System具身導航系統框架,行成從「讀懂指令」到「長程複雜任務執行」的閉環能力架構,支援機器人在執行過程中持續感知、記憶、決策與糾錯。系統已成功部署於真實四足機器人平臺,並在邊緣側實現了高效推理與閉環控制,驗證了其在動態現實環境中的泛化效能與工業級穩定性。