Figure 首個 VLA 模型,有效實現人形機器人上半身高效控制。
原標題:與 Open AI 分手后,Figure 推出具身模型 Helix,多個機器人一同做家務
文章來源:AI科技評論
內容字數:5235字
Figure發布首個自研具身模型Helix,實現人形機器人上半身高效控制
本文總結了Figure公司發布的其首個自研具身模型Helix的要點。Helix是一個通用的“視覺-語言-感知”(VLA)模型,實現了人形機器人上半身的高效控制,并展現出多機器人協作能力和強大的泛化能力。
Helix模型的核心功能與優勢
Helix模型的核心在于其對人形機器人上半身(包括手腕、軀干、頭部和各個手指)的200Hz高速率連續控制。它實現了以下幾個方面的突破:
- 整個上身控制:首次實現對人形機器人上半身進行高速率連續控制的VLA模型。
- 多機器人協作:首個同時在兩個機器人上運行的VLA模型,能夠進行多機器人協作完成任務。
- 強大的泛化能力:只需簡單的自然語言指令,即可拾取各種小型家居用品,包括數千種從未見過的物品。
- 單一神經網絡:使用一組神經網絡權重學習所有行為,無需針對特定任務進行微調。
- 商業化準備:可在嵌入式低功耗GPU上運行,可立即進行商業部署。
Helix在控制機器人上半身時,能夠協調35個度,并巧妙地處理頭部和軀干帶來的挑戰,保證機器人動作的流暢性和穩定性。
“系統1、系統2”架構
Helix采用了一種創新的“系統1、系統2”VLA模型架構,結合了通用性和速度兩個關鍵因素:
- 系統2 (S2):一個基于互聯網預訓練的VLM,負責場景理解和語言理解,運行頻率為7-9 Hz。
- 系統1 (S1):一個快速反應的視覺策略,將S2的輸出轉化為200 Hz的精確連續機器人動作。
這種分層架構允許兩個系統分別在其最佳時間尺度上運行,S2進行“慢思考”,S2進行“快思考”,實現了高效的控制。
數據效率和未來潛力
Helix僅使用了約500小時的高質量監督數據進行訓練,遠小于之前的VLA數據集,展現了其極高的數據效率。其強大的泛化能力、高速率、高維度的輸出以及簡單的架構,為人形機器人在非結構化環境中的應用開辟了新的可能性。Figure表示,Helix可以擴展到更具挑戰性的動作空間,實現更復雜的任務。
總而言之,Figure的Helix模型在人形機器人控制領域取得了顯著進展,其高效的控制能力、強大的泛化能力和多機器人協作能力,預示著人形機器人技術邁向更實用、更智能的未來。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...