33億參數的VLA模型在大多數任務上可達 50%-100% 成功率。

原標題:Sergey Levine :機器人基礎模型將取代其他通用基礎模型丨DAI 2024
文章來源:AI科技評論
內容字數:25392字
具身智能大模型:通用性優勢與未來發展
本文總結了UC Berkeley Sergey Levine教授在第六屆國際分布式人工智能會議(DAI 2024)上關于通用機器人基礎模型的演講要點,探討了具身智能大模型的通用性優勢及其未來發展方向。
1. 通用機器人基礎模型的性
Levine教授指出,過去人工智能領域采用的是針對特定任務訓練專用模型的方法。而如今,通用模型的興起,特別是大型語言模型(LLM)的成功,啟示了在機器人領域采用類似的通用性思路。通過收集大量不同機器人執行各種任務的數據,訓練一個通用機器人基礎模型,可以顯著提高模型的泛化能力和效率。這將克服目前機器人領域數據不足的難題,并隨著機器人實際部署而不斷提升模型性能。
2. 基于擴散的π0通用機器人模型
Levine教授介紹了其團隊開發的π0模型,這是一個集成視覺-語言-動作(VLA)的33億參數通用機器人基礎模型。該模型通過預訓練(10,000小時數據,7種機器人,68種任務)和任務微調兩個階段進行訓練,在大多數任務上實現了50%-100%的成功率。π0模型采用了一種更適應機器人控制的架構,結合了擴散模型來輸出高頻連續動作,并能處理不同形態的機器人。在復雜任務(如疊衣服、組裝盒子)中,高質量的后期訓練數據至關重要,可以進一步提升模型性能。
3. 推理與強化學習的結合
演講中還介紹了通過多步推理提升VLA模型泛化能力的研究。通過引入中間推理步驟,模型能夠更好地理解任務要求,提高成功率。實驗結果顯示,在具有挑戰性的泛化任務中,這種方法使OpenVLA的絕對成功率提高了28%。此外,利用強化學習(RL)進行微調,可以獲得更魯棒、更快速的任務執行策略。RLDG方法通過使用強化學習生成的高質量訓練數據來微調機器人通用基礎模型,相比傳統的人類示范數據訓練方法可以獲得更好的性能和泛化能力。
4. 自主學習與未來展望
最后,Levine教授介紹了SOAR項目,該項目旨在通過自主學習,在沒有人類監督的情況下提升機器人基礎模型。通過視覺語言模型生成任務,并利用生成的圖像數據進行模型微調,實現了顯著的性能提升。這表明,未來機器人基礎模型可以依靠自主學習不斷提升自身能力,無需持續的人類干預。
總而言之,Levine教授的演講展示了通用機器人基礎模型的巨大潛力,以及通過結合推理、強化學習和自主學習等技術進一步提升模型性能的途徑。這為具身智能的發展指明了方向,預示著未來機器人將擁有更強的泛化能力和更廣泛的應用。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。

粵公網安備 44011502001135號