国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

把RLHF帶給VLA模型!通過偏好對齊來優化機器人策略,代碼已開源

AIGC動態9個月前發布 機器之心
508 0 0

本文將介紹如何通過偏好對齊來泛化機器人策略。

把RLHF帶給VLA模型!通過偏好對齊來優化機器人策略,代碼已開源

原標題:把RLHF帶給VLA模型!通過偏好對齊來優化機器人策略,代碼已開源
文章來源:機器之心
內容字數:4186字

GRAPE: 提升機器人策略泛化能力的偏好對齊框架

本文介紹了機器之心AIxiv專欄報道的最新研究成果——GRAPE (Generalizing Robot Policy via Preference Alignment) 框架。該研究由北卡羅來納大學教堂山分校張子健等學者完成,旨在解決視覺-語言-動作(VLA)模型在機器人任務中泛化能力不足的問題。

1. 研究背景與問題

現有的VLA模型通常依賴于對成功執行軌跡的行為克隆,導致其在面對新任務時泛化能力較差。此外,微調方法帶來的分布偏差也限制了模型對多樣化操作目標(例如效率、安全性)的適應能力。

2. GRAPE框架及其優勢

GRAPE是一個即插即用的算法,通過偏好對齊來提升VLA模型的泛化能力,并支持將模型對齊到任意設定的目標。它具有以下三大優勢:

  1. 軌跡級強化學習對齊:GRAPE在軌跡層面利用強化學習目標對VLA模型進行對齊,賦予模型全局決策能力,而非簡單的行為克隆。
  2. 隱式獎勵建模:GRAPE隱式建模了成功和失敗嘗試中的獎勵,提升了對多樣化任務的泛化能力。
  3. 可擴展的偏好合成算法:GRAPE采用可擴展的偏好合成算法,通過對軌跡進行排序,將VLA模型對齊到指定目標。

GRAPE框架包含三個主要部分:軌跡級偏好優化(Trajectory-wise Preference Optimization,TPO)、定制化偏好合成(Customized Preference Synthesis)和迭代式在線對齊(Iterative Online Alignment)。TPO通過改進的DPO損失函數(TPO_Loss)進行軌跡級別偏好學習;定制化偏好合成則利用大型視覺-語言模型分解復雜任務,自動引導偏好建模過程;迭代式在線對齊則通過循環迭代不斷優化對齊過程。

3. 實驗結果與分析

研究人員在真機和仿真環境下對GRAPE進行了評估。真機實驗涵蓋了五種分布外泛化(OOD)任務,結果顯示GRAPE相較于OpenVLA-SFT模型取得了顯著提升(20.7%~26.7%)。仿真實驗也驗證了GRAPE在面對不同OOD任務時的優越性能(8.0%~19.0%)。

此外,實驗還表明GRAPE能夠有效地將機器人策略與多種目標(如安全性、效率)對齊,例如,在追求安全性的目標下,碰撞率降低了44.31%;在追求效率的目標下,執行軌跡長度縮短了11.15%。

4. 結論

GRAPE框架是一種即插即用的VLA模型對齊方法,能夠顯著提升機器人策略的泛化能力,并支持對齊到任意指定目標,在多種機器人任務場景下均有應用潛力。


聯系作者

文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        日韩欧美一区二区三区在线| 成人黄色免费短视频| 久久精品国产免费看久久精品| 激情小说欧美图片| 国产精品一二三在| 欧美日韩国产123区| 精品久久久久久久久久久久包黑料 | 日日夜夜免费精品| 日韩成人午夜精品| 三级久久三级久久久| 国产精品综合在线视频| 91精品国产乱码久久蜜臀| 亚洲在线成人精品| 91婷婷韩国欧美一区二区| 国产欧美在线观看一区| 三级欧美在线一区| 欧美一区二区三区视频免费 | 国产伦精品一区二区三区视频青涩 | 韩国女主播成人在线| 精品久久人人做人人爽| 国产在线麻豆精品观看| 欧美高清视频在线高清观看mv色露露十八 | 韩国精品久久久| 久久人人超碰精品| 成人午夜电影网站| 亚洲女厕所小便bbb| 欧美老肥妇做.爰bbww视频| 香蕉影视欧美成人| 精品国产91乱码一区二区三区| 成人av影院在线| 日本不卡1234视频| 国产精品成人午夜| 日韩午夜电影在线观看| 国产91精品入口| 天堂一区二区在线| 国产精品色哟哟| 久久久亚洲精品一区二区三区| 成人精品视频一区二区三区尤物| 中文字幕在线不卡视频| 精品久久人人做人人爰| 宅男噜噜噜66一区二区66| 在线亚洲一区二区| 成人自拍视频在线| 国产成人精品1024| 国产在线精品一区二区不卡了| 亚洲国产精品成人综合色在线婷婷| 波多野结衣中文字幕一区| 亚洲h在线观看| 午夜精品久久久久久不卡8050| 亚洲人精品午夜| 国产精品国产三级国产普通话三级 | 日韩精品一区二区三区中文不卡| 欧美午夜一区二区三区| 91视频在线观看| av在线一区二区三区| av不卡在线观看| 一本色道久久综合亚洲精品按摩| 91女厕偷拍女厕偷拍高清| 99精品欧美一区| 欧美视频精品在线观看| 日韩免费在线观看| 国产色爱av资源综合区| 亚洲视频一区二区在线| 喷水一区二区三区| 成人妖精视频yjsp地址| 日本韩国一区二区| 欧美电视剧在线看免费| 国产精品视频免费看| 性久久久久久久| 丁香亚洲综合激情啪啪综合| 91精品91久久久中77777| 7799精品视频| 亚洲私人影院在线观看| 国产精品66部| 精品成人一区二区三区| 日韩免费电影网站| 一区二区三区中文字幕电影| 国产一区二区三区四| 欧美一区二区三区在线看| 一区二区三区四区不卡在线| 九九**精品视频免费播放| 欧美高清www午色夜在线视频| 亚洲欧洲日韩在线| 粉嫩13p一区二区三区| 欧美sm极限捆绑bd| 午夜精品视频一区| 欧美三级资源在线| 亚洲一区二区视频| 91看片淫黄大片一级| 亚洲一二三级电影| 欧美亚男人的天堂| 日韩精品91亚洲二区在线观看| 91麻豆123| 亚洲国产cao| 26uuu精品一区二区在线观看| 久久精品国产在热久久| 91麻豆自制传媒国产之光| 99精品久久只有精品| 亚洲精品老司机| 欧美日韩一区二区不卡| 亚洲成人免费在线观看| 欧美日韩高清一区二区不卡| 全国精品久久少妇| 国产精品视频在线看| 欧美日韩激情一区二区三区| 亚洲一区二区在线播放相泽| 国产丝袜在线精品| 欧美一级精品在线| 91免费国产视频网站| 毛片不卡一区二区| 国产日韩精品视频一区| 蜜桃在线一区二区三区| 国产福利一区二区| 91网站黄www| 亚洲h在线观看| 欧美一区二区三区视频免费| 国产精品高清亚洲| 美女www一区二区| 国产成人av自拍| 欧美性大战久久久久久久蜜臀| 国产精品午夜免费| 国产精品久久久久婷婷二区次| 中文字幕免费不卡| 亚洲精品国产品国语在线app| 国产一区亚洲一区| 色婷婷精品久久二区二区蜜臀av | 国产真实乱子伦精品视频| 国产女同互慰高潮91漫画| 欧美精品第一页| 欧美日韩国产欧美日美国产精品| 91免费小视频| 国产成人午夜高潮毛片| 成人一级片网址| 91一区二区在线观看| 欧美专区在线观看一区| av网站免费线看精品| 91激情五月电影| 欧美精品日韩一本| 久久久影院官网| 综合色天天鬼久久鬼色| 亚洲精品v日韩精品| 日韩精品免费专区| 成人午夜视频在线观看| 欧美在线看片a免费观看| 日韩限制级电影在线观看| 国产视频一区在线观看 | 91.com视频| 国产欧美日韩综合精品一区二区 | 欧美日韩国产一二三| 亚洲欧洲av一区二区三区久久| 日韩av午夜在线观看| 91一区二区三区在线播放| 精品女同一区二区| 亚洲mv在线观看| 岛国精品在线观看| 日韩小视频在线观看专区| 日韩精品久久理论片| 欧美色图12p| 亚洲午夜激情av| 成人激情小说乱人伦| 久久久一区二区三区捆绑**| 免费观看91视频大全| 欧美一区日韩一区| 午夜国产精品影院在线观看| av一区二区久久| 国产精品一区二区在线看| 91亚洲精品久久久蜜桃网站| 国产视频一区在线观看 | 欧美视频自拍偷拍| 亚洲欧美二区三区| 毛片av一区二区| 日本一区二区视频在线| 免费在线欧美视频| 欧美高清一级片在线| 国产一区不卡视频| 国产欧美综合色| 99久久免费国产| 国产精品另类一区| 国产成人综合在线播放| 精品91自产拍在线观看一区| 国内成人免费视频| 精品国产乱码久久久久久牛牛 | 日本亚洲视频在线| 欧美挠脚心视频网站| 另类的小说在线视频另类成人小视频在线 | 青青草视频一区| 波多野洁衣一区| 国内精品国产三级国产a久久 | 亚洲精品国产视频| 欧美日韩国产一级片| 国产精品一区一区| 激情亚洲综合在线| 依依成人综合视频| 久久久亚洲高清| 精品免费日韩av| 欧美视频中文字幕| 国产成人精品综合在线观看| 激情小说亚洲一区| 亚洲一区二区三区四区在线| 亚洲精品一区在线观看|