從扭秧歌到單腳跳,HugWBC讓人形機(jī)器人天賦覺醒了
通用人形機(jī)器人控制器HugWBC。

原標(biāo)題:從扭秧歌到單腳跳,HugWBC讓人形機(jī)器人天賦覺醒了
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):5081字
上海交大與上海AI Lab研發(fā)出通用人形機(jī)器人控制器HugWBC
本文介紹了上海交通大學(xué)和上海人工智能實(shí)驗(yàn)室聯(lián)合研發(fā)的通用人形機(jī)器人控制器HugWBC,該控制器賦予人形機(jī)器人多種步態(tài)及精細(xì)化控制能力,使其能夠完成跑跳、拳擊、搬箱等復(fù)雜動(dòng)作。
HugWBC的核心功能與創(chuàng)新
不同于以往僅跟蹤速度指令或關(guān)鍵點(diǎn)的控制器,HugWBC 創(chuàng)新性地引入了擴(kuò)展指令空間,包含任務(wù)指令(速度)和行為指令(姿態(tài)、腳步、步態(tài))。這種設(shè)計(jì)允許對(duì)機(jī)器人進(jìn)行細(xì)粒度控制,充分發(fā)揮其硬件潛能。HugWBC默認(rèn)控制全身,同時(shí)支持上肢外部控制器介入,以實(shí)現(xiàn)遙操作和精細(xì)控制,并支持后續(xù)的移動(dòng)操作任務(wù)。
技術(shù)方案與設(shè)計(jì)
HugWBC結(jié)合了控制理論和強(qiáng)化學(xué)習(xí)。其擴(kuò)展指令空間包含:1)任務(wù)指令(速度);2)行為指令(步頻、最大擺動(dòng)高度、機(jī)器人高度、前傾角、腰部轉(zhuǎn)動(dòng)角、雙腳相位變量、相位差、占空比)。通過組合這些指令,可以產(chǎn)生豐富多樣的步態(tài)。為了引導(dǎo)機(jī)器人學(xué)習(xí)細(xì)粒度步態(tài),研究者提出了接觸-擺動(dòng)獎(jiǎng)勵(lì)和足端擺動(dòng)獎(jiǎng)勵(lì),并引入鏡像函數(shù)和損失函數(shù)來鼓勵(lì)對(duì)稱自然的。
魯棒性課程訓(xùn)練與上身介入
HugWBC旨在成為基礎(chǔ)人形控制器,因此需要支持上半身外部控制介入。研究者通過設(shè)計(jì)上肢噪聲課程,使機(jī)器人學(xué)習(xí)應(yīng)對(duì)上肢介入,提高魯棒性。整個(gè)訓(xùn)練框架使用非對(duì)稱強(qiáng)化學(xué)習(xí)算法在模擬環(huán)境中進(jìn)行訓(xùn)練,最終實(shí)現(xiàn)真實(shí)場(chǎng)景部署。
實(shí)驗(yàn)結(jié)果與評(píng)估
實(shí)驗(yàn)結(jié)果表明,HugWBC在四種步態(tài)(行走、站立、雙腳跳躍、單腳跳躍)下的指令跟蹤誤差較小,且在不同介入訓(xùn)練方法中表現(xiàn)最佳。在站立狀態(tài)下,HugWBC的足端移動(dòng)距離最小,表明其能夠支持精細(xì)的操作任務(wù)。干擾測(cè)試也顯示,HugWBC的魯棒性顯著優(yōu)于基線方法。指令組合分析的熱力圖矩陣顯示了不同指令間的相互影響,揭示了控制器在不同速度和指令組合下的性能。
總結(jié)
HugWBC控制器在人形機(jī)器人控制方面取得了顯著進(jìn)展,實(shí)現(xiàn)了多種步態(tài)的靈活切換和精細(xì)化控制,為人形機(jī)器人的應(yīng)用提供了堅(jiān)實(shí)的基礎(chǔ)。其擴(kuò)展指令空間、強(qiáng)化學(xué)習(xí)訓(xùn)練方法以及魯棒性設(shè)計(jì),為未來人形機(jī)器人研究提供了重要的參考價(jià)值。
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

粵公網(wǎng)安備 44011502001135號(hào)