機(jī)器人世界模型,TeleAI用少量數(shù)據(jù)完成訓(xùn)練 | NeurIPS 2024
AIGC動態(tài)歡迎閱讀
原標(biāo)題:機(jī)器人世界模型,TeleAI用少量數(shù)據(jù)完成訓(xùn)練 | NeurIPS 2024
關(guān)鍵字:機(jī)器人,視頻,模型,操作,人類
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
TeleAI 投稿量子位 | 公眾號 QbitAI引言:TeleAI 李學(xué)龍團(tuán)隊提出具身世界模型,挖掘大量人類操作視頻和少量機(jī)器人數(shù)據(jù)的共同決策模式。
當(dāng)你在綠茵場上進(jìn)行一場緊張的足球比賽時,大腦會像一位精明的導(dǎo)演,不斷地在腦海中預(yù)演著比賽的下一步發(fā)展。你會想象如何帶球突破對方防線、如何與隊友配合制造進(jìn)球機(jī)會等。
這種內(nèi)心的想象是基于豐富的比賽經(jīng)驗、對足球規(guī)則的深刻理解以及對隊友特點的熟悉。
大腦能夠迅速從記憶中提取信息,結(jié)合當(dāng)前的比賽狀況,預(yù)測未來可能出現(xiàn)的場景,并以近乎動畫的形式在腦海中迅速閃現(xiàn),幫助人類做出更好的決策。
正如足球比賽中展現(xiàn)的一樣,大腦的預(yù)演能力實際上是一個精簡版的“世界模型”,通過模擬未來可能發(fā)生的情景來指導(dǎo)人類行為。
受此啟發(fā),具身智能研究中有望通過構(gòu)建類似的“視頻預(yù)測模型”作為機(jī)器人“世界模型”,通過歷史序列和實時觀測,預(yù)測未來可能發(fā)生的,形成對機(jī)器人未來行為的視頻預(yù)測。
世界模型給機(jī)器人提供了一個“內(nèi)心預(yù)演”的工具,能夠在實際采取行動之前評估可能的行動方案及后果,幫助機(jī)器人進(jìn)行決策。
近期,中國電信集團(tuán)CTO、首席科學(xué)家、中國電信人工智能研究院(Te
原文鏈接:機(jī)器人世界模型,TeleAI用少量數(shù)據(jù)完成訓(xùn)練 | NeurIPS 2024
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: