銀河通用王鶴:讓具身智能機(jī)器人“言出法隨”,需攻克兩大局限性丨GenAICon 2024
AIGC動態(tài)歡迎閱讀
原標(biāo)題:銀河通用王鶴:讓具身智能機(jī)器人“言出法隨”,需攻克兩大局限性丨GenAICon 2024
關(guān)鍵字:模型,機(jī)器人,物體,數(shù)據(jù),解讀
文章來源:智東西
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
沒有做好小模型的公司、沒有能讓動作小模型泛化的公司不可能讓大模型泛化。
2024中國生成式AI大會于4月18-19日在北京舉行,在大會第一天的主會場開幕式上,北京大學(xué)助理教授、銀河通用機(jī)器人創(chuàng)始人&CTO、智源具身智能中心主任王鶴以《通向開放指令操作的具身多模態(tài)大模型系統(tǒng)》為題發(fā)表演講。
成立于2023年5月的銀河通用機(jī)器人,是國內(nèi)具身智能代表初創(chuàng)公司之一,迄今已完成4輪融資,美團(tuán)是公司外第一大外部股東,北大燕緣創(chuàng)投、清華無限基金SEE Fund均是投資方,其累計(jì)融資額已超過1億美元。
作為國內(nèi)具身智能領(lǐng)域資深專家,王鶴詳細(xì)解讀了具身智能大模型的定義、范圍和關(guān)鍵技術(shù)。他談到目前面向通用機(jī)器人的具身多模態(tài)大模型的局限在于數(shù)據(jù)來源有限、很難高頻輸出動作。應(yīng)對這兩大挑戰(zhàn)的方向,一是通過仿真世界提供訓(xùn)練數(shù)據(jù),二是采用三維模態(tài)模型提升泛化性和速度。
對此,銀河通用機(jī)器人構(gòu)建了三層級大模型系統(tǒng),包括硬件、仿真合成數(shù)據(jù)訓(xùn)練的泛化技能、大模型等。基于該系統(tǒng),機(jī)器人可實(shí)現(xiàn)跨場景、跨物體材質(zhì)、跨形態(tài)、跨物體擺放、依據(jù)人類語音指令進(jìn)行的開放語義泛化抓取,成功率達(dá)95%。
以下為王鶴的演講實(shí)錄:
今天我?guī)淼?/p>
原文鏈接:銀河通用王鶴:讓具身智能機(jī)器人“言出法隨”,需攻克兩大局限性丨GenAICon 2024
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。