機(jī)器人端側(cè)模型的十字路口
大模型、機(jī)器人與芯片廠商的拉力賽。

原標(biāo)題:機(jī)器人端側(cè)模型的十字路口
文章來(lái)源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):14620字
大模型、機(jī)器人與芯片廠商的“不可能三角”:誰(shuí)將破局?
近年來(lái),大模型和具身智能機(jī)器人成為科技發(fā)展兩大驅(qū)動(dòng)力,兩者結(jié)合提升機(jī)器人智能水平成為重要趨勢(shì)。然而,大模型在機(jī)器人終端的落地卻面臨“不可能三角”的困境:模型廠商依賴芯片廠商,芯片廠商依賴機(jī)器人廠商,機(jī)器人廠商又依賴模型廠商,形成負(fù)反饋循環(huán)。
1. 大模型賦能機(jī)器人:挑戰(zhàn)與機(jī)遇
大模型為機(jī)器人提供“大腦”,提升其泛化和規(guī)劃能力,但目前主要用于簡(jiǎn)單任務(wù)理解和拆分。大模型的泛化、規(guī)劃、糾錯(cuò)等能力在機(jī)器人領(lǐng)域的應(yīng)用仍處于初步階段,主要原因在于:
缺乏適合機(jī)器人的模型框架:目前缺乏像LLM一樣統(tǒng)一的架構(gòu),不同形態(tài)的機(jī)器人對(duì)大模型有不同要求。
數(shù)據(jù)不足:模型廠商難以獲取大量、多元化的預(yù)訓(xùn)練數(shù)據(jù),導(dǎo)致模型泛化能力不足,尤其在精細(xì)動(dòng)作控制方面。
知識(shí)壁壘:大模型廠商和機(jī)器人廠商之間存在知識(shí)壁壘,難以有效融合。
2. “機(jī)器人大腦”的三角拉力賽
機(jī)器人廠商的量產(chǎn)不足是核心問題。目前機(jī)器人主要面向?qū)I(yè)用戶,應(yīng)用場(chǎng)景有限,導(dǎo)致數(shù)據(jù)積累不足,難以訓(xùn)練出高性能的模型。這又反過(guò)來(lái)影響芯片廠商的研發(fā)投入,因?yàn)槿狈κ袌?chǎng)需求,適配機(jī)器人端側(cè)模型的芯片迭代緩慢。
數(shù)據(jù)標(biāo)注困難:機(jī)器人數(shù)據(jù)采集和標(biāo)注成本高昂,需要真機(jī)采集多元化數(shù)據(jù)。
算力瓶頸:云端大模型難以在機(jī)器人端部署,而端側(cè)小模型能力有限,需要在能力和算力之間尋求平衡。
芯片適配難題:模型需要與不同芯片適配,且低功耗芯片的算力限制嚴(yán)重影響模型性能。
3. 如何打破“死循環(huán)”?
打破“不可能三角”需要三方合力:模型廠商、芯片廠商和機(jī)器人廠商需要共同努力。
端云協(xié)作:在云端訓(xùn)練大模型,再通過(guò)知識(shí)蒸餾等方式得到小模型部署在終端。
非Transformer架構(gòu):探索非Transformer架構(gòu),降低算力要求和功耗。
芯片適配優(yōu)化:模型廠商和芯片廠商合作優(yōu)化推理框架,充分利用芯片算力。
機(jī)器人廠商提升量產(chǎn):增加機(jī)器人出貨量,擴(kuò)大應(yīng)用場(chǎng)景,吸引更多資源投入。
最終,機(jī)器人大模型的發(fā)展需要模型、芯片和機(jī)器人廠商的共同努力,只有打破現(xiàn)有瓶頸,才能形成正向循環(huán),實(shí)現(xiàn)機(jī)器人智能水平的快速提升。
聯(lián)系作者
文章來(lái)源:AI科技評(píng)論
作者微信:
作者簡(jiǎn)介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。

粵公網(wǎng)安備 44011502001135號(hào)