告別偏科,能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強(qiáng)化智能體終于來(lái)了
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:告別偏科,能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強(qiáng)化智能體終于來(lái)了
關(guān)鍵字:智能,任務(wù),模型,數(shù)據(jù),專(zhuān)家
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8029字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:佳琦模型、專(zhuān)家智能體和數(shù)據(jù)集都已開(kāi)源。隨著 Llama 3 發(fā)布,未來(lái)大模型的參數(shù)量已飆升至驚人的 4000 億。盡管每周幾乎都有一個(gè)聲稱(chēng)性能超強(qiáng)的大模型出來(lái)炸場(chǎng),但 AI 應(yīng)用還在等待屬于它們的「ChatGPT 時(shí)刻」。其中,AI 智能體無(wú)疑是最被看好的賽道。
就連吳恩達(dá)都說(shuō),GPT-4 加上 AI 智能體,可能提前達(dá)到 GPT-5 的效果。不過(guò),我們熟知的智能體往往有點(diǎn)「偏科」。例如,第一個(gè) AI 軟件工程師 Devin,專(zhuān)精于代碼。會(huì)打游戲的智能體往往也只能在某一個(gè)游戲里秀操作。尋找一個(gè)能夠同時(shí)擅長(zhǎng)多個(gè)領(lǐng)域,并能在其中無(wú)縫切換的通用模型仍是機(jī)器學(xué)習(xí)研究中的一個(gè)關(guān)鍵目標(biāo)。
為了解決這個(gè)問(wèn)題,研究者們對(duì)于智能體如何結(jié)合計(jì)算機(jī)視覺(jué)(CV)和自然語(yǔ)言處理(NLP)任務(wù)進(jìn)行了廣泛探索,但將強(qiáng)化學(xué)習(xí)(RL)任務(wù)整合進(jìn)來(lái)的研究相對(duì)較少。這是由于 RL 任務(wù)本質(zhì)上是異質(zhì)的,這使得將 RL 任務(wù)與對(duì)話(huà)和圖像識(shí)別等其他任務(wù)結(jié)合起來(lái)更加困難。這要求智能體能融會(huì)貫通不同領(lǐng)域任務(wù)中的不同模態(tài)、任務(wù)復(fù)雜性和數(shù)據(jù)類(lèi)型。要達(dá)到全能型智能體,主要需要解決以下問(wèn)題:(1)如何設(shè)計(jì)一個(gè)能夠處理多種
原文鏈接:告別偏科,能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強(qiáng)化智能體終于來(lái)了
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)


粵公網(wǎng)安備 44011502001135號(hào)