告別偏科,能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強(qiáng)化智能體終于來了
AIGC動態(tài)歡迎閱讀
原標(biāo)題:告別偏科,能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強(qiáng)化智能體終于來了
關(guān)鍵字:智能,任務(wù),模型,數(shù)據(jù),專家
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8029字
內(nèi)容摘要:
機(jī)器之心報道
編輯:佳琦模型、專家智能體和數(shù)據(jù)集都已開源。隨著 Llama 3 發(fā)布,未來大模型的參數(shù)量已飆升至驚人的 4000 億。盡管每周幾乎都有一個聲稱性能超強(qiáng)的大模型出來炸場,但 AI 應(yīng)用還在等待屬于它們的「ChatGPT 時刻」。其中,AI 智能體無疑是最被看好的賽道。
就連吳恩達(dá)都說,GPT-4 加上 AI 智能體,可能提前達(dá)到 GPT-5 的效果。不過,我們熟知的智能體往往有點「偏科」。例如,第一個 AI 軟件工程師 Devin,專精于代碼。會打游戲的智能體往往也只能在某一個游戲里秀操作。尋找一個能夠同時擅長多個領(lǐng)域,并能在其中無縫切換的通用模型仍是機(jī)器學(xué)習(xí)研究中的一個關(guān)鍵目標(biāo)。
為了解決這個問題,研究者們對于智能體如何結(jié)合計算機(jī)視覺(CV)和自然語言處理(NLP)任務(wù)進(jìn)行了廣泛探索,但將強(qiáng)化學(xué)習(xí)(RL)任務(wù)整合進(jìn)來的研究相對較少。這是由于 RL 任務(wù)本質(zhì)上是異質(zhì)的,這使得將 RL 任務(wù)與對話和圖像識別等其他任務(wù)結(jié)合起來更加困難。這要求智能體能融會貫通不同領(lǐng)域任務(wù)中的不同模態(tài)、任務(wù)復(fù)雜性和數(shù)據(jù)類型。要達(dá)到全能型智能體,主要需要解決以下問題:(1)如何設(shè)計一個能夠處理多種
原文鏈接:告別偏科,能玩轉(zhuǎn)多模態(tài)、多任務(wù)、多領(lǐng)域的強(qiáng)化智能體終于來了
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺