GPT-4不是世界模型,LeCun雙手贊同!ACL力證LLM永遠(yuǎn)無法模擬世界
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:GPT-4不是世界模型,LeCun雙手贊同!ACL力證LLM永遠(yuǎn)無法模擬世界
關(guān)鍵字:狀態(tài),模型,模擬器,世界,準(zhǔn)確率
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子喬楊
【新智元導(dǎo)讀】大模型是世界模型嗎?UA微軟等機(jī)構(gòu)最新研究發(fā)現(xiàn),GPT-4在復(fù)雜環(huán)境的模擬中,準(zhǔn)確率甚至不及60%。對(duì)此,LeCun激動(dòng)地表示,世界模型永遠(yuǎn)都不可能是LLM。一直以來,對(duì)LLM的支持觀點(diǎn)之一,就是模型可以集成海量事實(shí)知識(shí),作為通往「世界模擬器」的基礎(chǔ)。
雖然也有不少人提出反對(duì),但沒有真憑實(shí)據(jù)。
那么,LLM可以作為世界模擬器嗎?
最近,亞利桑那大學(xué)、微軟、霍普金斯大學(xué)等機(jī)構(gòu)聯(lián)合發(fā)布了一篇論文,從實(shí)證的角度得出了否定的結(jié)論。
最新研究已被ACL 2024頂會(huì)接收。
論文地址:https://arxiv.org/pdf/2406.06485
研究發(fā)現(xiàn),GPT-4在模擬基于常識(shí)任務(wù)的狀態(tài)變化時(shí),比如燒開水,準(zhǔn)確度僅有60%。
論文認(rèn)為,盡管GPT-4這樣的模型表現(xiàn)很驚艷,但如果沒有進(jìn)一步創(chuàng)新,它就不能成為可靠的世界模型。
為了量化LLM的規(guī)劃能力,作者提出了一個(gè)全新的基準(zhǔn)測(cè)試——bytesized32-state-prediction,并在上面運(yùn)行了GPT-4模型。
基準(zhǔn)測(cè)試的代碼和數(shù)據(jù)也已經(jīng)在GitHub上開源,可以幫助未來的研究繼續(xù)探查L(zhǎng)LM的能
原文鏈接:GPT-4不是世界模型,LeCun雙手贊同!ACL力證LLM永遠(yuǎn)無法模擬世界
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。