GPT-4不是世界模型，LeCun雙手贊同！ACL力證LLM永遠無法模擬世界

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：GPT-4不是世界模型，LeCun雙手贊同！ACL力證LLM永遠無法模擬世界
關鍵字：狀態,模型,模擬器,世界,準確率
文章來源：新智元
內容字數：0字

內容摘要：

新智元報道編輯：桃子喬楊
【新智元導讀】大模型是世界模型嗎？UA微軟等機構最新研究發現，GPT-4在復雜環境的模擬中，準確率甚至不及60%。對此，LeCun激動地表示，世界模型永遠都不可能是LLM。一直以來，對LLM的支持觀點之一，就是模型可以集成海量事實知識，作為通往「世界模擬器」的基礎。
雖然也有不少人提出反對，但沒有真憑實據。
那么，LLM可以作為世界模擬器嗎？
最近，亞利桑那大學、微軟、霍普金斯大學等機構聯合發布了一篇論文，從實證的角度得出了否定的結論。
最新研究已被ACL 2024頂會接收。
論文地址：https://arxiv.org/pdf/2406.06485
研究發現，GPT-4在模擬基于常識任務的狀態變化時，比如燒開水，準確度僅有60%。
論文認為，盡管GPT-4這樣的模型表現很驚艷，但如果沒有進一步創新，它就不能成為可靠的世界模型。
為了量化LLM的規劃能力，作者提出了一個全新的基準測試——bytesized32-state-prediction，并在上面運行了GPT-4模型。
基準測試的代碼和數據也已經在GitHub上開源，可以幫助未來的研究繼續探查LLM的能

原文鏈接：GPT-4不是世界模型，LeCun雙手贊同！ACL力證LLM永遠無法模擬世界