融合RL與LLM思想，探尋世界模型以邁向AGI「中·下篇」

AIGC動(dòng)態(tài)2年前 (2024)發(fā)布 JioNLP

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：融合RL與LLM思想，探尋世界模型以邁向AGI「中·下篇」
關(guān)鍵字：模型,報(bào)告,知乎,人類,數(shù)據(jù)
文章來源：JioNLP
內(nèi)容字?jǐn)?shù)：111785字

內(nèi)容摘要：

本篇文章與2023年底嘗試挖掘并探尋以chatGPT為代表的LLM和以AlphaGO/AlphaZero及當(dāng)下AlphaDev為代表的RL思想的背后底層理論及形式上的統(tǒng)一，同時(shí)與最近OpenAI暴露出的project Q*可能的關(guān)于細(xì)粒度過程學(xué)習(xí)再到系統(tǒng)①(快)思考與系統(tǒng)②(慢)思考的形式化統(tǒng)一的延展性思考，以展望并探索當(dāng)下面向未來的AGI->ASI的路徑可行性。正如前幾日AI一姐李飛飛所說，人工智能即將迎來它的「牛頓時(shí)刻」
本篇文章擬分為「上篇」「中篇」「下篇」
作者：呂明，坐標(biāo)西二旗，技術(shù)探索方向LLM/RL/AGI/AI4S..
想回顧「上篇」的小伙伴請(qǐng)參考如下鏈接：融合RL與LLM思想，探尋世界模型以邁向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」 (qq.com)「中篇」
「系統(tǒng)一 · 快思考與系統(tǒng)二 · 慢思考」的本質(zhì)&闡釋：
細(xì)心的讀者可能會(huì)在上篇的內(nèi)容預(yù)告與中篇內(nèi)容的更新中對(duì)比發(fā)現(xiàn)，將「系統(tǒng)一 · 快思考與系統(tǒng)二 · 慢思考的本質(zhì)&闡釋」與「LLM×RL本質(zhì)&闡釋」做了先后調(diào)換（相信大家從這里也能推斷出「中篇」和「下篇」的撰寫是在

原文鏈接：融合RL與LLM思想，探尋世界模型以邁向AGI「中·下篇」