融合RL與LLM思想,探尋世界模型以邁向AGI「中·下篇」
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:融合RL與LLM思想,探尋世界模型以邁向AGI「中·下篇」
關(guān)鍵字:模型,報(bào)告,知乎,人類(lèi),數(shù)據(jù)
文章來(lái)源:JioNLP
內(nèi)容字?jǐn)?shù):111785字
內(nèi)容摘要:
本篇文章與2023年底嘗試挖掘并探尋以chatGPT為代表的LLM和以AlphaGO/AlphaZero及當(dāng)下AlphaDev為代表的RL思想的背后底層理論及形式上的統(tǒng)一,同時(shí)與最近OpenAI暴露出的project Q*可能的關(guān)于細(xì)粒度過(guò)程學(xué)習(xí)再到系統(tǒng)①(快)思考與系統(tǒng)②(慢)思考的形式化統(tǒng)一的延展性思考,以展望并探索當(dāng)下面向未來(lái)的AGI->ASI的路徑可行性。正如前幾日AI一姐李飛飛所說(shuō),人工智能即將迎來(lái)它的「牛頓時(shí)刻」
本篇文章擬分為「上篇」「中篇」「下篇」
作者:呂明,坐標(biāo)西二旗,技術(shù)探索方向LLM/RL/AGI/AI4S..
想回顧「上篇」的小伙伴請(qǐng)參考如下鏈接:融合RL與LLM思想,探尋世界模型以邁向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」 (qq.com)「中篇」
「系統(tǒng)一 · 快思考與系統(tǒng)二 · 慢思考」的本質(zhì)&闡釋:
細(xì)心的讀者可能會(huì)在上篇的內(nèi)容預(yù)告與中篇內(nèi)容的更新中對(duì)比發(fā)現(xiàn),將「系統(tǒng)一 · 快思考與系統(tǒng)二 · 慢思考的本質(zhì)&闡釋」與「LLM×RL本質(zhì)&闡釋」做了先后調(diào)換(相信大家從這里也能推斷出「中篇」和「下篇」的撰寫(xiě)是在
原文鏈接:融合RL與LLM思想,探尋世界模型以邁向AGI「中·下篇」
聯(lián)系作者
文章來(lái)源:JioNLP
作者微信:jionlp
作者簡(jiǎn)介:AI、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、數(shù)據(jù)挖掘、數(shù)據(jù)分析、C、C++。當(dāng)然,也聊關(guān)于程序員的方方面面。