朱松純:大模型為什么不是AGI?
原標(biāo)題:朱松純:大模型為什么不是AGI?
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):16669字
朱松純教授新書《為機(jī)器立心》解讀:大模型的局限與通用人工智能的未來
本文根據(jù)知識分子雜志刊登的朱松純教授新書《為機(jī)器立心》第一章內(nèi)容,總結(jié)了當(dāng)前大模型技術(shù)的局限性,并探討了通用人工智能(AGI)的未來發(fā)展方向。
1. 大模型:缸中之腦的隱喻
朱松純教授以哲學(xué)思想實(shí)驗(yàn)“缸中之腦”來比喻當(dāng)前的大模型。大模型通過統(tǒng)計(jì)建模學(xué)習(xí)文本間的語言學(xué)關(guān)系,預(yù)測下一個(gè)詞語,卻缺乏與真實(shí)世界的實(shí)質(zhì)性聯(lián)結(jié)(符號落地)。這導(dǎo)致大模型容易陷入無限循環(huán),其“智能”實(shí)則源于人類智能的投射,而非內(nèi)在的理解。 如同“無色的綠思狂暴地沉睡”一樣,大模型生成的文本缺乏內(nèi)在意義,其意義完全依賴人類的闡釋。
2. 隱藏記憶而非真正理解
文章指出,大模型訓(xùn)練數(shù)據(jù)的不透明性以及評估指標(biāo)的差異,導(dǎo)致人們高估了其真實(shí)性能。大模型可能只是在“隱藏記憶”中檢索信息,而非真正掌握核心概念。文中列舉了 GPT-4 在簡單數(shù)學(xué)計(jì)算、事實(shí)判斷和創(chuàng)造力測試中的錯(cuò)誤,說明其缺乏基本的邏輯推理和常識判斷能力,更像是一種新型的“數(shù)據(jù)庫”。
3. 數(shù)據(jù)瓶頸與AGI的挑戰(zhàn)
文章認(rèn)為,大模型的數(shù)據(jù)價(jià)值已趨于飽和,單純增加數(shù)據(jù)量或模型規(guī)模難以帶來質(zhì)的飛躍。楊立昆等學(xué)者也指出,現(xiàn)有的大模型研究缺乏對認(rèn)知推理模型的構(gòu)建,單純的數(shù)據(jù)驅(qū)動(dòng)無法實(shí)現(xiàn)人類級別的智能。大模型存在虛假涌現(xiàn)和不可控性等問題,其語言空間也無法覆蓋所有智能任務(wù)。 大模型缺乏“行”(行動(dòng)能力),無法主動(dòng)探索和積累知識,只能被動(dòng)地獲取信息。
4. 通往AGI的“1238”路線圖
書中提出的“1238”路線圖,為通用人工智能的研究提供了系統(tǒng)性思路:一個(gè)統(tǒng)一框架、兩大系統(tǒng)完備性、三項(xiàng)基本特征、八大關(guān)鍵問題。 這暗示著,通往AGI的道路需要更深入地理解智能的本質(zhì),構(gòu)建更完備的認(rèn)知架構(gòu),解決符號落地等關(guān)鍵問題。
5. 朱松純團(tuán)隊(duì)的研究成果
文章簡要介紹了朱松純團(tuán)隊(duì)的四大研究成果:通用智能體“通通”、大任務(wù)仿真平臺“通界”、評級標(biāo)準(zhǔn)“通智測試”、科研平臺“通境”,這些成果旨在推動(dòng)AGI研究和產(chǎn)業(yè)應(yīng)用。
總而言之,文章強(qiáng)調(diào)了當(dāng)前大模型的局限性,認(rèn)為它們并非通用人工智能,并呼吁學(xué)術(shù)界和產(chǎn)業(yè)界共同努力,探索更符合人類智能本質(zhì)的AGI發(fā)展道路,最終實(shí)現(xiàn)“為機(jī)器立心”。
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:
作者簡介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)