OpenAI Jason wei解讀o1:思維鏈的“頓悟時刻”,大模型不再鸚鵡學(xué)舌
AIGC動態(tài)歡迎閱讀
原標題:OpenAI Jason wei解讀o1:思維鏈的“頓悟時刻”,大模型不再鸚鵡學(xué)舌
關(guān)鍵字:報告,知識產(chǎn)權(quán),人工智能,政策,華為
文章來源:人工智能學(xué)家
內(nèi)容字數(shù):0字
內(nèi)容摘要:
來源:AI寒武紀
OpenAI的研究員Jason Wei(o1思維鏈核心開發(fā)人員)點出了一個關(guān)鍵但容易被忽視的問題:思維鏈在o1出現(xiàn)前后發(fā)生了巨大的變化,雖然只是名稱上多了個”o1″,但這背后的含義卻遠不止如此
o1之前:模仿秀,不是真思考在o1范式出現(xiàn)之前(即思維鏈提示的早期階段),思維鏈的實際運作方式與我們期望的之間存在著很大的差異。我們希望思維鏈能夠反映模型真正的思考過程,但實際上,模型只是在模仿它在預(yù)訓(xùn)練數(shù)據(jù)中看到的推理路徑,例如數(shù)學(xué)作業(yè)的解答。
這類數(shù)據(jù)的最大問題在于,它們是事后諸葛亮式的總結(jié),作者在其他地方完成了所有思考過程后才寫下的答案,而不是真正的思維過程記錄。因此,這些答案的信息密度往往很低,一個極端的例子就是“答案是5,因為……”,其中“5”這個詞承載了幾乎所有的新信息量,而前面的鋪墊卻冗長而低效
o1之后:內(nèi)心獨白,信息量o1范式出現(xiàn)后,你會發(fā)現(xiàn)思維鏈看起來與教科書式的數(shù)學(xué)解答截然不同。這些思維鏈更像是模型的“內(nèi)心獨白”或“意識流”。你會看到模型進行回溯、修正,它會說“或者,讓我們試試……”、“等等,但是……”之類的話,體現(xiàn)了真正的思考和探索過程
Jason
原文鏈接:OpenAI Jason wei解讀o1:思維鏈的“頓悟時刻”,大模型不再鸚鵡學(xué)舌
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:
作者簡介: