李飛飛DeepMind全新「代碼鏈」碾壓CoT!大模型用Python代碼推理,性能暴漲12%
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:李飛飛DeepMind全新「代碼鏈」碾壓CoT!大模型用Python代碼推理,性能暴漲12%
關(guān)鍵字:代碼,模型,任務(wù),研究人員,語義
文章來源:新智元
內(nèi)容字?jǐn)?shù):6117字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子
【新智元導(dǎo)讀】激發(fā)大模型解決復(fù)雜問題的重要技術(shù)之一CoT,如今要被顛覆了?谷歌DeepMind斯坦福UC伯克利共同提出了「代碼鏈」(CoC),讓LLM在代碼中學(xué)會(huì)了思考。思維鏈(CoT),最具開拓性和影響力的提示工程技術(shù)之一,能增強(qiáng)LLM在推理決策中的表現(xiàn)。
那么,如果大模型可以在代碼中「思考」,會(huì)如何呢?
最近,谷歌DeepMind、斯坦福、UC伯克利團(tuán)隊(duì)聯(lián)手提出了全新技術(shù)——「代碼鏈」(CoC)。
論文地址:https://arxiv.org/pdf/2312.04474.pdf
「代碼鏈」是一種將編碼邏輯與自然語言理解相結(jié)合,簡單卻非常有效的創(chuàng)新方法,能夠提升LLM基于代碼的推理能力,讓其更智能、更通用。
再通俗點(diǎn)講,CoC允許LLM生成「偽代碼」來分解難題,通過LMulator執(zhí)行有效代碼,模擬無效代碼。
研究結(jié)果顯示,在BIG-Bench Hard基準(zhǔn)上,CoC實(shí)現(xiàn)了84%的準(zhǔn)確率,比CoT提高了12%。
另外,在BIG-Bench Hard的23項(xiàng)任務(wù)中,CoC在18項(xiàng)任務(wù)中超過了人類的平均表現(xiàn)。
看得出,「代碼鏈」將CoT向前推進(jìn)了一步,并將生成用
原文鏈接:李飛飛DeepMind全新「代碼鏈」碾壓CoT!大模型用Python代碼推理,性能暴漲12%
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。