博弈論讓 AI 更加正確、高效,LLM 與自己競(jìng)爭(zhēng)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:博弈論讓 AI 更加正確、高效,LLM 與自己競(jìng)爭(zhēng)
關(guān)鍵字:模型,語(yǔ)言,報(bào)告,生成器,游戲
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):8291字
內(nèi)容摘要:
來源:ScienceAI
編輯:綠羅
想象一下,你有一位朋友對(duì)同一問題給出了不同的答案,具體取決于你提問的方式。
「秘魯?shù)氖锥际悄睦铮俊箷?huì)得到一個(gè)答案;「利馬是秘魯?shù)氖锥紗幔俊?會(huì)得到另一個(gè)。你可能會(huì)有點(diǎn)擔(dān)心你朋友的智力,而且你幾乎很難相信他們給出的任何答案。
這正是許多大型語(yǔ)言模型 (LLM) 正在發(fā)生的事,這些超強(qiáng)大的機(jī)器學(xué)習(xí)工具為 ChatGPT 和其他人工智能奇跡提供了動(dòng)力。開放式的生成性問題會(huì)產(chǎn)生一個(gè)答案,而涉及必須在選項(xiàng)之間進(jìn)行選擇的判別性問題,通常會(huì)產(chǎn)生不同的答案。麻省理工學(xué)院的博士生 Athul Paul Jacob 表示:「當(dāng)同一個(gè)問題的措辭不同時(shí),就會(huì)出現(xiàn)脫節(jié)。」
為了使語(yǔ)言模型的答案更加一致,并使模型整體更加可靠,Jacob 和他的同事設(shè)計(jì)了一個(gè)游戲,在這個(gè)游戲中,模型的兩種模式被驅(qū)使著去尋找他們能達(dá)成一致的答案。這個(gè)簡(jiǎn)單的程序被稱為博弈(consensus game),讓 LLM 與自己競(jìng)爭(zhēng),使用博弈論工具來提高模型的準(zhǔn)確性和內(nèi)部一致性。
論文鏈接:https://openreview.net/forum?id=n9xeGcI4Yg
機(jī)器人公司 Field
原文鏈接:博弈論讓 AI 更加正確、高效,LLM 與自己競(jìng)爭(zhēng)
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:AItists
作者簡(jiǎn)介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)