LLMs玩狼人殺:清華大學(xué)驗(yàn)證大模型參與復(fù)雜交流博弈游戲的能力

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:LLMs玩狼人殺:清華大學(xué)驗(yàn)證大模型參與復(fù)雜交流博弈游戲的能力
關(guān)鍵字:經(jīng)驗(yàn),模型,游戲,語(yǔ)言,解讀
文章來(lái)源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):8146字
內(nèi)容摘要:
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自hyperAI超神經(jīng)
作者:彬彬
編輯:李寶珠、三羊
清華大學(xué)研究團(tuán)隊(duì)提出了一種用于交流游戲的框架,展示了大語(yǔ)言模型從經(jīng)驗(yàn)中學(xué)習(xí)的能力,還發(fā)現(xiàn)大語(yǔ)言模型具有非預(yù)編程的策略行為,如信任、對(duì)抗、偽裝和領(lǐng)導(dǎo)力。近年來(lái),用 AI 玩狼人殺和撲克等游戲的研究引起廣泛關(guān)注。面對(duì)嚴(yán)重依賴自然語(yǔ)言交流的復(fù)雜博弈游戲,AI Agent 必須從模糊的自然語(yǔ)言話語(yǔ)中收集和推斷信息,這具有更大的實(shí)際價(jià)值和挑戰(zhàn)。而隨著 GPT 這樣的大語(yǔ)言模型取得重大進(jìn)展,其對(duì)復(fù)雜語(yǔ)言的理解、生成和推理能力不斷提升,表現(xiàn)出一定程度的模擬人類行為的潛力。
基于此,清華大學(xué)研究團(tuán)隊(duì)提出了一種用于交流游戲的框架,可以在沒(méi)有人工標(biāo)注數(shù)據(jù)的情況下與凍結(jié)的大語(yǔ)言模型一起玩狼人殺游戲。框架展示了大語(yǔ)言模型自主從經(jīng)驗(yàn)中學(xué)習(xí)的能力。有趣的是,研究人員在游戲中還發(fā)現(xiàn)大語(yǔ)言模型具有非預(yù)編程的策略行為,如信任、對(duì)抗、偽裝和領(lǐng)導(dǎo),這可以作為大語(yǔ)言模型玩交流游戲進(jìn)一步研究的催化劑。獲取論文:
https://arxiv.org/pdf/2309.04658.pdf
模型框架:實(shí)現(xiàn)與大語(yǔ)言模型一起玩狼人殺眾所周知,狼人殺游戲的一個(gè)重要特
原文鏈接:LLMs玩狼人殺:清華大學(xué)驗(yàn)證大模型參與復(fù)雜交流博弈游戲的能力
聯(lián)系作者
文章來(lái)源:大數(shù)據(jù)文摘
作者微信:BigDataDigest
作者簡(jiǎn)介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化

粵公網(wǎng)安備 44011502001135號(hào)