OpenAI超級(jí)對(duì)齊團(tuán)隊(duì)遺作:兩個(gè)大模型博弈一番,輸出更好懂了

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:OpenAI超級(jí)對(duì)齊團(tuán)隊(duì)遺作:兩個(gè)大模型博弈一番,輸出更好懂了
關(guān)鍵字:模型,答案,可讀性,團(tuán)隊(duì),人類(lèi)
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
機(jī)器之心編輯部如果 AI 模型給的答案一點(diǎn)也看不懂,你敢用嗎?隨著機(jī)器學(xué)習(xí)系統(tǒng)在更重要的領(lǐng)域得到應(yīng)用,證明為什么我們可以信任它們的輸出,并明確何時(shí)不應(yīng)信任它們,變得越來(lái)越重要。
獲得對(duì)復(fù)雜系統(tǒng)輸出結(jié)果信任的一個(gè)可行方法是,要求系統(tǒng)對(duì)其輸出產(chǎn)生一種解釋?zhuān)@種解釋對(duì)人類(lèi)或另一個(gè)受信任的系統(tǒng)來(lái)說(shuō)是可讀的,即可以完全理解以至于任何可能的錯(cuò)誤都可以被發(fā)現(xiàn)。例如,為了建立對(duì)司法系統(tǒng)的信任,我們要求法院提供清晰易讀的書(shū)面意見(jiàn),解釋并支持其決策。
對(duì)于大型語(yǔ)言模型來(lái)說(shuō),我們也可以采用類(lèi)似的方法。
不過(guò),在采用這種方法時(shí),確保語(yǔ)言模型生成的是易于理解的文本,這件事非常重要,尤其是在處理數(shù)學(xué)、編碼這樣的復(fù)雜任務(wù)時(shí)。
如下圖所示,你讓 AI 寫(xiě)一個(gè)快速排序算法,AI 很快就寫(xiě)出來(lái)了,而且答案很簡(jiǎn)潔。但不會(huì)寫(xiě)代碼的你要怎么判斷 AI 寫(xiě)得對(duì)不對(duì)呢?OpenAI 在一篇最新的論文中研究了這個(gè)問(wèn)題。論文標(biāo)題:PROVER-VERIFIER GAMES IMPROVE LEGIBILITY OF LLM OUTPUTS
論文鏈接:https://cdn.openai.com/prover-verifi
原文鏈接:OpenAI超級(jí)對(duì)齊團(tuán)隊(duì)遺作:兩個(gè)大模型博弈一番,輸出更好懂了
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:

粵公網(wǎng)安備 44011502001135號(hào)