GPT-4「榮升」AI頂會同行評審專家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成
AIGC動態(tài)歡迎閱讀
原標(biāo)題:GPT-4「榮升」AI頂會同行評審專家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成
關(guān)鍵字:政策,報(bào)告,語料庫,同行,語料
文章來源:新智元
內(nèi)容字?jǐn)?shù):3842字
內(nèi)容摘要:
新智元報(bào)道編輯:Mindy
【新智元導(dǎo)讀】斯坦福的一篇案例研究表示,提交給AI會議的同行評審文本中,有6.5%到16.9%可能是由LLM大幅修改的,而這些趨勢可能在個(gè)體級別上難以察覺。LLM在飛速進(jìn)步的同時(shí),人類也越來越難以區(qū)分LLM生成的文本與人工編寫的內(nèi)容,甚至分辨能力與隨機(jī)器不相上下。
這加大了未經(jīng)證實(shí)的生成文本可以偽裝成權(quán)威、基于證據(jù)的寫作的風(fēng)險(xiǎn)。
盡管在個(gè)例上難以察覺,但由于LLM的輸出趨于一致性,這種趨勢可能會放大語料庫級別的偏見。
基于這一點(diǎn),一支來自斯坦福的團(tuán)隊(duì)提出一種方法,以此來對包含不確定量的AI生成文本的真實(shí)世界數(shù)據(jù)集進(jìn)行可比較的評估,并在AI會議的同行評審文本中驗(yàn)證。
論文地址:https://arxiv.org/abs/2403.07183
AI會議的同行評審可能是AI?同行評審是一種學(xué)術(shù)論文發(fā)表前的質(zhì)量評估機(jī)制。
這些同行評審者通常具有相關(guān)領(lǐng)域的專業(yè)知識,他們會對論文的原創(chuàng)性、方法學(xué)、數(shù)據(jù)分析、結(jié)果解釋等進(jìn)行評價(jià),以確保論文的科學(xué)性和可信度。
斯坦福團(tuán)隊(duì)研究的AI會議包括ICLR 2024、NeurIPS 2023、CoRL 2023和EMNLP 2023
原文鏈接:GPT-4「榮升」AI頂會同行評審專家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。


粵公網(wǎng)安備 44011502001135號