AIGC動態歡迎閱讀
原標題:比人類便宜20倍!谷歌DeepMind推出「超人」AI系統
關鍵字:模型,事實,人類,事實性,研究人員
文章來源:新智元
內容字數:4413字
內容摘要:
新智元報道編輯:alan
【新智元導讀】大模型的幻覺問題怎么解?谷歌DeepMind:用AI來做同行評審!事實核驗正確率超過人類,而且便宜20倍。AI的同行評審來了!
一直以來,大語言模型胡說八道(幻覺)的問題最讓人頭疼,而近日,來自谷歌DeepMind的一項研究引發網友熱議:
大模型的幻覺問題,好像被終結了?
論文地址:https://arxiv.org/pdf/2403.18802.pdf
項目地址:https://github.com/google-deepmind/long-form-factuality
在這篇工作中,研究人員介紹了一種名為 “搜索增強事實性評估器”(Search-Augmented Factuality Evaluator,SAFE)的方法。
對于LLM的長篇回答,SAFE使用其他的LLM,將答案文本分解為單個敘述,然后使用諸如RAG等方法,來確定每個敘述的準確性。
——簡單來說就是:AI答題,AI判卷,AI告訴AI你這里說的不對。
真正的「同行」評審。
另外,研究還發現,相比于人工標注和判斷事實準確性,使用AI不但便宜20倍,而且還更靠譜!
目前這個項目
原文鏈接:比人類便宜20倍!谷歌DeepMind推出「超人」AI系統
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...