AIGC動態歡迎閱讀
原標題:找出9.9<9.11的真正原因:《》!神經元干預可免重訓練修復
關鍵字:神經元,解讀,模型,,
文章來源:量子位
內容字數:0字
內容摘要:
衡宇 發自 凹非寺量子位 | 公眾號 QbitAI大模型分不清“9.9和9.11哪個更大”的謎團,終于被可解釋性研究揭秘了!
而且簡單到讓人哭笑不得——
一個來自MIT、UC伯克利的實驗室團隊,開發了能抑制大模型體內某些(與具體概念相關的)神經元的AI工具。
他們發現,只要把與《》、日期、重力等概念相關的神經元激活設為0,大模型立馬能答對這道比較題。單單是拿走《》相關神經元,就可以讓“9.9和9.11哪個更大”這個問題的準確率,提高21個百分點!
而且修復這個bug,既不需要重新訓練模型,也不需要添加額外提示詞。
網友看了過后哭笑不得:
救大命了,看完過后我覺得這些因素都挺明顯的,但在此之前我從未朝這上面想過。
這家AI實驗室名叫Transluce AI,團隊成員也趁機悉數亮相,創始團隊來自MIT、UC伯克利、CMU等頂尖高校。
其中還有OpenAI和谷歌大腦的前員工。
揭秘是什么讓大模型說“9.8<9.11”大模型硬說9.9<9.11這件事,想必大家都知道了。
直至今日,Claude-3.5-Sonnet和GPT-4o這樣的頂尖模型,依舊固執地這樣認為(或者出
原文鏈接:找出9.9<9.11的真正原因:《》!神經元干預可免重訓練修復
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...