AIGC動態歡迎閱讀
原標題:華盛頓大學撰文反駁微軟,我們無法刪除大模型關于哈利波特的記憶
關鍵字:模型,記憶,信息,測試,詞匯
文章來源:夕小瑤科技說
內容字數:5120字
內容摘要:
夕小瑤科技說 原創作者 | Tscom引言:探索記憶消除的界限在人工智能的發展過程中,一個引人入勝的議題是機器學習模型是否能夠被訓練以忘記其曾經學到的信息。近期,Ronen Eldan和Mark Russinovich在其研究“誰才是哈利·波特?”[1]中提出了一種創新技術,聲稱能夠從LLMs中“抹去”特定數據集的記憶,尤其是針對《哈利·波特》這樣的知名作品。他們的方法引發了業界的廣泛關注,并被認為是在LLMs“遺忘”技術領域的一大突破。
但是,本文將對Eldan和Russinovich的研究成果提出質疑,認為這樣的聲明可能過于寬泛。本文通過一系列輕量級實驗,探索記憶消除的界限,尤其是針對深度學習模型是否真的能夠徹底忘記哈利·波特系列內容的可能性。
論文標題: THE BOY WHO SURVIVED: REMOVING HARRY POTTER FROM AN LLM IS HARDER THAN REPORTED
論文鏈接: https://arxiv.org/pdf/2403.12082.pdf
Eldan和Russinovich的方法概述在Eldan和Russinovich的研
原文鏈接:華盛頓大學撰文反駁微軟,我們無法刪除大模型關于哈利波特的記憶
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189