<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        “AI黑箱:上海實驗室揭示大模型‘指紋’與剪枝合并的秘密!”

        AIGC動態5個月前發布 量子位
        314 0 0

        利用模型微調后表征不變性打造

        “破解AI黑箱:上海實驗室揭示大模型‘指紋’與剪枝合并的秘密!”

        原標題:專治大模型“套殼”!上海AI實驗室等給LLM做“指紋識別”,模型剪枝、合并等也無所遁形
        文章來源:量子位
        內容字數:5065字

        量子位投稿摘要:REEF方法有效檢測大模型“套殼”行為

        近日,來自上海AI Lab邵婧課題組的學者們提出了一種名為REEF(Representation Encoding Fingerprints)的方法,旨在有效檢測大語言模型(LLM)的未經授權的后續開發行為,通常被稱為“套殼”行為。該方法在不影響模型性能的情況下,通過表征編碼實現對源模型的精準識別,為大模型開發團隊應對侵權問題提供了新的解決方案。

        1. REEF的關鍵思想

        REEF依賴于模型在微調后的表征“不變性”,通過計算源模型與被測模型的CKA(中心核對齊)相似性來判斷二者的關系。CKA是一種用于測量兩組隨機變量之間性的相似性指數,能夠確保在不同的排列和縮放變換下保持魯棒性。這一特點使得REEF能夠有效識別經過剪枝、合并等處理后的衍生模型。

        2. 實驗驗證與魯棒性

        研究者將REEF應用于多種通過微調、剪枝、合并等手段衍生出的模型,結果顯示REEF在這些情況下依然能夠準確識別源模型,驗證了其優越的魯棒性。具體而言,REEF在使用多達700B tokens進行微調時仍能保持高達0.9962的相似度,對高達90%的剪枝比率也表現出良好的識別準確性。

        3. 跨數據集的有效性

        REEF的有效性還體現在其對不同數據集的適應性。實驗表明,REEF在多個數據集上均能穩定識別源模型,并且在樣本量較少時也能實現可靠的指紋識別。這使得REEF不僅在實際應用中具備高效性,也為模型的知識產權保護提供了有力支持。

        4. 結論與展望

        REEF方法為大模型的開發與知識產權管理提供了一種新標準,推動了更透明與合作的AI社區。作者們相信,這一研究成果將促進AI模型的保護與安全可信性的發展。

        相關論文鏈接:[REEF論文](https://arxiv.org/abs/2410.14273),項目主頁:[REEF項目](https://github.com/tmylla/REEF)。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 51视频精品全部免费最新| xxxxx做受大片在线观看免费| 久久黄色免费网站| 亚洲av无码国产精品色午夜字幕| 精品国产污污免费网站入口| 亚洲日本中文字幕天堂网| 女人裸身j部免费视频无遮挡| 亚洲精品成人a在线观看| 日本激情猛烈在线看免费观看| 免费一级e一片在线播放| 黄色一级免费网站| 中文字幕亚洲无线码| 中文字幕乱码一区二区免费| 亚洲性猛交XXXX| 日韩免费电影网址| 亚洲噜噜噜噜噜影院在线播放| 亚洲国产精品免费观看| 亚洲人成电影网站色www| 国产免费人成视频在线观看| 农村寡妇一级毛片免费看视频| 亚洲欧洲国产精品香蕉网| 99热在线观看免费| 亚洲最大天堂无码精品区| 国产jizzjizz视频全部免费| 9久久免费国产精品特黄| 精品日韩亚洲AV无码| 成人无遮挡毛片免费看| 九九免费精品视频在这里| 亚洲av丰满熟妇在线播放| aa级一级天堂片免费观看| 最新亚洲人成无码网www电影| 奇米影视亚洲春色| 日本最新免费网站| 男女啪啪免费体验区| 久久精品国产亚洲av成人| 在线观看人成网站深夜免费| 国产伦精品一区二区免费| 亚洲另类图片另类电影| 亚洲乱码中文字幕综合234| 5555在线播放免费播放| 猫咪www免费人成网站|