国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

大模型訓練或無需“純凈數據”!北大團隊新研究:隨機噪聲影響有限,新方法讓模型更抗噪

AIGC動態7個月前發布 量子位
330 0 0

在噪聲環境中依然保持強勁表現

大模型訓練或無需“純凈數據”!北大團隊新研究:隨機噪聲影響有限,新方法讓模型更抗噪

原標題:大模型訓練或無需“純凈數據”!北大團隊新研究:隨機噪聲影響有限,新方法讓模型更抗噪
文章來源:量子位
內容字數:4549字

北大團隊:大模型訓練并非必須依賴“純凈數據”

傳統的大語言模型訓練依賴于“純凈數據”,即經過仔細篩選、語確且邏輯嚴密的文本。然而,北京大學的研究團隊近期的一項研究挑戰了這一觀點,認為適量的“噪聲數據”并不會顯著影響模型性能,甚至可能帶來意想不到的益處。

  1. 核心發現:噪聲數據對大模型訓練的影響

    研究團隊通過在訓練數據中添加高達20%的隨機亂碼,訓練了多個GPT-2模型。結果顯示,即使面對如此高比例的噪聲數據,模型的Next-token Prediction (NTP) loss僅上升約1%。更令人驚訝的是,在一些下游任務測試中,含噪模型甚至表現出更低的NTP loss。這表明,傳統的“純凈數據”假設可能過于嚴格。

  2. 理論解釋:隨機噪聲與模型性能的復雜關系

    研究團隊從理論角度分析了這一現象。他們將NTP過程建模為一個分類任務,并證明了在特定條件下,隨機噪聲的存在不會改變NTP loss的全局最小值。該理論解釋了為什么多語言模型和在充滿背景噪音的數據集上訓練的音頻模型能夠成功。他們還通過實驗驗證了這一理論的正確性,包括使用高斯分布生成的噪聲。

  3. 解決方法:局部梯度匹配(LGM)損失函數

    盡管預訓練損失變化微弱,但下游任務性能卻可能受到影響。研究團隊發現,在高斯噪聲上訓練的模型,盡管NTP loss更低,但在文本分類下游任務中的準確率卻下降。為了解決這個問題,他們提出了一種名為“局部梯度匹配”(LGM)的即插即用解決方案。LGM通過在特征中添加高斯噪聲并約束原始/擾動特征的梯度差異,增強分類頭的抗噪能力,從而彌補噪聲導致的特征偏移。實驗結果表明,LGM可以顯著提升受噪聲影響的模型在下游任務中的性能,甚至在干凈模型上也能提升1%-3%的準確率。

  4. 啟示與展望:數據清洗的新思考

    這項研究為大規模預訓練提供了新的視角:首先,它表明適度保留隨機噪聲可以降低數據清洗成本;其次,它為多語言模型的成功提供了理論解釋;第三,它提出了一種新的數據增強方法,即可控噪聲注入,可以提升模型的泛化能力。然而,研究也存在局限性,例如實驗僅基于GPT-2規模模型,未來需要進一步研究超大規模模型的噪聲耐受性以及LGM在其他模態中的應用。

總而言之,北大團隊的研究挑戰了大語言模型訓練對“純凈數據”的依賴,為降低數據清洗成本、提升模型泛化能力提供了新的思路和方法。這項研究的成果具有重要的理論意義和實際應用價值。


聯系作者

文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        成人av在线观| 极品少妇xxxx精品少妇偷拍| 亚洲va国产天堂va久久en| a亚洲天堂av| 一区二区三区在线免费| 在线精品亚洲一区二区不卡| 午夜一区二区三区在线观看| 5566中文字幕一区二区电影| 久久国产成人午夜av影院| 国产午夜一区二区三区| 色综合婷婷久久| 亚洲一区二区在线观看视频| 色欲综合视频天天天| 亚洲一区二区av在线| 日韩一区二区三区视频在线 | 亚洲综合色视频| 欧美在线一区二区三区| 日本中文一区二区三区| 国产精品伦一区| 欧美日本国产视频| 国产精品一区一区| 亚洲成av人片一区二区三区| 久久综合色之久久综合| 日本久久一区二区| 精品一区二区三区视频 | 欧美一激情一区二区三区| 国产精品66部| 亚洲chinese男男1069| 国产人久久人人人人爽| 亚洲免费观看在线视频| 日韩精品亚洲专区| 成人免费视频一区二区| 国产精品久久二区二区| 91福利精品视频| 久久国产免费看| 亚洲综合在线电影| 欧美国产精品中文字幕| 91精品国产综合久久久久久漫画| 成人深夜在线观看| 久久国产综合精品| 日韩av一二三| 亚洲一二三区在线观看| 中文字幕日韩精品一区| 欧美tk丨vk视频| 欧美人与性动xxxx| 欧美在线不卡视频| 一本大道综合伊人精品热热| 丁香啪啪综合成人亚洲小说| 国产综合色在线| 黄一区二区三区| 极品瑜伽女神91| 久久99国内精品| 激情都市一区二区| 国产一区二区美女诱惑| 精品亚洲成a人在线观看| 奇米色一区二区| 美女一区二区久久| 久久精品国产亚洲一区二区三区| 日韩精品亚洲一区| 免费精品99久久国产综合精品| 亚洲成人免费在线观看| 天涯成人国产亚洲精品一区av| 亚洲一区二区美女| 丝袜亚洲精品中文字幕一区| 午夜精品久久久久| 亚洲国产欧美在线人成| 日韩中文字幕一区二区三区| 日韩精品国产精品| 蜜桃视频第一区免费观看| 蜜桃91丨九色丨蝌蚪91桃色| 毛片av一区二区三区| 韩国精品在线观看| 成人国产精品免费网站| 色综合av在线| 欧美日韩成人一区| 欧美一级视频精品观看| 久久噜噜亚洲综合| 国产精品美女久久久久aⅴ| 国产亚洲精品aa午夜观看| 中文字幕第一区二区| 亚洲激情欧美激情| 日本欧美一区二区在线观看| 国产精品亚洲专一区二区三区| 国产伦精品一区二区三区视频青涩| 风间由美一区二区三区在线观看| 波多野结衣91| 欧美另类高清zo欧美| 久久午夜羞羞影院免费观看| 国产精品国产自产拍高清av王其 | √…a在线天堂一区| 亚洲一区二区三区小说| 琪琪久久久久日韩精品| 成人精品小蝌蚪| 69p69国产精品| 国产蜜臀av在线一区二区三区| 一区二区三区电影在线播| 精品中文字幕一区二区| 一本色道久久综合精品竹菊| 欧美系列在线观看| 国产丝袜美腿一区二区三区| 午夜精品一区二区三区三上悠亚| 激情文学综合插| 91福利精品视频| 国产性天天综合网| 日韩中文字幕区一区有砖一区| 成人av在线影院| 欧美大黄免费观看| 亚洲一区二区3| 成人精品鲁一区一区二区| 91精品国产综合久久福利 | 蜜桃精品视频在线| 成人aaaa免费全部观看| 日韩欧美一区二区在线视频| 中文字幕一区二区三区不卡| 国产一区二区按摩在线观看| 欧美日韩国产一二三| 日韩理论片一区二区| 国产成人精品影视| 日韩色在线观看| 亚洲va欧美va天堂v国产综合| aaa亚洲精品| 欧美国产日本韩| 国产一区二区91| 26uuu欧美| 麻豆国产精品777777在线| 欧美日韩黄视频| 一区二区三区美女| 一本色道亚洲精品aⅴ| 亚洲欧美在线另类| 99视频国产精品| 中文字幕一区av| 97精品视频在线观看自产线路二| 国产精品免费久久| 粉嫩aⅴ一区二区三区四区| 国产亚洲欧美一区在线观看| 国产一本一道久久香蕉| 日韩一区二区不卡| 精品一区二区三区欧美| 欧美精品一区二区不卡| 国内精品免费在线观看| 欧美mv日韩mv国产网站app| 蜜臀av性久久久久蜜臀av麻豆| 欧美一区二区三区喷汁尤物| 蜜桃视频在线观看一区二区| 精品国产91乱码一区二区三区| 国内成人精品2018免费看| 久久网站最新地址| 国产精品1区2区| 国产精品午夜电影| 91在线观看视频| 亚洲一卡二卡三卡四卡无卡久久 | 成人av一区二区三区| 亚洲欧洲一区二区在线播放| 色噜噜久久综合| 热久久国产精品| 国产色综合久久| 欧美影视一区在线| 久久精品国产色蜜蜜麻豆| 欧美激情艳妇裸体舞| 99精品欧美一区二区三区综合在线| 亚洲六月丁香色婷婷综合久久 | 国产欧美va欧美不卡在线| 99久久免费精品高清特色大片| 一区二区视频在线看| 日韩亚洲欧美一区二区三区| 国产成人在线影院 | 久久毛片高清国产| 91麻豆swag| 麻豆国产91在线播放| 亚洲欧洲性图库| 91精品国产aⅴ一区二区| 成人avav影音| 日本一区中文字幕 | 欧美国产日韩在线观看| 欧美日韩国产色站一区二区三区| 精品一区二区在线视频| 亚洲综合视频在线| 久久综合久久综合久久| 色综合久久中文字幕| 久久99久国产精品黄毛片色诱| 亚洲另类春色校园小说| 精品99久久久久久| 欧美三级日韩在线| 91啪亚洲精品| 成人深夜视频在线观看| 激情五月婷婷综合网| 日本午夜精品一区二区三区电影| 亚洲色图欧美激情| 国产午夜精品福利| 日韩精品专区在线影院观看 | www.日韩在线| 久久99精品久久久久久动态图 | 亚洲国产成人高清精品| 国产精品入口麻豆原神| 久久精品一区二区三区不卡| 日韩三级视频中文字幕| 7777女厕盗摄久久久| 欧美色爱综合网| 色婷婷av一区二区| 色偷偷88欧美精品久久久|