<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        LeCun力薦!進化算法淘汰77%低質數據:RIP方法讓模型性能狂飆60%

        AIGC動態6個月前發布 新智元
        367 0 0

        LeCun力薦!進化算法淘汰77%低質數據:RIP方法讓模型性能狂飆60%

        原標題:LeCun力薦!進化算法淘汰77%低質數據:RIP方法讓模型性能狂飆60%
        文章來源:新智元
        內容字數:4289字

        Meta新方法RIP:進化算法賦能,提升大模型訓練數據質量

        近年來,大語言模型(LLM)的進步很大程度上依賴于高質量的訓練數據。然而,僅僅增加數據量并不能保證模型性能的提升,數據質量才是關鍵。Meta、UC伯克利、NYU等機構的研究者提出了一種名為拒絕指令偏好(RIP)的新方法,利用進化算法的思想,自動篩選并生成高質量的訓練數據集,從而顯著提升LLM的性能。

        1. RIP的核心思想:優勝劣汰

          RIP基于兩個核心假設:1. 低質量的提示詞(prompt)往往產生低質量的響應;2. 低質量的提示詞會產生差異更大的響應。RIP通過測量被拒絕響應的質量(m_1)、被拒絕響應的長度(m_2)以及被選擇和被拒絕響應之間的獎勵差距(m_3)來評估提示詞的質量。方差越小,獎勵差距越小,則提示詞質量越高。通過這種“優勝劣汰”機制,RIP可以有效地篩選出高質量的提示詞,構建更高質量的訓練數據集。

        2. RIP的應用:篩選和生成高質量數據

          RIP不僅可以用于篩選現有的訓練數據集,還可以用于生成高質量的合成數據集。Self-RIP方法利用少量高質量的種子提示詞,引導模型生成新的提示詞,并通過RIP進行篩選,從而迭代地構建高質量的合成數據集。這為缺乏高質量訓練數據的情況提供了一種有效的解決方案。

        3. 實驗結果:顯著性能提升

          在多個基準測試(AlpacaEval2、Arena-Hard、Wildbench)中,RIP都取得了顯著的性能提升。例如,在WildChat數據集上,RIP僅使用不到一半的訓練樣本,就實現了多個指標的顯著提升。在Llama 3.1-8B-Instruct和Llama 3.3-70B-Instruct模型上,RIP也顯著提升了模型性能,AlpacaEval2 LC勝率、Arena Hard勝率和WildBench分數均有大幅提高。Self-RIP方法也展現了其有效性,在AlpacaEval2、Arena-Hard和WildBench上均取得了不錯的成績。

        4. RIP的優勢與未來研究方向

          與其他篩選方法相比,RIP在所有基準測試中都取得了更高的分數,展現了其優越性。未來研究可以探索如何優化評估模型,降低RIP的計算成本,以及利用RIP進行安全性過濾,構建更安全可靠的LLM。

        總而言之,RIP方法為LLM的訓練提供了一種簡單而有效的新思路,通過進化算法的思想,自動篩選并生成高質量的數據集,顯著提升了LLM的性能。其在實際應用中的潛力巨大,值得進一步研究和探索。


        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲国产模特在线播放| 四虎永久免费地址在线网站| 亚洲伊人成无码综合网| 亚洲第一街区偷拍街拍| 女人张腿给男人桶视频免费版 | 伊人免费在线观看| 国产亚洲午夜高清国产拍精品 | 亚洲人成在线播放网站| 老司机精品免费视频| 国产成人亚洲精品青草天美| 最近的2019免费中文字幕| 久久亚洲精品中文字幕无码 | 成人毛片免费观看视频在线 | 亚洲精品无码久久千人斩| 成在线人视频免费视频| 亚洲国产精品嫩草影院在线观看 | 亚洲欧洲自拍拍偷精品 美利坚| 人人公开免费超级碰碰碰视频| 亚洲乱码中文字幕综合234| 免费毛片在线看不用播放器| 亚洲高清日韩精品第一区| 国产免费不卡v片在线观看| 国产精品亚洲综合久久| 免费v片在线观看无遮挡| 国产99久久久久久免费看| 亚洲天堂久久精品| 成年午夜视频免费观看视频| 黄色片网站在线免费观看| 亚洲AV中文无码乱人伦下载 | 精品免费久久久久久久| 亚洲精品又粗又大又爽A片| 亚洲视频一区二区| 全部免费毛片在线播放| 亚洲视频无码高清在线| 亚洲综合国产精品第一页| 18禁无遮挡无码国产免费网站| 亚洲av成本人无码网站| 久久久青草青青亚洲国产免观| 99久久免费国产精品特黄| 精品免费久久久久国产一区| 亚洲日本va在线观看|