<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        next-token被淘汰!Meta實測「多token」訓練方法,推理提速3倍,性能大漲10%+

        AIGC動態11個月前發布 新智元
        353 0 0

        next-token被淘汰!Meta實測「多token」訓練方法,推理提速3倍,性能大漲10%+

        AIGC動態歡迎閱讀

        原標題:next-token被淘汰!Meta實測「多token」訓練方法,推理提速3倍,性能大漲10%+
        關鍵字:模型,研究人員,任務,性能,方法
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:LRS
        【新智元導讀】研究人員提出了一種新的大型語言模型訓練方法,通過一次性預測多個未來tokens來提高樣本效率和模型性能,在代碼和自然語言生成任務上均表現出顯著優勢,且不會增加訓練時間,推理速度還能提升至三倍。當前,大型語言模型,例如GPT和Llama,主要是根據「前文的單詞序列」對「下一個token」進行預測的方式來訓練。
        但你有沒有想過一個問題,為什么不對后文的tokens同時進行預測呢?
        最近,Meta、巴黎高科路橋大學、巴黎薩克雷大學的研究人員就聯合提出了一種新的訓練方法,即一次性預測多個未來tokens,可以提高模型的樣本效率。論文鏈接:https://arxiv.org/pdf/2404.19737
        具體來說,在訓練語料庫的每一個位置,要求模型使用n個的輸出頭網絡來預測緊隨其后的n個token,其中所有輸出頭都基于同一個模型主干。
        研究人員將多token預測視作是一種輔助訓練任務,實驗發現該方法不僅能夠提升模型在各種下游任務上的表現,而且不會增加訓練時間,對代碼生成和自然語言生成任務都是有益的。
        隨著模型尺寸的增大,該方法的優勢變得更加明顯,尤其是


        原文鏈接:next-token被淘汰!Meta實測「多token」訓練方法,推理提速3倍,性能大漲10%+

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲黄页网在线观看| 亚洲视频在线一区| 精品亚洲成A人在线观看青青| 182tv免费视视频线路一二三 | 免费一看一级毛片| 国产精品亚洲精品日韩电影| 国产做床爱无遮挡免费视频| 麻豆安全免费网址入口| 四虎亚洲国产成人久久精品 | 99蜜桃在线观看免费视频网站| 亚洲爆乳无码专区| 一区二区三区在线免费看| 久久精品国产亚洲av高清漫画| 91久久成人免费| 亚洲熟女www一区二区三区| 国产乱子伦精品免费女| 一级毛片一级毛片免费毛片| 九月丁香婷婷亚洲综合色| 无码少妇精品一区二区免费动态| 亚洲精品mv在线观看| 成在人线AV无码免费| 无码免费又爽又高潮喷水的视频 | fc2成年免费共享视频18| 人人狠狠综合久久亚洲88| 亚洲成人免费在线| 亚洲国产成人手机在线观看| 亚洲AV网站在线观看| 免费无码黄网站在线看| 亚洲制服丝袜一区二区三区| 精品国产一区二区三区免费看| 一本一道dvd在线观看免费视频| 亚洲ⅴ国产v天堂a无码二区| 成人片黄网站A毛片免费| 日韩久久无码免费毛片软件| 亚洲今日精彩视频| 国产精品无码一区二区三区免费| 国产一级在线免费观看| 男人天堂2018亚洲男人天堂| 久久精品国产亚洲5555| 福利免费观看午夜体检区| 中文字幕无线码免费人妻|