<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        標點符號成大模型訓練神器!KV緩存狂減一半,可處理400萬Tokens長序列,來自華為港大等 | 開源

        AIGC動態4個月前發布 量子位
        292 0 0

        適配各種backbone模型架構和各種大小

        標點符號成大模型訓練神器!KV緩存狂減一半,可處理400萬Tokens長序列,來自華為港大等 | 開源

        原標題:標點符號大模型訓練神器!KV緩存狂減一半,可處理400萬Tokens長序列,來自華為港大等 | 開源
        文章來源:量子位
        內容字數:5812字

        SepLLM:利用標點符號加速大模型訓練與推理

        來自華為、港大、KAUST和馬普所的研究者提出了一種新穎的自然語言建模方法——SepLLM,通過巧妙利用標點符號(如逗號、句號等)來顯著加速大型語言模型的訓練和推理過程。該方法的核心在于發現標點符號在注意力得分中占據了不成比例的重要地位,這暗示著它們可以有效地壓縮其前后文本片段的信息。

        1. SepLLM的核心思想

        SepLLM的核心思想是將文本信息壓縮到標點符號中。研究者觀察到,注意力機制可視化結果顯示,標點符號周圍的注意力得分往往較高。因此,SepLLM將一段文本劃分成由標點符號分割的語義片段,并將其信息壓縮進相應的標點符號中,而其他tokens則被丟棄。這種方法基于以下幾個關鍵點:

        1. 初始tokens保留: 保留初始tokens,以避免生成tokens的困惑度(ppl)顯著增加。
        2. 分隔符tokens作為信息載體: 利用標點符號(分隔符tokens)壓縮其分割的文本片段信息,實現免訓練場景下的高效推理。
        3. 相鄰tokens考慮: 考慮到語言任務的局部依賴性,保留相鄰tokens以維持上下文連貫性。

        這種基于標點符號的建模方法,充分利用了自然語言固有的稀疏性,避免了人為定義稀疏性的局限性,使其成為一種更自然的、高效的建模方式。

        2. SepLLM的效率提升

        SepLLM在訓練和推理效率方面都取得了顯著提升:

        1. KV緩存減少: 基于Llama-3-8B模型,SepLLM在GSM8K和MMLU基準測試中減少了超過50%的KV緩存,同時保持了相當的性能表現。
        2. 流式處理能力增強: SepLLM能夠有效處理高達400萬甚至更多tokens的超長流式序列生成。
        3. 推理速度加快: SepLLM優化了推理過程,生成速度更快,困惑度更低,平均KV Cache使用量也減少。
        4. 訓練效率提升: 訓練過程FLOPs消耗更低,速度和吞吐率更高,預訓練時間縮短1.26倍,訓練吞吐率和加速比達到1.53倍。

        3. SepLLM的適用性和優勢

        SepLLM具有廣泛的適用性,可以適配各種backbone模型架構(Llama、Pythia、GPTNeoX、GPT2、Falcon等)和不同大小的模型,在各種場景下(免訓練、預訓練、后訓練)均能實現更高的效率和精度。與其他稀疏注意力方法相比,SepLLM根據原生語義動態劃分token數,在免訓練場景下取得了更好的準確率。

        4. 項目信息

        SepLLM的代碼庫已公開,支持高效的多節點分布式訓練,并采用了加速注意力機制的模塊Sep-Attention。項目地址:https://sepllm.github.io/ 論文地址:https://arxiv.org/abs/2412.12094 代碼:https://github.com/HKUDS/SepLLM


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 看成年女人免费午夜视频| 亚洲伊人久久大香线蕉| 亚洲精品成人a在线观看| 日本免费一区尤物| 国产在线19禁免费观看| 精品亚洲综合久久中文字幕| 久久久久亚洲AV无码专区首JN| 色噜噜亚洲男人的天堂| 日本特黄特色AAA大片免费| 免费无码又爽又刺激一高潮| 人禽杂交18禁网站免费| 亚洲国产精品一区二区三区久久| 亚洲精品tv久久久久久久久| 在线观看亚洲AV日韩A∨| yellow视频免费看| 午夜免费1000部| 亚洲第一黄片大全| 亚洲阿v天堂在线2017免费| 在线观看免费人成视频色9| 亚洲中文字幕无码不卡电影| 亚洲字幕在线观看| 99麻豆久久久国产精品免费| 国产精品色午夜视频免费看| 新最免费影视大全在线播放| 四虎永久在线精品免费网址| 亚洲av成本人无码网站| www.免费在线观看| 亚洲最大中文字幕无码网站| 好爽好紧好大的免费视频国产| 人体大胆做受免费视频| 亚洲成a人片77777kkkk| 日本h在线精品免费观看| 亚洲国产成人久久99精品| 日日AV拍夜夜添久久免费| 国产免费久久久久久无码| 亚洲成a人片在线观看日本麻豆| baoyu777永久免费视频 | 免费在线观看一级毛片| 色老板亚洲视频免在线观| xvideos亚洲永久网址| 亚洲国产精品嫩草影院|