<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        匿名論文提出奇招!增強大模型長文本能力居然還能這么做

        AIGC動態2年前 (2024)發布 量子位
        402 0 0

        匿名論文提出奇招!增強大模型長文本能力居然還能這么做

        AIGC動態歡迎閱讀

        原標題:匿名論文提出奇招!增強大模型文本能力居然還能這么做
        關鍵字:文本,模型,上下文,模塊,作者
        文章來源:量子位
        內容字數:5062字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI一提到提高大模型長文本能力,就想到長度外推或者上下文窗口擴展?
        不行,這些都太費硬件資源了。
        來看一個奇妙新解:
        和長度外推等方法使用KV緩存的本質不同,它用模型的參數來存儲大量上下文信息。
        具體辦法就是建一個臨時Lora模塊,讓它僅在長文本生成過程中“流式更新”,也就是用先前生成的內容不斷作為輸入來充當訓練數據,以此保證知識被存進模型參數中。
        然后一旦推理完成,就丟掉它,保證不對模型參數產生長久影響。
        這個方法可以讓我們不用擴展上下文窗口的同時,隨便存儲上下文信息,想存多少存多少。
        實驗證明,這種方法:
        既可以顯著提高模型長文本任務質量,實現困惑度下降29.6%,長文本翻譯質量(BLUE得分)提高53.2%;
        還能兼容并增強現有大多數長文本生成方法。
        最重要的是,能大大降低計算成本。
        在保證生成質量小幅提升(困惑度降低3.8%)的同時,推理所需的FLOPs降低70.5%、延遲降低51.5%!
        具體情況,我們翻開論文來看。
        建個臨時Lora模塊用完即丟該方法名叫Temp-Lora,架構圖如下:
        其核心就是以自回歸的方式用先前生成的文本上


        原文鏈接:匿名論文提出奇招!增強大模型長文本能力居然還能這么做

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费国产a理论片| 亚洲另类春色国产精品| 亚洲AV综合色区无码二区爱AV| 国产成人精品无码免费看| 国产日产亚洲系列| 色播在线永久免费视频网站| 亚洲日韩乱码中文无码蜜桃臀网站| 国产99精品一区二区三区免费| 综合久久久久久中文字幕亚洲国产国产综合一区首| 蜜臀亚洲AV无码精品国产午夜.| 成人黄页网站免费观看大全| 亚洲精品国产精品国自产网站 | 亚洲日韩在线观看免费视频| 久久乐国产精品亚洲综合| 内射干少妇亚洲69XXX| 久久精品成人免费观看| 亚洲免费视频在线观看| 妻子5免费完整高清电视| 国产AV旡码专区亚洲AV苍井空| 日本高清免费中文字幕不卡| 亚洲精品字幕在线观看| 色欲A∨无码蜜臀AV免费播 | 亚洲AV无码国产精品麻豆天美| 国产一区二区免费视频| 亚洲国产美女在线观看| 精品国产精品久久一区免费式| 一边摸一边爽一边叫床免费视频| 成熟女人特级毛片www免费| 精品亚洲av无码一区二区柚蜜| 亚洲日本韩国在线| jizzjizz亚洲日本少妇| 国产午夜亚洲不卡| 亚洲无砖砖区免费| 黄网站色视频免费看无下截| 亚洲成在人线av| 在线观看成人免费| 久久www免费人成看国产片| 亚洲三级中文字幕| 国产精品亚洲高清一区二区| 久久国产免费福利永久| 全黄A免费一级毛片|