<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        AIGC動態(tài)1年前 (2023)發(fā)布 量子位
        672 0 0

        預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        關(guān)鍵字:模型,步驟,小羊,算法,作者

        文章來源:量子位

        內(nèi)容字?jǐn)?shù):4604字

        內(nèi)容摘要:豐色 發(fā)自 凹非寺量子位 | 公眾號QbitAI小羊駝團(tuán)隊的新研究火了。他們開發(fā)了一種新的解碼算法,可以讓模型預(yù)測100個token數(shù)的速度提高1.5-2.3倍,進(jìn)而加速LLM推理。比如這是同一個模型(LLaMa-2-Chat 7B)面對同一個用戶提問(蘇格拉底采用了哪些方法來挑戰(zhàn)他那個時代的主流思想?)時輸出回答的速度:左邊為原算法,耗時18.12s,每秒約35個token;右邊為該算法,耗時10.4s,每秒約60個token,明顯快了一大截。簡單來說,這是一種并行解碼算法,名叫“Lookahead Decoding”(前向解碼)。它主要利用雅可比(Jacobi)迭代法首次打破自回歸解碼中的順序依賴性(眾所周知,當(dāng)下大模型基本都是基于自回歸的Transformer)。由此無需草稿模型(draft model)或數(shù)據(jù)存儲,就可以減少解碼步驟,加速LLM推理。目前,作者已給出了與huggin…

        原文鏈接:點此閱讀原文:預(yù)測token速度翻番!Transformer新解碼算法火了,來自小羊駝團(tuán)隊|代碼已開源

        聯(lián)系作者

        文章來源:量子位

        作者微信:QbitAI

        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 夜夜亚洲天天久久| 亚洲精品白浆高清久久久久久| 亚洲精品综合久久中文字幕| 青青操视频在线免费观看| 亚洲欧洲久久久精品| 人妻无码中文字幕免费视频蜜桃| 成年丰满熟妇午夜免费视频| 亚洲av日韩av综合| 精品熟女少妇AV免费观看| 成人区精品一区二区不卡亚洲| 无码专区永久免费AV网站| 日本亚洲精品色婷婷在线影院| 啦啦啦中文在线观看电视剧免费版| 亚洲AV无码乱码在线观看代蜜桃| 永久免费毛片在线播放| 亚洲色中文字幕在线播放| 国产极品粉嫩泬免费观看 | 亚洲精品免费视频| 亚洲精品国产福利在线观看| 美女视频黄a视频全免费| 国产精品亚洲av色欲三区| 亚洲人午夜射精精品日韩| 大地资源中文在线观看免费版| 久久亚洲精品无码AV红樱桃| 一区二区无码免费视频网站 | 久久亚洲私人国产精品| 国产在线观看片a免费观看| 亚洲AV无码片一区二区三区| 亚洲无码黄色网址| 国产成人免费在线| 国产成人人综合亚洲欧美丁香花 | 国产精品色午夜视频免费看| 一区二区三区在线免费观看视频| 亚洲国产成人高清在线观看 | 99视频免费播放| 亚洲欧洲无卡二区视頻| 国产国拍亚洲精品福利| 久草福利资源网站免费| 亚洲欧美日韩自偷自拍| 亚洲综合无码精品一区二区三区| 中文字幕成人免费视频|