国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

把注意力計(jì)算丟給CPU，大模型解碼吞吐量提高1.76~4.99倍

AIGC動(dòng)態(tài)9個(gè)月前發(fā)布量子位

478 0 0

基于局部敏感哈希采樣技術(shù)

把注意力計(jì)算丟給CPU，大模型解碼吞吐量提高1.76~4.99倍

原標(biāo)題：把注意力計(jì)算丟給CPU，大模型解碼吞吐量提高1.76~4.99倍
文章來源：量子位
內(nèi)容字?jǐn)?shù)：5268字

MagicPIG: 緩解大語言模型KV緩存壓力的創(chuàng)新方案

來自卡內(nèi)基梅隆大學(xué)、華盛頓大學(xué)和Meta AI的研究人員提出了一種名為MagicPIG的新方法，有效解決了大語言模型(LLM)推理過程中GPU內(nèi)存容量限制的問題，該問題主要由KV緩存的巨大內(nèi)存占用引起。

1. KV緩存瓶頸與現(xiàn)有方法的不足

1. 在長(zhǎng)上下文LLM推理中，KV緩存用于存儲(chǔ)中間注意力鍵和值，避免重復(fù)計(jì)算，但其內(nèi)存占用隨批量大小和序列長(zhǎng)度線性增長(zhǎng)，嚴(yán)重限制了GPU的批量處理能力。

2. 現(xiàn)有技術(shù)如TopK Attention、Quest、H2O和Loki等，試圖通過選擇注意力得分最高的子集來壓縮KV緩存，但這些方法存在精度損失的問題，尤其在需要高上下文利用率的復(fù)雜任務(wù)中，性能下降嚴(yán)重。

3. 研究人員觀察到注意力機(jī)制的三個(gè)關(guān)鍵特性，解釋了TopK方法的局限性：首個(gè)輸入token的隱藏狀態(tài)幾乎不隨輸入變化；鍵狀態(tài)的中心方向在不同輸入句子中保持穩(wěn)定；鍵狀態(tài)的中心與匯聚點(diǎn)token的鍵狀態(tài)幾乎相反。

2. MagicPIG的創(chuàng)新之處

1. **基于采樣而非搜索:** MagicPIG采用基于采樣的注意力估計(jì)方法，而非像TopK那樣搜索最高的鍵值對(duì)。這通過引入基礎(chǔ)分布信息，顯著提高了估計(jì)精度，并降低了估計(jì)誤差。

2. **局部敏感哈希(LSH)技術(shù):** MagicPIG利用LSH生成采樣概率，并結(jié)合重要性采樣技術(shù)，有效地從已知分布中抽取樣本，來估計(jì)未知分布的期望，從而降低估計(jì)方差。

3. **異構(gòu)計(jì)算:** MagicPIG將注意力計(jì)算和哈希表卸載到CPU上，充分利用CPU的內(nèi)存資源，降低了對(duì)GPU顯存的依賴。實(shí)驗(yàn)表明，這種方法等效地提升了CPU的內(nèi)存帶寬，在維持精度的情況下實(shí)現(xiàn)了高效的注意力計(jì)算。

3. 系統(tǒng)設(shè)計(jì)與實(shí)驗(yàn)結(jié)果

1. MagicPIG將LLM解碼分為四個(gè)部分：參數(shù)計(jì)算(GPU)、注意力計(jì)算(CPU)、隨機(jī)投影(GPU)和檢索(CPU)。這種任務(wù)分區(qū)有效地利用了CPU和GPU的優(yōu)勢(shì)。

2. 實(shí)驗(yàn)結(jié)果表明，MagicPIG在Llama-3.1-8B-Instruct模型上，相比于Quest，在檢索和推理任務(wù)中實(shí)現(xiàn)了更高的下游準(zhǔn)確率。同時(shí)，MagicPIG的解碼吞吐量提高了1.76~4.99倍。

4. 總結(jié)

MagicPIG通過巧妙地結(jié)合LSH采樣技術(shù)和異構(gòu)計(jì)算，有效緩解了LLM推理過程中的KV緩存壓力，在保證精度的同時(shí)大幅提升了推理速度和吞吐量。這項(xiàng)研究為降低LLM部署成本，探索異構(gòu)計(jì)算的可能性提供了新的思路。

聯(lián)系作者

文章來源：量子位
作者微信：
作者簡(jiǎn)介：追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

# AIGC動(dòng)態(tài)# AI模型CPU優(yōu)化 # CPU加速AI推理 # CPU大模型解碼 # 低功耗AI推理 # 大模型吞吐量提升

? 版權(quán)聲明

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。

蟬鏡AI數(shù)字人

相關(guān)文章

蟬鏡AI數(shù)字人

暫無評(píng)論

暫無評(píng)論...

打開我，進(jìn)入AI時(shí)代。
全面、高效的AI工具產(chǎn)品情報(bào)，發(fā)現(xiàn)和使用最酷的AI工具！
Ctrl + D 或 ? + D 收藏本站到瀏覽器書簽欄。

OpenI AI助手在線工具硅基流動(dòng)豆包 Trae 扣子Coze 即夢(mèng)繪蛙

Copyright ? 2025 OpenI 粵ICP備19001258號(hào)

粵公網(wǎng)安備 44011502001135號(hào) SiteMap XML

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

91福利在线看| 国产成+人+日韩+欧美+亚洲| 无吗不卡中文字幕| 91色porny在线视频| 亚洲女爱视频在线| 91久久精品一区二区三区| 悠悠色在线精品| 欧美电影在哪看比较好| 蜜桃视频在线观看一区| 日韩一区二区精品在线观看| 久久福利资源站| 中文字幕不卡的av| 欧洲色大大久久| 美女在线一区二区| 久久精品亚洲乱码伦伦中文 | 欧美二区乱c少妇| 久99久精品视频免费观看| 国产欧美一区二区精品婷婷 | 美女被吸乳得到大胸91| 久久精品日产第一区二区三区高清版 | 亚洲欧美日韩在线不卡| 色久优优欧美色久优优| 日韩在线观看一区二区| 精品久久久久久久久久久久包黑料| 国产一区不卡视频| 亚洲韩国一区二区三区| 国产亚洲一区字幕| 欧美人与禽zozo性伦| 国产麻豆一精品一av一免费| 亚洲一区二区三区爽爽爽爽爽 | 久久久噜噜噜久久人人看| 福利91精品一区二区三区| 亚洲福利一二三区| 国产精品午夜春色av| 欧美精品日韩一本| 91麻豆国产精品久久| 国产一区二区视频在线播放| 亚洲人吸女人奶水| 精品国产一区二区亚洲人成毛片| 日本道精品一区二区三区| 国产美女精品一区二区三区| 亚洲一二三四久久| 国产精品日日摸夜夜摸av| 欧美一级xxx| 欧美精品在线一区二区三区| 成人av资源网站| 国产乱人伦偷精品视频不卡 | 亚洲成va人在线观看| 国产精品女同一区二区三区| 欧美成人官网二区| 在线不卡欧美精品一区二区三区| 色偷偷久久人人79超碰人人澡| 国内不卡的二区三区中文字幕| 亚洲成人av电影在线| 一区二区三区免费网站| 国产精品毛片久久久久久| 精品国产91九色蝌蚪| 欧美第一区第二区| 欧美一区二区二区| 欧美一区二区三区在线看| 欧美色综合网站| 欧美体内she精高潮| 欧美体内she精高潮| 在线免费观看成人短视频| 成人免费视频一区二区| 国产91清纯白嫩初高中在线观看| 国产精品白丝av| 国产精品一品二品| 国产精品一区二区不卡| 成人av动漫在线| 色偷偷久久一区二区三区| 色婷婷亚洲精品| 欧美天堂一区二区三区| 3d动漫精品啪啪| 精品久久人人做人人爰| 久久亚洲二区三区| 欧美国产丝袜视频| 中文字幕日本乱码精品影院| 国产精品国产馆在线真实露脸 | 亚洲视频一区在线观看| 国产精品欧美久久久久无广告 | 欧美伊人精品成人久久综合97| 91精彩视频在线观看| 欧美人与性动xxxx| 精品国产精品一区二区夜夜嗨| 国产性做久久久久久| 中文字幕一区二区日韩精品绯色| 亚洲激情综合网| 免费成人av在线| 国产成人av电影在线观看| 99久久综合狠狠综合久久| 欧美视频一区在线| 337p亚洲精品色噜噜狠狠| 日韩欧美另类在线| 国产精品高潮久久久久无| 午夜私人影院久久久久| 国内精品久久久久影院色| 色婷婷亚洲婷婷| 精品理论电影在线观看| 一区二区三区精品| 国产美女精品一区二区三区| 欧美日韩三级视频| 中文字幕巨乱亚洲| 麻豆精品在线视频| 色综合久久综合中文综合网| 日韩你懂的在线播放| 亚洲欧美日韩国产综合在线| 蜜臂av日日欢夜夜爽一区| 成人激情免费视频| 精品少妇一区二区三区在线播放| 亚洲欧美激情一区二区| 国产一区二区三区四区五区美女| 欧美视频中文字幕| 亚洲三级在线看| 国产精品亚洲综合一区在线观看| 欧美区一区二区三区| 亚洲欧美视频一区| 99在线精品免费| 日本一区二区三区四区在线视频 | 久久久综合视频| 日本色综合中文字幕| 91麻豆自制传媒国产之光| 久久欧美一区二区| 精品中文字幕一区二区小辣椒| 在线观看av一区| 亚洲免费av观看| 91网站在线播放| 1000精品久久久久久久久| 国产91精品欧美| 欧美高清在线精品一区| 国产精品影视在线| 久久亚洲精华国产精华液 | 亚洲风情在线资源站| 色呦呦国产精品| 亚洲激情在线播放| 在线观看一区日韩| 亚洲一卡二卡三卡四卡五卡| 91一区二区在线观看| 亚洲色图自拍偷拍美腿丝袜制服诱惑麻豆| 国产剧情av麻豆香蕉精品| 日韩欧美成人一区二区| 喷水一区二区三区| 精品国产一区二区三区av性色| 久久精品99国产精品日本| 欧美一级二级三级乱码| 久久99久久精品| 久久精子c满五个校花| 粉嫩av一区二区三区在线播放| 国产欧美一区二区精品秋霞影院| 成人av影院在线| 一区二区三区四区国产精品| 欧美性受xxxx黑人xyx| 天天影视色香欲综合网老头| 91精品国产91久久久久久一区二区 | 成人黄色大片在线观看| 亚洲欧美在线观看| 色婷婷综合激情| 免费在线看成人av| 日本一区免费视频| 91麻豆精品秘密| 亚洲6080在线| 欧美一区三区四区| 国产乱国产乱300精品| 亚洲青青青在线视频| 3d成人动漫网站| 国产激情一区二区三区四区| 亚洲欧美偷拍另类a∨色屁股| 欧美日韩国产另类一区| 国精品**一区二区三区在线蜜桃| 国产精品久久久久久久第一福利| 91国产精品成人| 国产一区二区剧情av在线| 亚洲柠檬福利资源导航| 精品久久久久久久久久久久包黑料 | 肉色丝袜一区二区| 国产日韩高清在线| 欧美三级在线看| 国产**成人网毛片九色 | 成人黄色777网| 视频一区视频二区在线观看| 久久久久久久久岛国免费| av高清久久久| 经典三级视频一区| 亚洲在线免费播放| 久久久久久久免费视频了| 欧美影院午夜播放| 成人国产精品视频| 久久99在线观看| 香蕉久久一区二区不卡无毒影院| 国产亚洲精品aa| 欧美r级在线观看| 在线综合+亚洲+欧美中文字幕| 91在线看国产| 成人精品在线视频观看| 精品一区二区三区免费观看| 亚洲精品美腿丝袜| 国产嫩草影院久久久久| 久久五月婷婷丁香社区| 制服丝袜国产精品| 欧美精品777|