国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

1-bit大模型還能再突破!新一代BitNet架構啟用4位激活值

AIGC動態1年前 (2024)發布 新智元
400 0 0

新智元報道編輯:alan【新智元導讀】近日,BitNet系列的原班人馬推出了新一代架構:BitNet a4.8,為1 bit大模型啟用了4位激活值,支持3 bit KV cache,效率再突破。量化到1 bit的LLM還能再突破?這次,他們對激活值下手了!近日,BitNet系列的原班人馬推出了新一代架構:BitNet a4.8,為1 bit大模型啟用了4位激活值:論文地址:https://arxiv.org/pdf/2411.04965眾所周知,激活值量化通常是比較難辦的。本次的BitNet a4.8采用混合量化和稀疏化策略,來減輕異常通道引入的量化誤差。簡單來說就是,對注意力層和FFN層的輸入采用4位量化,同時用8位整數稀疏化中間狀態。大量實驗表明,BitNet a4.8在相同的訓練成本下,實現了與前代BitNet b1.58相當的性能,同時因為可以吃到4位(INT4/FP4)內核的計算紅利,實現了更快的推理速度。BitNet a4.8僅激活55%的參數,并支持3 bit KV cache,進一步提升了大規模LLM部署和推理的效率。BitNet a4.8模型架構模型的整體架構如圖1所示,BitNet a4.8采用了與BitNet b1.58相同的布局。作者使用BitLinear替換注意力(MHA)和前饋網絡(FFN)中的線性投影,以從頭開始學習1.58 bit權重。對于激活值,采用混合量化和稀疏化策略來減輕異常值維度引入的誤差。圖2說明了模型大小為7B的BitNet b1.58中,每個模塊輸入的分布。注意力層和FFN層的輸入通常類似高斯分布,而在FFN下采樣之前的激活值和注意力中的輸出投影中,發現了很多異常值通道和大量接近零的條目(全精度LLM也有類似觀察結果)。如圖3所示,直接將低位量化應用于這些中間狀態會引入很大的量化誤差。因此,作者使用Q-Sparse的稀疏化方法,將這些中間狀態保持在8位(同時消除了計算瓶頸)。對于自注意層的輸出投影,使用sparsify-then-quantize函數:兩個Q分別表示權重W和激活X的量化函數,M是掩碼,根據激活X的絕對值取topK,⊙是元素乘法。具體來說,權重量化和激活值量化函數可以表述為:對于FFN,這里采用squared ReLU和門控線性單元(GLU)來進一步提高激活的稀疏性:根據初步實驗的結果,使用squared ReLU時,下采樣輸入的稀疏性超過了80%,且對性能的影響最小。此外,作者還觀察到gate + squared ReLU的輸出也表現出高激活稀疏性(7B模型為67.5%)。通過首先計算gate projection,然后僅在非零通道上執行up projection,可以進一步減少推理的計算量。相比之下,attention和FFN的輸入中包含的異常值特征要少得多,可以使用absmean函數將激活值量化為4位整數:模型訓練初始化BitNet a4.8使用BitNet b1.58的權重開始訓練,分為W1.58A8與W1.58A4兩階段。第一階段使用8位激活和GLU + squared ReLU訓練模型;第二階段采用上面介紹過的混合量化和稀疏化。BitNet a4.8只需少量訓練,即可快速適應4bit位寬和稀疏激活,同時性能損失可以忽略不計。梯度近似作者使用直通估計器(STE)對BitNet a4.8進行梯度逼近,使用混合精度訓練來更新參數。這里直接繞過了不可微函數,包括反向傳播過程中的量化函數和topK稀疏函數。對于混合精度訓練,保持全精度latent weight來累積參數更新。模型量化浮點量化提供了比基于整數的量化更寬的動態范圍,這對于處理激活值的長尾分布至關重要。研究人員將FFN下采樣層的輸入保留為8位整數,其他激活值使用MinMax量化器量化為FP4:公式中E和M分別表示指數和尾數部分的位寬。這里采用E2M1格式,因為它的動態范圍更大。實驗本文將BitNet a4.8、BitNet b1.58,以及各種參數量大小的FP16精度LLaMA進行了比較。其中的1.58 bit模型,遵循BitNet b1.58的訓練方案,采用了兩階段權重衰減和學習率調度。所有模型都使用RedPajama數據集中的100B token進行訓練,以確保公平比較。對于BitNet a4.8,作者首先使用95B token來訓練8位激活值的模型。然后重用優化器狀態,并使用5B token進行混合量化和稀疏化的訓練。實驗將topK設置為50%(attention的輸出投影位置)。作者使用lm-evaluation-harness工具包,評估模型在一系列語言任務上的zero-shot準確性,包括ARC-Easy(ARCe)、ARCChallenge(ARCc)、Hellaswag(HS)、Winogrande(WGe)和PIQA(PQ)。另外還測試了在C4數據集(測試集)上的困惑度。主要結果表1總結了BitNet a4.8、BitNet b1.58和FP16 LLaMA的詳細測試結果。全精度(FP16)LLaMA和BitNet b1.58之間的性能差距,隨著模型大小的增長而縮小。對于7B模型,BitNet b1.58在語言模型困惑度和任務的平均準確性方面與LLaMA相當。此外,相比于BitNet b1.58,BitNet a4.8的平均精度幾乎沒有損失。表2展示了各種大小的BitNet a4.8、BitNet b1.58 和 FP16 LLaMA中每個模塊的詳細稀疏性(使用C4驗證集上的非嵌入參數計算)。值得注意的是,BitNet a4.8的稀疏性明顯高于BitNet b1.58和LLaMA。比如在7B模型中,BitNet a4.8的整體稀疏性達到了44.5%,只有3.4B的活躍參數。down projection層的輸入顯示出特別高的稀疏性,且中間狀態分布以零為中心。此外,gate projection的輸出非常稀疏,導致了up projection的高稀疏性(因為只需要在從Gate中選擇非零通道來執行投影)。具體來說,對于7B BitNet a4.8,Gate和up projection的稀疏率分別為67.5%和12.0%。表3顯示了BitNet a4.8在3B和7B模型大小下,low-bit attention的詳細情況。模型使用4位KV或QKV頭,精度損失可忽略不計,同時KV cache可以量化為3位整數。low-bit attention對于高效的長序列建模至關重要,它減少了KV cache的內存占用和IO,并加速了注意力計算。在本文的實驗中,作者采用RoPE后量化。使用absmax函數將QKV頭直接量化為無符號整數,無需任何校準數據集。對于3 bit KV量化,研究人員將bos token的頭保留為4 bit,因為它包含更多的異常值特征。消融實驗圖4顯示了700M BitNet a4.8的訓練損耗曲線,比較了使用完整的INT4/FP4量化,以及本文的混合量化和稀疏化。完整的INT4量化會導致發散,而混合架構在訓練困惑度方面明顯優于完整的FP4架構。使用RedPajama數據集中25B token,來進行模型的第一階段訓練,采用absmean和MinMax量化器分別進行完整的INT4和FP4量化。對于完整的INT4量化,由于其輸入具有更大的異常值,這里設置β = 2*mean(|X|)。接下來為1.3B BitNet a4.8的down projection層輸入,設置不同的量化或激活函數。所有模型都使用RedPajama數據集中的50B token進行第一階段訓練。為了確保公平比較,其他激活值都保留在8位。圖5顯示了這些模型的訓練損失曲線。Squared ReLU的訓練困惑度比Swish略好,同時實現了更高的稀疏性。此外,對down projection的輸入應用FP4量化會導致性能顯著下降,而將INT4激活與STE一起使用會導致發散。參考資料:https://arxiv.org/abs/2411.04965https://venturebeat.com/ai/how-microsofts-next-gen-bitnet-architecture-is-turbocharging-llm-efficiency/

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        日本二三区不卡| 天天爽夜夜爽视频| 欧洲杯半决赛直播| 狠狠综合久久av一区二区小说 | 一区二区三区在线免费播放| 国产精品久久久久99| 精品成人av一区二区三区| 秋霞午夜av一区二区三区| 亚洲人永久免费| 爱情岛论坛vip永久入口| 日韩电影在线免费| 国产亚洲美女精品久久久| 日日碰狠狠躁久久躁婷婷| xxxx国产视频| 成人写真视频| 日韩一区二区三区在线视频| 国产亚洲综合久久| 国产视频一区二区视频| 日韩精彩视频在线观看| 日韩在线欧美在线| 精品人妻二区中文字幕| 成人vr资源| 亚洲二区在线播放视频| 国产九九在线观看| 国产成人精品在线看| 精品乱人伦一区二区三区| 国产一区二区在线视频播放| 天堂成人免费av电影一区| 91爱爱小视频k| 欧美经典一区| 99久久久久久| 国产在线观看一区| 亚洲区综合中文字幕日日| 久久精品国产99国产精品澳门| 人妻av一区二区| 一区二区三区导航| 欧美精品久久一区二区| 视频一区二区三| 久久一二三四| 91免费电影网站| 北岛玲一区二区| 亚洲国产精品麻豆| 国产午夜福利在线播放| 成人精品一区二区三区四区| 国产一区二区三区四区五区入口 | 国产精品香蕉国产| 久久久久久久人妻无码中文字幕爆| 中文字幕一区二区视频| 国产视频九色蝌蚪| 亚洲品质自拍视频| 999精品视频在线| 亚洲一区二区三区国产| av免费网站观看| 洋洋成人永久网站入口| 亚洲欧美手机在线| 欧美天堂亚洲电影院在线播放| 国产成人精品网站| 香蕉久久a毛片| 精品日韩美女| 97精品超碰一区二区三区| 精品一区二区三区毛片| |精品福利一区二区三区| 99国产精品久久久久老师| 青青草国产成人av片免费| 日韩亚洲在线观看| 日韩精品第一区| 亚洲自拍偷拍第一页| 六月婷婷色综合| 亚洲精品v日韩精品| 中文字幕国产高清| 日韩亚洲欧美高清| 妖精视频一区二区三区| 日本欧美在线视频| 精品三级av| 国产精品免费一区豆花| 国产一区二区三区观看| av7777777| 在线观看日韩国产| 伊人久久噜噜噜躁狠狠躁| 国产97在线播放| 激情丁香综合五月| 一区二区三区 日韩| 精品99999| 亚洲国产一区二区三区在线播放| 国产精品视频500部| 国产精品国产精品国产专区不片| 在线不卡av电影| 91av在线精品| 99久久99久久精品国产片果冻| 国产福利一区视频| 精品国产伦一区二区三区观看方式| 亚洲精品播放| 精品国产免费人成电影在线观...| 久久综合五月天婷婷伊人| 亚洲精品一区二区三区精华液| 深爱激情综合网| 欧美美最猛性xxxxxx| 成人午夜电影网站| 国产sm调教视频| 91精品国产综合久久男男| 国产人成一区二区三区影院| 日本一区二区视频在线播放| 奇米4444一区二区三区 | 午夜在线一区二区| 国产精品第3页| 亚洲视频精选在线| 亚洲一区二区三区日本久久九| 久久婷婷开心| 欧美精品一区二区三区蜜臀| 男女精品视频| 国产夫妻性爱视频| 99蜜桃在线观看免费视频网站| 亚洲一卡二卡三卡四卡| 日韩国产一区| 亚洲小视频网站| 国产精品亚洲网站| 欧美日韩国产影院| 亚洲网色网站| 欧美成人精品一区二区综合免费| 日本中文字幕成人| 精品国产福利视频| 国产精品日本| 战狼4完整免费观看在线播放版| 欧美精品123| 亚洲奶大毛多的老太婆| 久久蜜桃香蕉精品一区二区三区| 一本色道久久综合亚洲精品酒店| 欧美成人精品欧美一级乱| 色狠狠一区二区| 99精品久久久| 成年人午夜视频在线观看| 欧美福利小视频| 午夜电影一区二区三区| 欧美无人区码suv| 日韩视频在线播放| 色婷婷综合成人| 欧美日韩国产丝袜另类| 蜜桃av一区二区| 波多野结衣免费观看| 国产成人精品免费视频大全最热| 亚洲精品国产成人| 中文字幕一区二区不卡| 欧美阿v一级看视频| 美国黄色特级片| 亚洲影院污污.| 成人免费毛片嘿嘿连载视频| 日本大胆欧美| 日韩三级久久久| 手机在线成人免费视频| 久久视频免费观看| 欧美在线影院一区二区| 国产亚洲综合色| 日本免费新一区视频| 日韩影视高清在线观看| av在线免费播放网址| 2020国产精品久久精品不卡| 亚洲图片欧洲图片av| 日本韩国精品一区二区在线观看| 99久久精品免费| 国产精品普通话对白| 久久不见久久见中文字幕免费| 青青草视频在线视频| 97久草视频| 2019亚洲日韩新视频| 亚洲色图在线观看| 欧美一级专区免费大片| 亚洲一区二区精品久久av| 日韩激情在线| 欧美sss在线视频| 国产传媒在线看| 中文字幕在线视频播放| 男女啪啪网站视频| 欧美精品久久96人妻无码| 日韩一区二区久久久| 精品久久免费看| 欧美日韩免费视频| 欧美三级日韩三级国产三级| 一区二区国产盗摄色噜噜| 久久精品人人做人人爽97| 成人午夜精品一区二区三区| 麻豆精品视频在线| 久久字幕精品一区| 日韩中文字幕麻豆| 日本美女一区二区| 麻豆国产欧美一区二区三区| 蜜桃视频免费观看一区| 日本在线不卡一区| 国内精品自线一区二区三区视频| 国产一区二区在线观看视频| 蜜臀av一区二区在线观看| 激情丁香综合五月| 国产成人福利片| 91视频观看免费| 日韩一区欧美小说| 亚洲男女自偷自拍| 美女在线视频一区| 在线精品国产| 国产一区二区三区成人欧美日韩在线观看| 激情婷婷欧美| 美女性感视频久久| 99久久综合狠狠综合久久| 91亚洲国产高清| 亚洲主播在线| 丁香六月久久综合狠狠色| 亚洲天天做日日做天天谢日日欢 | 1024日韩| 久久99精品久久久久久园产越南| 97精品视频在线看| 视频一区二区三区入口| 成人晚上爱看视频| 精品久久久视频| 亚洲国产欧美自拍| 高清在线视频日韩欧美| 国产伦精品一区二区三区在线 | 日本精品二区| 9久久婷婷国产综合精品性色 | 亚洲人人精品| 成人黄色大片在线观看 | 亚洲国产一区二区三区青草影视| 制服丝袜中文字幕一区| 久久综合久久88| 国产伦精品一区二区三区在线| 成年在线观看视频| 成年人免费观看视频网站| 精品国产一区一区二区三亚瑟| 国产67194| 欧美有码视频| 国产亚洲精品7777| 久久美女艺术照精彩视频福利播放 | 亚洲综合自拍偷拍| 国产亚洲精品美女久久久久| 亚洲一区二区中文| 91极品尤物在线播放国产| 99综合久久| 久久国产精品99久久人人澡| 亚洲精品午夜久久久| 影音先锋欧美精品| 裸模一区二区三区免费| 99热这里只有精品2| 日韩深夜影院| 国产午夜久久久久| 亚洲欧美中文在线视频| 欧美一级二级三级| 91精品久久久久久久久久久久| 综合久久99| 夜色激情一区二区| 国产精品国产自产拍高清av水多 | 精品剧情在线观看| 久久久一本精品99久久精品66| 国产老头和老头xxxx×| 中文字幕午夜精品一区二区三区| 国产欧美日韩一区二区三区在线观看 | 亚洲人成电影在线| 偷拍视频一区二区| 一区二区三区四区视频免费观看| 国产成人精品影院| 日韩在线免费av| 国产理论在线播放| 91精品综合| 色菇凉天天综合网| 97免费高清电视剧观看| 人妻少妇无码精品视频区| 久久99久久精品| 日韩国产欧美精品一区二区三区| 天堂社区 天堂综合网 天堂资源最新版 | 亚洲最大av| 日韩一区二区三区av| 亚洲欧美99| 亚洲综合福利| 一本到不卡免费一区二区| 欧美日韩一区三区四区| 色播亚洲视频在线观看| 国产精品一区免费在线| 亚洲卡通欧美制服中文| 亚洲一区二区日本| 欧美变态另类刺激| 日韩网站在线| 日日狠狠久久偷偷四色综合免费 | 激情视频小说图片| 一区二区三区四区在线观看国产日韩| 欧美性色黄大片| 国内精品久久久| 18精品爽国产三级网站| 欧美激情在线观看视频免费| 国产欧洲精品视频| 日韩精品视频中文字幕| 舔着乳尖日韩一区| 91成人在线视频观看| 91视频免费在观看| 亚洲品质自拍视频| 久久久一本精品99久久精品66| 日韩黄色网络| 亚洲第一中文字幕| 日本黄色一级网站| 中文字幕+乱码+中文字幕一区| 91超碰在线免费观看| 久久国产激情视频| 91农村精品一区二区在线| 国产免费一区二区三区| 在线电影一区二区| 欧美成在线视频| 伊人久久大香线蕉综合影院首页| 欧美日韩国产一区二区三区| 成人区一区二区| 美国十次综合久久| 日韩精品中文字幕在线一区| 原创真实夫妻啪啪av| 日韩一区欧美小说| 欧美韩国日本在线| 91麻豆123| 性做爰过程免费播放| 国产激情一区二区三区| 亚洲美女福利视频网站| 手机毛片在线观看| 欧美日韩成人高清| 李丽珍裸体午夜理伦片| 91国产视频在线观看| 亚洲熟女一区二区三区| 午夜精品久久久| 国产黑丝在线视频| 奇米影视7777精品一区二区| 成人国产亚洲精品a区天堂华泰| 亚洲激情中文在线| 国产中文字幕日韩| 母乳一区在线观看| 欧美日韩一区在线观看视频| 国产精品一卡二卡| 亚洲一区二区三区加勒比 | 日韩欧美卡一卡二| 精品国产亚洲日本| 欧美精品第一页在线播放| 欧美美乳视频| 亚洲xxxx在线| 国产毛片精品国产一区二区三区| 日韩精品不卡| 欧美激情资源网| 日韩av福利在线观看| 欧美区一区二区三区| 午夜激情视频在线播放| 日韩在线观看成人| 亚洲影视一区| 国产精品二区在线| 久久女同性恋中文字幕| 天天干天天av| 亚洲激情 国产| 成人情趣视频| 国内精品二区| 午夜精品国产| 一区二区三区四区久久| 国产精品久久影院| 伊人久久大香线蕉综合75| 国产精品久久久久久久裸模| 韩国三级hd两男一女| 在线成人激情视频| 欧美日一区二区三区在线观看国产免| 国产91视觉| 亚洲小说欧美激情另类| 91免费国产精品| 欧美影院精品一区| 天堂网av成人| 欧美日韩高清在线一区| 尤物在线观看一区| 51vv免费精品视频一区二区| 成人精品在线视频| 国产精品久久久久久久久久久免费看| 在线观看亚洲大片短视频| 欧美性欧美巨大黑白大战| 国产九一精品| 成人手机视频在线| 日韩欧美国产不卡| 欧美激情在线| 97在线免费公开视频| 在线a欧美视频| 久久精品国产久精国产| 在线观看免费视频国产| 97超碰蝌蚪网人人做人人爽 | 免费观看中文字幕| 欧美一级精品大片| 日韩在线一二三区| 精品国产乱码久久久久久1区二区| 正在播放欧美视频| 国产成人综合自拍| 欧美成人久久久免费播放| 成人黄色av播放免费| 精品久久久久久久久久久久 | 国产国语videosex另类| 一二三区精品福利视频| 九九热爱视频精品视频| 日韩网站在线免费观看| 中文字幕亚洲一区二区三区五十路| 韩国精品久久久| 天天操夜夜操av| 中文字幕日韩一区二区三区不卡| 精品国产百合女同互慰| 国产成人午夜99999| 国产精品3区| 成熟了的熟妇毛茸茸| 久久久噜噜噜久久久| 亚洲一级在线观看| aa国产精品|