<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型訓練開銷還能更小!微軟推出首個FP4訓練框架,訓練效果與BF16相當

        AIGC動態(tài)7個月前發(fā)布 量子位
        361 0 0

        中科大博士生一作

        大模型訓練開銷還能更??!微軟推出首個FP4訓練框架,訓練效果與BF16相當

        原標題:大模型訓練開銷還能更小!微軟推出首個FP4訓練框架,訓練效果與BF16相當
        文章來源:量子位
        內(nèi)容字數(shù):3919字

        微軟研究院發(fā)布FP4精度大模型訓練框架

        微軟亞洲研究院和SIGMA團隊近日發(fā)布了首個FP4精度的大模型訓練框架,該框架在相同超參數(shù)設(shè)置下,能達到與FP8和BF16相當?shù)挠柧毿Ч@著降低了存儲和計算資源需求。此框架最高可訓練130億參數(shù)規(guī)模、千億級別Tokens的模型。

        1. 突破性進展:FP4精度訓練

        該框架通過在FP8的TensorCore上模擬FP4精度實現(xiàn),而非使用真正的FP4硬件(目前尚未有原生支持FP4的硬件)。即便如此,該框架在1.3B、7B和13B的LLaMA模型訓練中,損失曲線與BF16基本一致,下游任務(wù)表現(xiàn)也相當。網(wǎng)友評論認為,這將是游戲規(guī)則的改變者,并預測此發(fā)現(xiàn)可能影響英偉達股價。

        2. 技術(shù)細節(jié):定制化FP4矩陣乘法內(nèi)核

        框架采用E2M1的FP4格式(2位指數(shù),1位尾數(shù),1位符號位),契合主流ML加速芯片設(shè)計。權(quán)重矩陣和激活矩陣分別采用列方向和行方向的量化策略,最大化FP4在矩陣乘法中的加速效果,避免額外矩陣轉(zhuǎn)置操作??蚣苁褂胹cale+shift方法進行逐層量化參數(shù)校準。

        3. 創(chuàng)新性解決方法:可微分梯度估計和離群點處理

        為了解決直接對量化矩陣求導導致梯度幾乎為零的問題,該框架提出了一種新穎的可微分梯度估計方法。在前向計算中使用硬量化保證效率,在反向傳播中使用連續(xù)可微函數(shù)擬合量化函數(shù),并計算梯度修正項。針對模型激活分布的長尾特征和離群點問題,框架采用“離群點削峰和補償”策略,先限幅離群點,再構(gòu)造稀疏補償矩陣。

        4. 混合精度設(shè)計:提升效率

        框架采用混合精度設(shè)計,在梯度通信時使用FP8,優(yōu)化器狀態(tài)存儲使用FP16,其他部分使用FP16,在保證數(shù)值穩(wěn)定性的前提下降低計算和存儲開銷。

        5. 團隊介紹

        該框架由微軟亞洲研究院和SIGMA團隊的華人研究人員打造,第一作者是中科大在讀博士生王瑞哲(Ruizhe Wang),通訊作者為微軟亞洲研究院的程鵬和龔業(yè)耘。中科大查正軍教授、微軟亞洲研究院郭百寧也參與了該項目。

        6. 總結(jié)

        微軟研究院的這項研究成果,通過巧妙的模擬和創(chuàng)新性算法,實現(xiàn)了FP4精度的大模型訓練,為降低大模型訓練成本提供了新的方向,并有望推動大模型訓練技術(shù)進一步發(fā)展。 論文已發(fā)表在arXiv上。


        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久精品国产亚洲沈樵| 亚洲s色大片在线观看| 亚洲人成网站999久久久综合| 8888四色奇米在线观看免费看| 亚洲av中文无码乱人伦在线r▽| 中文字幕不卡高清免费| 亚洲国产婷婷六月丁香| 免费播放在线日本感人片| 亚洲AV无码AV男人的天堂| 日韩在线不卡免费视频一区| aⅴ在线免费观看| 亚洲AV无码久久久久网站蜜桃| 日韩版码免费福利视频| 亚洲另类无码专区丝袜| 亚洲A∨午夜成人片精品网站| 白白色免费在线视频| 久久精品国产亚洲精品| 免费无码黄网站在线看| 亚洲视频在线观看网址| 毛片a级毛片免费播放100| 日韩毛片在线免费观看| 好看的亚洲黄色经典| 在线精品一卡乱码免费| 亚洲AV无码一区二区大桥未久| www国产亚洲精品久久久| a级大片免费观看| 亚洲国产高清视频在线观看| 免费无码又爽又刺激高潮 | 免费永久在线观看黄网站| 一级成人生活片免费看| 免费观看大片毛片| 一个人看的免费高清视频日本| 亚洲午夜久久影院| 成人永久免费高清| 高清永久免费观看| 久久乐国产综合亚洲精品| 国产成人亚洲精品影院| 日本三级2019在线观看免费| 无码日韩人妻AV一区免费l| 亚洲精品福利网泷泽萝拉| 国产免费人视频在线观看免费|