<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟

        AIGC動態1年前 (2024)發布 量子位
        388 0 0

        只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟

        AIGC動態歡迎閱讀

        原標題:只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟
        關鍵字:模型,張量,梯度,函數,性能
        文章來源:量子位
        內容字數:0字

        內容摘要:


        克雷西 發自 凹非寺量子位 | 公眾號 QbitAI只需激活60%的參數,就能實現與全激活稠密模型相當的性能。
        微軟亞洲研究院的一項新研究,實現了模型的完全稀疏激活,讓推理成本大幅下降。
        而且適用范圍廣泛,無論是從頭訓練、繼續訓練還是微調,都能提供有效支持。
        該方法名為Q-Sparse,在神經元級別上實現了模型稀疏化,相比于其他方式粒度更細,在相同推理開銷下,無論性能還是稀疏率都更好。
        名稱之中,Q指的是量化(Quantization),意味著它除了普通模型之外,也兼容量化技術,適用于各種量化方式的模型。
        作者進一步表示,如果把Q-Sparse與模型量化技術結合,還可以實現更大程度的降本增效。
        另外在研究Q-Sparse的同時,團隊也對參數規模、稀疏率和模型性能三者之間的關系進行了深入探尋,并發現了適用于模型推理優化的“Scaling Law”。
        有網友認為,這項技術確實不錯,而且比ReLU要更好。
        還有人開啟了許愿模式,表示如果(AMD的)ROCm能比英偉達更快支持這項技術就好了。
        用Top-K函數實現稀疏化Q-Sparse所做的最核心的操作,是對輸入的張量應用Top-K稀疏化函數。


        原文鏈接:只激活3.8B參數,性能比肩同款7B模型!訓練微調都能用,來自微軟

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 美女视频黄频a免费大全视频| 亚洲午夜无码久久| 很黄很污的网站免费| 亚洲精品你懂的在线观看| 一级特级女人18毛片免费视频| 亚洲国产一区二区三区| 成人a毛片免费视频观看| 亚洲女初尝黑人巨高清| 在线看片免费人成视频播| 亚洲AV无码一区东京热| 最近免费mv在线电影| 亚洲日产2021三区| 成年女人喷潮毛片免费播放| 亚洲精品久久久久无码AV片软件| 国产美女被遭强高潮免费网站| 国产精品成人亚洲| 国产亚洲一区二区三区在线不卡 | 亚洲一区二区三区免费在线观看| 77777_亚洲午夜久久多人| 日本在线高清免费爱做网站| 亚洲精品无码久久久久YW| 又黄又爽的视频免费看| 国产一精品一AV一免费| 亚洲人6666成人观看| 国产亚洲福利一区二区免费看| 国产成人精品免费大全| 久久久久亚洲精品日久生情| 国产成人免费在线| 亚洲aⅴ无码专区在线观看春色 | 亚洲高清在线视频| 国产精品成人免费福利| 久久亚洲AV成人无码国产电影| 中文字幕亚洲一区| www视频在线观看免费| 亚洲成a人无码亚洲成av无码| 亚洲综合伊人久久综合| 国产成人精品免费视频大全麻豆 | 亚洲午夜精品第一区二区8050| 无码国产精品一区二区免费模式 | 亚洲欧美黑人猛交群| 亚洲啪啪AV无码片|