<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        單GPU就能壓縮模型,性能不變參數少25%!微軟提出模型稀疏化新方法

        AIGC動態1年前 (2024)發布 新智元
        539 0 0

        單GPU就能壓縮模型,性能不變參數少25%!微軟提出模型稀疏化新方法

        AIGC動態歡迎閱讀

        原標題:單GPU就能壓縮模型,性能不變參數少25%!微軟提出模型稀疏化新方法
        關鍵字:矩陣,模型,研究人員,區塊,正交
        文章來源:新智元
        內容字數:6562字

        內容摘要:


        新智元報道編輯:拉燕
        【新智元導讀】大語言模型之大,成本之高,讓模型的稀疏化變得至關重要。眾所周知,對于大語言模型來說,規模越大,所需的算力越大,自然占用的資源也就越多。
        研究人員于是乎把目光轉到了這片領域,即模型的稀疏化(Sparsification)。
        今天要介紹的SliceGPT,則可以實現模型的事后稀疏。也就是說,在一個模型訓練完了以后再進行稀疏化操作。
        該模型由微軟研究院和蘇黎世聯邦理工學院聯合發表在了arXiv上。
        目前主流的稀疏化技術面臨著挺多挑戰和困難。比方說,需要額外的數據結構,而且在當下的硬件條件下,速度有限。
        SliceGPT就能很好的解決這些問題——它能用一個較小的矩陣來替換每個權重矩陣,從而降低網絡的嵌入維度。
        而實際結果也是非常不錯的,在LLAMA-2 70B、OPT 66B和Phi-2模型上,SliceGPT去除了多達25%的模型參數,還保證了模型本身99%、99%以及90%的零樣本任務的性能。
        此外,SliceGPT還可以在更少的GPU上運行,無需額外的代碼優化。
        在24GB的消費級GPU上,SliceGPT可以將LLAMA-2 70B總的推理計算量減


        原文鏈接:單GPU就能壓縮模型,性能不變參數少25%!微軟提出模型稀疏化新方法

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 99精品视频在线观看免费| 亚洲色欲色欱wwW在线| 国产一级黄片儿免费看| 亚洲综合色在线观看亚洲| 一区二区三区免费视频观看| 亚洲精品WWW久久久久久 | 久久综合亚洲色HEZYO国产| 曰批全过程免费视频观看免费软件| 国产极品粉嫩泬免费观看| 亚洲国产精品成人一区| 女人18毛片特级一级免费视频 | 亚洲国产精品无码久久久久久曰| 免费国内精品久久久久影院| 亚洲?V无码乱码国产精品| 免费一区二区三区四区五区| 久久亚洲中文字幕无码| 色欲aⅴ亚洲情无码AV| a在线视频免费观看| 免费下载成人电影| 无码免费午夜福利片在线| 久久久国产精品无码免费专区| ww4545四虎永久免费地址| 女人被男人桶得好爽免费视频| 7x7x7x免费在线观看| 亚洲成无码人在线观看| 亚洲中文无码卡通动漫野外| 一级女性全黄生活片免费看| 色老头永久免费网站| 亚洲VA中文字幕无码一二三区 | 亚洲激情电影在线| 国产特黄特色的大片观看免费视频| 色se01短视频永久免费| 亚洲爆乳无码一区二区三区| 亚洲丁香婷婷综合久久| 成人自慰女黄网站免费大全| www亚洲一级视频com| 亚洲精品国产高清在线观看| 国产免费伦精品一区二区三区| 日本人护士免费xxxx视频| 亚洲国产精品久久久天堂| 亚洲国产片在线观看|