<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增

        AIGC動態1年前 (2024)發布 機器之心
        553 0 0

        大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增

        AIGC動態歡迎閱讀

        原標題:大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增
        關鍵字:模型,矩陣,剪裁,作者,網絡
        文章來源:機器之心
        內容字數:10504字

        內容摘要:


        機器之心報道
        編輯:張倩、佳琪刪除權重矩陣的一些行和列,讓 LLAMA-2 70B 的參數量減少 25%,模型還能保持 99% 的零樣本任務性能,同時計算效率大大提升。這就是微軟 SliceGPT 的威力。大型語言模型(LLM)通常擁有數十億的參數,用了數萬億 token 的數據進行訓練,這樣的模型訓練、部署成本都非常高。因此,人們經常用各種模型壓縮技術來減少它們的計算需求。
        一般來講,這些模型壓縮技術可以分為四類:蒸餾、張量分解(包括低秩因式分解)、剪枝和量化。其中,剪枝方法已經存在了一段時間,但許多方法需要在剪枝后進行恢復微調(RFT)以保持性能,這使得整個過程成本高昂且難以擴展。
        為了解決這一問題,來自蘇黎世聯邦理工學院、微軟的研究者提出了一個名為 SliceGPT 的方法。SliceGPT 的核心思想是刪除權重矩陣中的行和列來降低網絡的嵌入維數,同時保持模型性能。
        研究人員表示,有了 SliceGPT,他們只需幾個小時就能使用單個 GPU 壓縮大型模型,即使沒有 RFT,也能在生成和下游任務中保持有競爭力的性能。目前,該論文已經被 ICLR 2024 接收。論文標題:SLICE


        原文鏈接:大模型也能切片,微軟SliceGPT讓LLAMA-2計算效率大增

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 啦啦啦中文在线观看电视剧免费版 | 亚洲AV成人潮喷综合网| 亚洲美女激情视频| 野花香在线视频免费观看大全| 亚洲乱码日产精品a级毛片久久| 亚洲AV综合色区无码一二三区| 日本三级2019在线观看免费| 亚洲美女激情视频| 人禽杂交18禁网站免费| 亚洲欧洲另类春色校园网站| 精品亚洲永久免费精品| 抽搐一进一出gif免费视频| 亚洲人成中文字幕在线观看 | 久久久久国产精品免费网站| 久久av无码专区亚洲av桃花岛| 久久久久久曰本AV免费免费| 亚洲va精品中文字幕| 最新仑乱免费视频| 偷自拍亚洲视频在线观看| 亚洲人成网站色在线入口| 中文字幕免费在线播放| 中文字幕亚洲综合精品一区| 免费无码AV片在线观看软件| 337P日本欧洲亚洲大胆精品| 久久精品夜色噜噜亚洲A∨| 亚洲人成网站日本片| 日本特黄特色免费大片| 免费国产高清毛不卡片基地| 亚洲精品国产精品乱码视色 | 日韩成人毛片高清视频免费看| 亚洲精品自在在线观看| 99视频在线免费看| 亚洲国产区男人本色| 亚洲欭美日韩颜射在线二| 蜜臀AV免费一区二区三区| 久久亚洲中文无码咪咪爱| 久久精品夜色国产亚洲av| 丁香花在线观看免费观看| 国产精品免费久久久久影院| 亚洲女人影院想要爱| 亚洲色偷拍区另类无码专区|