<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token

        AIGC動態10個月前發布 量子位
        459 0 0

        微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token

        AIGC動態歡迎閱讀

        原標題:微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token
        關鍵字:模型,框架,權重,參數,微軟
        文章來源:量子位
        內容字數:0字

        內容摘要:


        西風 發自 凹非寺量子位 | 公眾號 QbitAI微軟開源1bit大模型推理框架!
        現在1000億參數大模型量化后單CPU可跑,速度可達每秒5-7個token。
        比如在蘋果M2新品上運行BitNet b1.58 3B模型,be like:
        就是今年爆火論文The Era of 1-bit LLMs的官方代碼實現,開源不到一周GitHub已攬獲7.9k Star。
        傳統大模型參數以16位浮點數(如FP16或BF16)形式的存儲,而BitNet b1.58將其統統變成了三進制,也就是{-1, 0, 1}。
        這里的“1.58 bit”指每個參數可以用1.58位的信息來表示。
        轉換之后,矩陣中的計算就只會涉及到加法,因此會讓大模型在保持一定精度的同時,顯著減少所需的存儲空間和計算資源,也顯著提升了在本地設備上運行LLM的可能性。
        這個項目開源后,在X上也受到了一波高度關注。
        千億參數模型量化后單CPU可跑bitnet.cpp是1bit LLM(例如 BitNet b1.58)的官方推理框架。
        該框架配備了一系列優化內核,支持在CPU上進行快速且無損的1.58bit模型推理,未來將擴展支持NPU


        原文鏈接:微軟開源爆火1.58bit大模型推理框架!千億參數模型量化后單CPU可跑,速度每秒5-7個token

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久精品乱子伦免费| 国产成人无码区免费内射一片色欲| 91免费人成网站在线观看18| 国产一级理论免费版| 免费国产不卡午夜福在线| 亚洲日韩欧洲无码av夜夜摸| 一区二区三区免费视频观看| 国产综合亚洲专区在线| 中文字幕乱码亚洲无线三区| 黄色网址免费在线| 99国产精品视频免费观看| 亚洲国产成人精品不卡青青草原| 久久亚洲国产最新网站| 成人免费无毒在线观看网站 | 免费在线黄色电影| 亚洲国产精品免费视频| 2019中文字幕在线电影免费| 亚洲午夜成人精品电影在线观看| 一本岛v免费不卡一二三区| 亚洲精品夜夜夜妓女网| 免费人成在线观看网站品爱网 | 亚洲第一精品福利| fc2成年免费共享视频网站| 亚洲熟妇av一区二区三区| 一级毛片免费观看不卡的| 亚洲一区二区三区91| 色www永久免费网站| 久久亚洲精品成人无码网站| 99精品国产免费久久久久久下载| 人人狠狠综合久久亚洲| 伊人久久大香线蕉亚洲| 久久www免费人成看片| 在线亚洲v日韩v| 亚洲an天堂an在线观看| 无码专区永久免费AV网站| 特黄aa级毛片免费视频播放| 亚洲AV成人一区二区三区AV| 成人毛片免费播放| 在线观看特色大片免费网站| 77777亚洲午夜久久多喷| 久久亚洲精品无码观看不卡|