<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        AIGC動態11個月前發布 AI前線
        461 0 0

        大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        AIGC動態歡迎閱讀

        原標題:大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了
        關鍵字:比亞迪,華為,字節跳動,模型,范式
        文章來源:AI前線
        內容字數:0字

        內容摘要:


        為增強設備上的智能性,在邊緣設備部署大型語言模型(LLMs)成為了一個趨勢,比如微軟的 Windows 11 AI + PC。目前部署的大語言模型多會量化到低比特。然而,低比特 LLMs 在推理過程中需要進行低精度權重和高精度激活向量的混合精度矩陣乘法(mpGEMM)。現有的系統由于硬件缺乏對 mpGEMM 的原生支持,不得不將權重反量化以進行高精度計算。這種間接的方式導致了顯著的推理開銷,并且無法隨著比特數進一步降低而獲得加速。
        為此,微軟亞洲研究院的研究員們開發了 T-MAC。T-MAC 采用基于查找表(LUT)的計算范式,無需反量化,直接支持混合精度矩陣乘,其高效的推理性能以及其統一且可擴展的特性為在資源受限的邊緣設備上實際部署低比特 LLMs 鋪平了道路。
        此外,當前大模型的部署普遍依賴于專用加速器,如 NPU 和 GPU 等,而 T-MAC 可以擺脫專用加速器的依賴,僅利用 CPU 部署 LLMs,推理速度甚至能夠超過同一片上的專用加速器,使 LLMs 可以部署在各類包括 PC、手機、樹莓派等邊緣端設備。T-MAC 現已開源。在 CPU 上高效部署
        低比特大語言模型
        T-MA


        原文鏈接:大模型端側 CPU 部署最高提效 6 倍!微軟亞研院新開源項目 T-MAC 技術解析來了

        聯系作者

        文章來源:AI前線
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 男男gvh肉在线观看免费| jlzzjlzz亚洲jzjzjz| 菠萝菠萝蜜在线免费视频| 妞干网在线免费视频| 亚洲综合一区二区三区四区五区| 久久99国产乱子伦精品免费| 亚洲AV日韩精品久久久久| 久久精品中文字幕免费| 亚洲日本中文字幕区| 免费观看无遮挡www的小视频| 亚洲视频在线观看网址| 97性无码区免费| 欧美激情综合亚洲一二区| gogo全球高清大胆亚洲| 久久久久久久久久久免费精品| 久久亚洲国产成人影院网站 | 一级特黄录像免费播放中文版| 亚洲AV日韩精品一区二区三区| 五月天婷婷免费视频| 国产亚洲精品自在久久| 91免费国产自产地址入| 亚洲色大成网站www久久九| 免费欧洲美女牲交视频| 中国一级毛片视频免费看| 亚洲AV无码不卡无码| 美女视频黄a视频全免费| 国产亚洲综合一区二区三区| 国产乱辈通伦影片在线播放亚洲| 黄页免费在线观看 | 男人的天堂av亚洲一区2区| 亚洲日韩精品一区二区三区无码| 在线观看免费视频资源| 亚洲第一街区偷拍街拍| 77777亚洲午夜久久多人| 免费看美女裸露无档网站| 日韩毛片在线免费观看| 亚洲国产精品久久| 国产免费无遮挡精品视频| 久久免费精品视频| 色偷偷亚洲第一综合网| 噜噜噜亚洲色成人网站∨|