<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型終端部署新趨勢:硬件直接支持混合矩陣乘法

        AIGC動態1年前 (2024)發布 機器之心
        411 0 0

        大模型終端部署新趨勢:硬件直接支持混合矩陣乘法

        AIGC動態歡迎閱讀

        原標題:大模型終端部署新趨勢:硬件直接支持混合矩陣乘法
        關鍵字:模型,乘法,精度,硬件,數據類型
        文章來源:機器之心
        內容字數:0字

        內容摘要:


        AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在人工智能領域,模型參數的增多往往意味著性能的提升。但隨著模型規模的擴大,其對終端設備的算力與內存需求也日益增加。低比特量化技術,由于可以大幅降低存儲和計算成本并提升推理效率,已成為實現大模型在資源受限設備上高效運行的關鍵技術之一。然而,如果硬件設備不支持低比特量化后的數據模式,那么低比特量化的優勢將無法發揮。
        為了解決這一問題,微軟亞洲研究院推出了全新的數據編譯器 Ladder 和算法 T-MAC,使當前只支持對稱精度計算的硬件能夠直接運行混合精度矩陣乘法。測試結果表明,Ladder 在支持 GPU 原本不支持的自定義數據類型方面,最高提速可達 14.6 倍;T-MAC 在搭載了最新高通 Snapdragon X Elite 芯片組的 Surface AI


        原文鏈接:大模型終端部署新趨勢:硬件直接支持混合矩陣乘法

        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 中文字幕成人免费高清在线| 特黄aa级毛片免费视频播放| 国产va在线观看免费| 亚洲人成人无码网www电影首页| 黄色网址免费在线| 少妇亚洲免费精品| 一进一出60分钟免费视频| 亚洲国产精品毛片av不卡在线| 日本视频免费观看| 亚洲国产免费综合| 久久精品免费网站网| 亚洲AV无码一区二区三区DV| 91av视频免费在线观看| 亚洲人成免费电影| 成年女人毛片免费播放人| 精品在线观看免费| 亚洲欧洲久久av| 中文字幕手机在线免费看电影| 亚洲AV日韩精品久久久久| 我的小后妈韩剧在线看免费高清版| 亚洲日本va一区二区三区| 免费看小12萝裸体视频国产| 九九久久精品国产免费看小说 | 亚洲Aⅴ无码一区二区二三区软件| 成人福利在线观看免费视频| 自拍偷自拍亚洲精品第1页| 成人性生交大片免费看好| 亚洲成AV人片久久| 免费高清在线影片一区| 人妻无码中文字幕免费视频蜜桃| 亚洲成亚洲乱码一二三四区软件| 黄色片在线免费观看| 精品久久久久久亚洲中文字幕 | 日韩a毛片免费观看| 亚洲国产精品va在线播放| 91视频国产免费| 特a级免费高清黄色片| 亚洲天堂中文字幕| 亚洲国产av无码精品| 91精品国产免费| 免费精品国产自产拍在线观看 |