<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?

        AIGC動態2年前 (2023)發布 機器之心
        557 0 0

        CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?

        AIGC動態歡迎閱讀

        原標題:CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?
        關鍵字:閃存,模型,加載,數據,神經元
        文章來源:機器之心
        內容字數:7396字

        內容摘要:


        機器之心報道
        編輯:杜偉、蛋醬蘋果這項新工作將為未來 iPhone 加入大模型的能力帶來無限想象力。近年來,GPT-3、OPT 和 PaLM 等大型語言模型(LLM)在廣泛的 NLP 任務中表現出了強大的性能。不過,這些能力伴隨著大量計算和內存推理需求,畢竟大型語言模型可能包含數千億甚至萬億參數,使得高效加載和運行變得有挑戰性,尤其是在資源有限的設備上。
        當前標準的應對方案是將整個模型加載到 DRAM 中進行推理,然而這種做法嚴重限制了可以運行的最大模型尺寸。舉個例子,70 億參數的模型需要 14GB 以上的內存才能加載半精度浮點格式的參數,這超出了大多數邊緣設備的能力。
        為了解決這種局限性,蘋果的研究者提出在閃存中存儲模型參數,至少比 DRAM 大了一個數量級。接著在推理中,他們直接并巧妙地從閃存加載所需參數,不再需要將整個模型擬合到 DRAM 中。
        這種方法基于最近的工作構建,這些工作表明 LLM 在前饋網絡(FFN)層中表現出高度稀疏性,其中 OPT、Falcon 等模型的稀疏性更是超過 90%。因此,研究者利用這種稀疏性, 有選擇地僅從閃存中加載具有非零輸入或預測具有非零輸出的


        原文鏈接:CPU推理提升4到5倍,蘋果用閃存加速大模型推理,Siri 2.0要來了?

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产99视频精品免费观看7| 欧洲亚洲综合一区二区三区| 波多野结衣免费一区视频| 伊人久久亚洲综合影院| 中文无码亚洲精品字幕| 妞干网免费观看视频| 亚洲人成图片网站| 麻豆国产VA免费精品高清在线 | 99精品国产免费久久久久久下载| 亚洲综合色一区二区三区小说| 日韩在线不卡免费视频一区| 亚洲av中文无码乱人伦在线咪咕| 成人影片一区免费观看| 久久精品国产亚洲精品2020| 国产大片91精品免费观看不卡| 亚洲伊人久久大香线蕉在观| 最近高清国语中文在线观看免费| 亚洲av成人一区二区三区观看在线| 亚洲国产成人乱码精品女人久久久不卡| 五月天国产成人AV免费观看| 亚洲国产精品成人久久| 91黑丝国产线观看免费| 亚洲aⅴ无码专区在线观看春色| 亚洲av麻豆aⅴ无码电影| 成在线人免费无码高潮喷水| 亚洲成色999久久网站| 91成年人免费视频| 男性gay黄免费网站| 亚洲av色影在线| 毛片a级三毛片免费播放| 一级A毛片免费观看久久精品 | 337p日本欧洲亚洲大胆精品555588 | 美女18一级毛片免费看| 亚洲AV中文无码乱人伦下载 | 国产成人无码a区在线观看视频免费| 人成免费在线视频| 亚洲系列国产精品制服丝袜第| 麻豆成人精品国产免费| 成全视频在线观看免费| 亚洲精品国产综合久久久久紧| 久久久久亚洲av毛片大|