<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        24年對于大模型演進方向的一些思考

        AIGC動態11個月前發布 智猩猩GenAI
        475 0 0

        24年對于大模型演進方向的一些思考

        AIGC動態歡迎閱讀

        原標題:24年對于大模型演進方向的一些思考
        關鍵字:模型,知乎,侵權,框架,編譯器
        文章來源:智猩猩GenAI
        內容字數:0字

        內容摘要:


        導讀文章轉載自知乎,作者為霸王腿,總結了關于大模型計算方式如何變革的一些思路。
        原文地址:https://zhuanlan.zhihu.com/p/682434451
        本文只做學術/技術分享,如有侵權,聯系刪文。大模型計算方式會如何變革,一直是一個持續思考的問題,簡單記錄一些思路,邏輯并不嚴謹,不怕打臉,一年后再看。
        01大模型發展的方向是“稀疏”這里面稀疏指的是,每次執行具體的任務所消耗的資源與整體參數量的比值會越來越低。從以gemm為主到以gemv為主,可以算是一種稀疏(本質上這種稀疏允許了更大的context length的可能性)。MoE毫無疑問也是更稀疏的。從人理解世界的方式而言,稀疏應該是一個比較commen sense的思路。
        02訓練和推理的界限會變得模糊推理的過程中會進行著某種形式的訓練。本質而言,長seq_length帶來的巨大的kv cache就是某種意義上的訓練,但看起來并不是一種足夠高效的方式,所以我感覺這未必會是終極形態。從具體的程序架構而言,在推理的執行模塊,對于每層而言,out=op(in0,in1,attrs) 其中op只改變out的值并不足以作為


        原文鏈接:24年對于大模型演進方向的一些思考

        聯系作者

        文章來源:智猩猩GenAI
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲av色香蕉一区二区三区 | 国产在线观看免费视频播放器| 久久久亚洲精品国产| 亚洲人成无码网站在线观看| 一级毛片免费视频| 亚洲国产人成在线观看69网站 | 人体大胆做受免费视频| 免费观看午夜在线欧差毛片| 妇女自拍偷自拍亚洲精品| 免费一级一片一毛片| 免费中文字幕视频| 亚洲日本va午夜中文字幕久久| 免费一级全黄少妇性色生活片| 亚洲精品成人a在线观看| 午夜成人无码福利免费视频| 国产啪亚洲国产精品无码| 中文字幕久无码免费久久| 一个人免费日韩不卡视频| 亚洲精品线在线观看| 国产精品久久永久免费| 亚洲中文字幕久久精品无码A| 国产免费久久精品久久久| 特级毛片aaaa级毛片免费| 永久亚洲成a人片777777| 99爱视频99爱在线观看免费| 亚洲国产精品专区| 国产在线观看免费视频播放器 | 91精品导航在线网址免费| 亚洲日本人成中文字幕| 国产精品嫩草影院免费| 91免费在线视频| 亚洲国产成人久久精品app| 国产成人免费福利网站| 国产精品免费久久久久久久久| 最新猫咪www免费人成| 特级毛片A级毛片100免费播放| 亚洲色精品aⅴ一区区三区| 国产成人精品免费视| 深夜特黄a级毛片免费播放| 亚洲乱码一区二区三区在线观看| 亚洲最大免费视频网|