<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        首個國產開源MoE大模型來了!性能媲美Llama 2-7B,計算量降低60%

        AIGC動態(tài)2年前 (2024)發(fā)布 量子位
        461 0 0

        首個國產開源MoE大模型來了!性能媲美Llama 2-7B,計算量降低60%

        AIGC動態(tài)歡迎閱讀

        原標題:首個國產開源MoE大模型來了!性能媲美Llama 2-7B,計算量降低60%
        關鍵字:模型,專家,參數(shù),版本,團隊
        文章來源:量子位
        內容字數(shù):2852字

        內容摘要:


        克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI開源MoE模型,終于迎來首位國產選手!
        它的表現(xiàn)完全不輸給密集的Llama 2-7B模型,計算量卻僅有40%。
        這個模型堪稱19邊形戰(zhàn)士,特別是在數(shù)學和代碼能力上對Llama形成了碾壓。
        它就是深度求索團隊最新開源的160億參數(shù)專家模型DeepSeek MoE。
        除了性能上表現(xiàn)優(yōu)異,DeepSeek MoE主打的就是節(jié)約計算量。
        在這張表現(xiàn)-激活參數(shù)量圖中,它“一枝獨秀”地占據(jù)了左上角的大片空白區(qū)。
        發(fā)布僅一天,DeepSeek團隊在X上的推文就有大量轉發(fā)關注。
        JP摩根的機器學習工程師Maxime Labonne測試后也表示,DeepSeek MoE的chat版本表現(xiàn)要略勝于微軟的“小模型”Phi-2。
        同時,DeepSeek MoE還在GitHub上獲得了300+星標,并登上了Hugging Face文本生成類模型排行榜的首頁。
        那么,DeepSeek MoE的具體表現(xiàn)究竟怎么樣呢?
        計算量減少60%DeepSeek MoE目前推出的版本參數(shù)量為160億,實際激活參數(shù)量大約是28億。
        與自家的7B密集模型相比,二者在19個數(shù)據(jù)集上


        原文鏈接:首個國產開源MoE大模型來了!性能媲美Llama 2-7B,計算量降低60%

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業(yè)新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 大胆亚洲人体视频| 亚洲s色大片在线观看| 成年女人免费视频播放77777| 免费一级毛片正在播放| 亚洲av福利无码无一区二区 | 亚洲精品成人网站在线观看| 亚洲天堂电影在线观看| 黄色毛片免费在线观看| 国产精品网站在线观看免费传媒| 巨波霸乳在线永久免费视频| 亚洲午夜激情视频| 中中文字幕亚洲无线码| a级毛片高清免费视频就| 女人毛片a级大学毛片免费| 亚洲国产精品成人精品无码区| 久久人午夜亚洲精品无码区| 国产男女爽爽爽爽爽免费视频| 国产啪亚洲国产精品无码| 亚洲偷自精品三十六区| 成人免费视频88| 国产精品亚洲一区二区无码| 97无码免费人妻超级碰碰碰碰| 久久精品国产96精品亚洲| 在线涩涩免费观看国产精品| 亚洲国产精品一区二区第四页 | 亚洲最大福利视频| 好吊妞在线新免费视频| 色欲aⅴ亚洲情无码AV| 毛片免费全部播放一级| 老司机精品视频免费| 亚洲国产精品无码久久SM| 91制片厂制作传媒免费版樱花| 亚洲人成人77777网站| 一级做a爰黑人又硬又粗免费看51社区国产精品视| 亚洲国产精品免费在线观看| 亚洲福利在线播放| 久久免费视频观看| 亚洲www在线观看| 国产亚洲精品影视在线产品| 麻豆视频免费播放| 成人嫩草影院免费观看|