<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Mamba架構第一次做大!混合Transformer,打敗Transformer

        AIGC動態1年前 (2024)發布 量子位
        421 0 0

        Mamba架構第一次做大!混合Transformer,打敗Transformer

        AIGC動態歡迎閱讀

        原標題:Mamba架構第一次做大!混合Transformer,打敗Transformer
        關鍵字:騰訊,吞吐量,模型,高效,上下文
        文章來源:量子位
        內容字數:3955字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI精彩精彩,第一個把爆火Mamba架構真正擴展到足夠大的工作來了。
        520億參數,還是Mamba+Transformer混合架構。
        它的名字叫Jamba。
        取兩種架構之長,模型質量和效率兼得,要吞吐量有吞吐量,要低內存有低內存。
        初步跑分顯示:
        Jamba性能總體接近Mixtral 8x-7B,處理128k長上下文時吞吐量卻是其3倍。
        一共支持256k上下文,而單張A100 GPU即可處理140k,直接拿下同等規模模型之最,高效又經濟。
        這項成果,來自AI公司AI21labs。
        Mamba原作者看了之后都激動轉發:
        絕對的“大新聞”。
        Mamba、Transformer,合體由CMU和普林斯頓大學提出的Mamba,解決了Transformer的局限性(隨著推理上下文越長,模型內存占用量越大,同時推理速度變慢,由此導致算力消耗巨大)。
        但它也有自己的缺點——
        在不關注整個上下文的情況下,Mamba的輸出質量很差,尤其是在召回相關的任務上。
        本著“既要也要”的原則,Jamba站出來提供兩全其美之作。
        Jamba由Transformer、


        原文鏈接:Mamba架構第一次做大!混合Transformer,打敗Transformer

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产精品亚洲产品一区二区三区 | 亚洲国色天香视频| 免费91麻豆精品国产自产在线观看 | 久久久久久精品免费免费自慰| 亚洲第一极品精品无码久久| 国产性生大片免费观看性| 亚洲中文字幕第一页在线| 91免费在线视频| 亚洲福利视频一区| 日本免费xxxx色视频| 亚洲avav天堂av在线网爱情| 99久久免费国产香蕉麻豆| 亚洲熟女www一区二区三区| 国产成人精品男人免费| 免费无遮挡无遮羞在线看| 中文亚洲成a人片在线观看| 天黑黑影院在线观看视频高清免费| 亚洲an天堂an在线观看| 国产精品69白浆在线观看免费 | 亚洲成AV人片一区二区密柚| 久久久精品2019免费观看| 亚洲av专区无码观看精品天堂| 日本成人免费在线| 黄色视屏在线免费播放| 亚洲日本一区二区| 国产精品成人无码免费| 插鸡网站在线播放免费观看| 亚洲黄色片在线观看| 日韩高清在线高清免费| 在线观看免费无码专区| 77777午夜亚洲| 区久久AAA片69亚洲| 欧美日韩国产免费一区二区三区| 国产亚洲精品美女久久久久| 亚洲精品成人网站在线观看 | 亚洲首页国产精品丝袜| 亚洲真人日本在线| 很黄很黄的网站免费的| 一级毛片一级毛片免费毛片| 亚洲大香人伊一本线| 亚洲精品国产福利一二区|