<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Mamba可以替代Transformer,但它們也能組合起來使用

        AIGC動態2年前 (2024)發布 機器之心
        616 0 0

        Mamba可以替代Transformer,但它們也能組合起來使用

        AIGC動態歡迎閱讀

        原標題:Mamba可以替代Transformer,但它們也能組合起來使用
        關鍵字:序列,報告,上下文,狀態,注意力
        文章來源:機器之心
        內容字數:8264字

        內容摘要:


        機器之心報道
        編輯:Panda W1+1>2。Transformer 很厲害,但并不完美,尤其是在處理長序列方面。而狀態空間模型(SSM)則在長序列上的表現相當不俗。早在去年就有研究者提出可使用 SSM 替代 Transformer,參見文章《預訓練無需注意力,擴展到4096個token不成問題,與BERT相當》,前些天基于 SSM 方法的 Mamba 更是異軍突起,推理吞吐量達到了 Transformer 的五倍之多,參閱《五倍吞吐量,性能全面包圍Transformer:新架構Mamba引爆AI圈》。
        但實際上,SSM 和 Transformer 并不是非此即彼的兩種架構,它們完全可以組合起來!
        近日公布的一篇 NeurIPS 2023 論文《Block-State Transformers》就采用了這種做法,其不僅能輕松支持 65k token 長度的超長輸入,而且計算效率還非常高,速度相比使用循環單元的 Transformer 足可提升十倍之多!這篇論文也得到了 Mamba 作者 Tri Dao 的點贊,他表示:「SSM 和Transformer 似乎可以互補。」但在我們介紹這種


        原文鏈接:Mamba可以替代Transformer,但它們也能組合起來使用

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久亚洲精品11p| 亚洲精品无码久久久久秋霞| 一级黄色免费毛片| 免费观看国产精品| 羞羞视频在线免费观看| 国产成人免费高清在线观看| 国产精品亚洲一区二区三区在线观看 | 性色午夜视频免费男人的天堂| 亚洲国产精品一区第二页| 无码AV片在线观看免费| 久久精品亚洲精品国产色婷| 97碰公开在线观看免费视频| 亚洲中文字幕久久无码| 国产小视频在线观看免费| 日本永久免费a∨在线视频| 久久影视国产亚洲| 国内精品免费在线观看| 亚洲熟妇av一区| 日本免费电影一区| 精品国产免费一区二区三区| 亚洲AV日韩AV永久无码免下载| 6080午夜一级毛片免费看6080夜福利| 亚洲码在线中文在线观看| 在线免费观看a级片| kk4kk免费视频毛片| 亚洲福利在线观看| 西西大胆无码视频免费| 手机永久免费的AV在线电影网| 亚洲国产精品无码久久久蜜芽| 亚洲人成在线免费观看| 亚洲精品无码久久久久A片苍井空| 亚洲А∨精品天堂在线| 91福利免费视频| 亚洲AV成人精品一区二区三区| 区久久AAA片69亚洲| 69堂人成无码免费视频果冻传媒| 国产亚洲欧美日韩亚洲中文色| 亚洲精品乱码久久久久久中文字幕 | 国产在线国偷精品免费看| 亚洲国产综合人成综合网站00| 四虎永久免费观看|