<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Hyena成下一代Transformer?StripedHyena-7B開源:最高128k輸入,訓練速度提升50%

        AIGC動態1年前 (2024)發布 新智元
        518 0 0

        Hyena成下一代Transformer?StripedHyena-7B開源:最高128k輸入,訓練速度提升50%

        AIGC動態歡迎閱讀

        原標題:Hyena成下一代Transformer?StripedHyena-7B開源:最高128k輸入,訓練速度提升50%
        關鍵字:注意力,卷積,算子,序列,研究人員
        文章來源:新智元
        內容字數:8804字

        內容摘要:


        新智元報道編輯:LRS
        【新智元導讀】Hyena處理長序列輸入比FlashAttention速度高100倍!最新發布的StripedHyena模型可能成下一代AI架構的新標準?最近幾年發布的AI模型,如語言、視覺、音頻、生物等各種領域的大模型都離不開Transformer架構,但其核心模塊「注意力機制」的計算復雜度與「輸入序列長度」呈二次方增長趨勢,這一特性嚴重限制了Transformer在長序列下的應用,例如無法一次性處理一整本書,或是處理千兆像素級別的圖像。
        即便強如GPT-4也難以擺脫這種缺陷。
        最近,Together Research開源了一個全新的語言模型StripedHyena,采用了針對「長上下文」的新架構,可以處理高達128k個token的長上下文,并且改進了Transformer架構在訓練和推理上的性能,為目前的主流架構提供了一種可選方案。開源鏈接:https://github.com/togethercomputer/stripedhyena
        StripedHyena也是「首個」在短上下文和長上下文評估中,以相同模型尺寸,實現了與最佳開源Transformer模型


        原文鏈接:Hyena成下一代Transformer?StripedHyena-7B開源:最高128k輸入,訓練速度提升50%

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久久久亚洲精品无码网址 | 自拍偷区亚洲国内自拍| 精品国产麻豆免费人成网站| 亚洲人成电影在线播放| 免费人妻精品一区二区三区| 国产又大又粗又硬又长免费 | 一个人看的免费观看日本视频www 一个人看的免费视频www在线高清动漫 | 日韩精品免费在线视频| 亚洲精品国产成人99久久| 中文字幕日本人妻久久久免费| 久久久亚洲精品国产| 无码国产精品一区二区免费16| 久久久久亚洲AV无码网站| 亚洲三级在线免费观看| 亚洲中文字幕久久精品无码VA| 热99re久久免费视精品频软件| 亚洲国产精品99久久久久久| 亚洲精品NV久久久久久久久久| 本道天堂成在人线av无码免费| 亚洲av综合av一区| 成人在线免费看片| 日韩国产精品亚洲а∨天堂免| 亚洲性日韩精品一区二区三区| 在线看片免费人成视频播| 亚洲Av高清一区二区三区| 国产精品色午夜免费视频| 三级毛片在线免费观看| 亚洲成a人片在线观看播放| 国产午夜免费福利红片| 中国一级特黄的片子免费| 亚洲视频一区二区在线观看| 青青草国产免费久久久91| 中文字幕版免费电影网站| 亚洲精品影院久久久久久| 日韩一品在线播放视频一品免费| 国产JIZZ中国JIZZ免费看| 91亚洲国产成人久久精品网址 | 日韩人妻一区二区三区免费| 亚洲天然素人无码专区| 亚洲小说区图片区另类春色| 亚洲欧美综合精品成人导航|