<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        AIGC動態10個月前發布 新智元
        559 0 0

        英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        AIGC動態歡迎閱讀

        原標題:英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快
        關鍵字:向量,矩陣,模型,球面,注意力
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:桃子 LRS
        【新智元導讀】LLM訓練速度還可以再飆升20倍!英偉達團隊祭出全新架構歸一化Transformer(nGPT),上下文越長,訓練速度越快,還能維持原有精度。AI的未來,或許就此改寫……
        最近,英偉達團隊拋出的一枚重磅,提出了全新神經網絡架構——歸一化Transformer(nGPT),基于超球面(hypersphere)進行表示學習。
        相較于Transformer架構本身,nGPT直接將LLM訓練速度提升至高20倍,而且還保持了原有精度。
        也就意味著,原本需要一個月完成的訓練,在未來可能只需1-2天的時間就能搞定。
        無疑為通向AGI終極目標,注入了一針強心劑!
        論文地址:https://arxiv.org/pdf/2410.01131
        在nGPT中,所有的向量(嵌入、MLP、注意力矩陣、隱藏狀態),都被歸一化為單位范數(unit norm)。
        輸入后的token在超球面表面上移動,每一層都通過「位移」來貢獻最終的輸出預測,其中位移量是由MLP和注意力模塊進行定義的,其向量組件都位于同一個超球面上。
        實驗表明,nGPT達到相同精度所需的訓練步驟


        原文鏈接:英偉達nGPT重塑Transformer,AI訓練速度暴增20倍!文本越長,加速越快

        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 在线观看AV片永久免费| 久久青青草原亚洲av无码app| 日本a级片免费看| 亚洲精品美女在线观看| 色猫咪免费人成网站在线观看| 亚洲欧洲日产国码高潮αv| 亚洲国产精品无码第一区二区三区| 五月亭亭免费高清在线| 亚洲精品国产成人专区| 每天更新的免费av片在线观看| 好看的电影网站亚洲一区| 免费A级毛片无码视频| 亚洲精品福利网站| 久久精品国产亚洲av日韩| 国产亚洲精品无码专区| 久久精品国产大片免费观看| 亚洲韩国在线一卡二卡| 成人爽A毛片免费看| 国产精品免费久久| 亚洲一区在线观看视频| 免费国产怡红院在线观看| 男女男精品网站免费观看 | 亚洲国产另类久久久精品黑人| 国产男女性潮高清免费网站 | 亚洲第一黄片大全| 99精品视频在线观看免费专区| 一区二区视频在线免费观看| 亚洲丝袜美腿视频| 亚洲一级片在线观看| 婷婷国产偷v国产偷v亚洲| 亚洲成AV人片在线播放无码| 免费无码黄动漫在线观看| 永久免费A∨片在线观看| 美女啪啪网站又黄又免费| 亚洲av无码片在线观看| 国产在亚洲线视频观看| 亚洲av一本岛在线播放| 一级毛片免费播放视频| 免费国产黄网站在线观看视频 | 亚洲成人福利在线| 久久久久久久尹人综合网亚洲|