<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態(tài)1年前 (2024)發(fā)布 量子位
        495 0 0

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態(tài)歡迎閱讀

        原標題:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%
        關鍵字:模型,團隊,任務,自然語言,字節(jié)
        文章來源:量子位
        內(nèi)容字數(shù):2772字

        內(nèi)容摘要:


        夢晨 西風 發(fā)自 凹非寺量子位 | 公眾號 QbitAI“預測下一個token”被認為是大模型的基本范式,一次預測多個tokens又會怎樣?
        Meta AI法國團隊推出“基于多token預測的更快&更好大模型”。
        多token預測模型,在編程類任務上表現(xiàn)尤其突出。
        與單token預測相比,13B參數(shù)模型在HumanEval上多解決了12%的問題,在MBPP上多解決了17%。
        小型算法推理任務上,多token預測也在分布外泛化方面帶來了令人印象深刻的收益。
        不過在自然語言任務上,多token預測方法并不能顯著提高7B模型在數(shù)學選擇題上的表現(xiàn)了。
        另外一個好處是,即使batch size較大,使用4-token預測訓練的模型,推理速度也可提高3倍。
        多token預測更適合編程具體來說,團隊設計了一種新的多token預測架構,通過n個的輸出頭并行預測n個未來token。
        使用大量文本數(shù)據(jù)進行模型訓練,包括代碼和自然語言數(shù)據(jù)集。
        再通過實驗比較多token預測和單token預測在多個下游任務上的性能。
        為啥多token預測在編程任務和小型算法推理任務上提升更明顯?
        團隊猜測可能有兩個原因:


        原文鏈接:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        聯(lián)系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業(yè)新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 一区二区免费视频| 亚洲一区二区三区免费| 日日麻批免费40分钟无码| 久久精品国产亚洲AV不卡| 亚洲va国产va天堂va久久| 五月天婷婷免费视频| 免费a级毛片大学生免费观看| 亚洲国产精品无码观看久久| 成人免费无码大片A毛片抽搐色欲| 亚洲av专区无码观看精品天堂 | 极品美女一级毛片免费| 亚洲?V乱码久久精品蜜桃 | 日韩精品福利片午夜免费观着| 亚洲国产高清在线精品一区| 97热久久免费频精品99 | 免费一级毛片在线播放放视频| 亚洲成aⅴ人片久青草影院| 九九久久国产精品免费热6| 不卡一卡二卡三亚洲| 国产va在线观看免费| 亚洲成年人免费网站| 国内外成人免费视频| 深夜免费在线视频| 亚洲精品无码高潮喷水在线| 99国产精品视频免费观看| 亚洲人成人77777网站不卡| 全免费一级午夜毛片| 一级一级一片免费高清| 久久综合图区亚洲综合图区 | 大胆亚洲人体视频| 182tv免费视频在线观看| 亚洲狠狠狠一区二区三区| 四虎成人免费网站在线| 国产精品午夜免费观看网站| 久久精品国产亚洲AV网站| 120秒男女动态视频免费| 亚洲第一成年免费网站| 亚洲AV第一页国产精品| 午夜免费不卡毛片完整版| 99免费在线视频| 亚洲欧美自偷自拍另类视|