<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態1年前 (2024)發布 量子位
        493 0 0

        一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        AIGC動態歡迎閱讀

        原標題:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%
        關鍵字:模型,團隊,任務,自然語言,字節
        文章來源:量子位
        內容字數:2772字

        內容摘要:


        夢晨 西風 發自 凹非寺量子位 | 公眾號 QbitAI“預測下一個token”被認為是大模型的基本范式,一次預測多個tokens又會怎樣?
        Meta AI法國團隊推出“基于多token預測的更快&更好大模型”。
        多token預測模型,在編程類任務上表現尤其突出。
        與單token預測相比,13B參數模型在HumanEval上多解決了12%的問題,在MBPP上多解決了17%。
        小型算法推理任務上,多token預測也在分布外泛化方面帶來了令人印象深刻的收益。
        不過在自然語言任務上,多token預測方法并不能顯著提高7B模型在數學選擇題上的表現了。
        另外一個好處是,即使batch size較大,使用4-token預測訓練的模型,推理速度也可提高3倍。
        多token預測更適合編程具體來說,團隊設計了一種新的多token預測架構,通過n個的輸出頭并行預測n個未來token。
        使用大量文本數據進行模型訓練,包括代碼和自然語言數據集。
        再通過實驗比較多token預測和單token預測在多個下游任務上的性能。
        為啥多token預測在編程任務和小型算法推理任務上提升更明顯?
        團隊猜測可能有兩個原因:


        原文鏈接:一次預測多個token,Meta新模型推理加速3倍,編程任務提高17%

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产一级淫片视频免费看| 91久久精品国产免费直播| 四虎必出精品亚洲高清| 亚洲综合色一区二区三区| 特黄特色的大片观看免费视频| 一级毛片a免费播放王色电影 | 免费无码一区二区三区蜜桃大| 久久综合AV免费观看| 国产人成免费视频| 亚洲av无码专区青青草原| 免费一区二区无码东京热| 在线看片v免费观看视频777| 亚洲国产精品不卡毛片a在线| 亚洲VA中文字幕不卡无码| 亚洲人AV在线无码影院观看| a毛看片免费观看视频| 成年在线观看免费人视频草莓| 亚洲永久精品ww47| 亚洲精品V天堂中文字幕| 最近的中文字幕大全免费8| 日本免费v片一二三区| 亚洲蜜芽在线精品一区| 99亚洲精品卡2卡三卡4卡2卡| 国内精品免费在线观看| 国产大片91精品免费看3| 亚洲乱码在线播放| 免费黄网站在线观看| 亚洲美女在线观看播放| 我要看免费的毛片| 日产久久强奸免费的看| 毛片A级毛片免费播放| 美女被艹免费视频| 免费高清在线影片一区| 午夜不卡AV免费| 亚洲AV第一页国产精品| 日韩在线视频播放免费视频完整版| 亚洲日韩精品A∨片无码| 免费国产作爱视频网站| 亚洲精品不卡视频| 中文字幕在线免费观看| 亚洲一线产品二线产品|