国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

突破編程邊界:豆包大模型團隊發布全新開源代碼基準,涵蓋11類真實場景!

AIGC動態9個月前發布 AI科技評論
523 0 0

字節開源最全面代碼大模型基準FullStack Bench,可在線體驗。

突破編程邊界:豆包大模型團隊發布全新開源代碼基準,涵蓋11類真實場景!

原標題:首次覆蓋超 11 類真實編程場景!豆包大模型團隊開源代碼大模型全新基準
文章來源:AI科技評論
內容字數:8306字

字節開源全棧編程基準FullStack Bench

字節跳動豆包大模型團隊近日推出了FullStack Bench,這是一個專注于全棧和多語言編程的代碼評估數據集,旨在更有效地評估大型語言模型(LLMs)在實際代碼開發場景中的能力。該數據集涵蓋了11類真實場景,支持16種編程語言,包含3374個問題,標志著代碼智能評估的一個重要進步。

評估基準的必要性

現有的代碼評估基準如HumanEval和MBPP等,通常只關注基礎和高級編程問題,無法全面反映真實世界的復雜編程需求。FullStack Bench則通過分析全球最大的程序員問答社區Stack Overflow的數據,提取出常見的真實編程應用領域,確保評估的全面性和多樣性。

FullStack Bench的構建

FullStack Bench的構建過程經過了嚴格的人工標注和質量驗證,確保每個問題的質量和準確性。數據集中不僅包括題目描述和參考解決方案,還配備了15168個單元測試用例,以提高評估的準確性。

SandboxFusion:高效的代碼沙盒工具

為支持FullStack Bench的評測需求,字節團隊還開源了SandboxFusion,這是一款高效的代碼沙盒執行工具,支持23種編程語言。SandboxFusion具備數據集模塊和沙箱執行模塊,能夠安全高效地執行不同語言的代碼。

評測結果與模型表現

基于FullStack Bench,研究團隊對20余款代碼大型模型進行了評測。結果顯示,閉源模型在多數編程任務上表現優于開源模型,尤其是在數學和高級編程任務中,反映出模型設計和訓練數據質量對表現的顯著影響。此外,SandboxFusion的使用能夠顯著提升模型的表現。

結論與展望

FullStack Bench及其配套的SandboxFusion工具為評估AI在現實編程場景中的能力提供了快速參考,推動了代碼智能領域的發展。字節團隊期待通過這一平臺,促進更多開發者和研究人員的參與與合作。


聯系作者

文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        日本大香伊一区二区三区| 欧美电影免费观看完整版| 91美女片黄在线| 国产精品久久久久久久久免费相片 | 国产精品自拍三区| 26uuu精品一区二区三区四区在线| 毛片不卡一区二区| 久久久久国产精品人| jvid福利写真一区二区三区| 亚洲欧美欧美一区二区三区| 欧美性生活久久| 蜜臀国产一区二区三区在线播放 | 99国产精品视频免费观看| 亚洲视频你懂的| 91精品国产综合久久久久久久| 国产一区在线观看麻豆| 国产精品二区一区二区aⅴ污介绍| 欧美日韩一级片网站| 麻豆91在线播放免费| 国产精品污www在线观看| 欧美日韩一区中文字幕| 国产69精品久久久久毛片 | 国产日韩精品一区二区三区在线| aaa欧美日韩| 蜜臀av性久久久久蜜臀av麻豆| 国产欧美日韩视频一区二区| 欧美亚洲国产一卡| 丁香婷婷综合色啪| 另类小说综合欧美亚洲| 亚洲激情图片qvod| 久久久久久久久久久黄色| 欧美岛国在线观看| 精品视频全国免费看| 成人av网址在线观看| 久久99精品久久久久久| 亚洲影院在线观看| 国产精品久久国产精麻豆99网站| 欧美一区二区三区免费在线看| 国产91露脸合集magnet | 91亚洲国产成人精品一区二区三| 日韩精品一卡二卡三卡四卡无卡| 国产精品久久久久久久久免费相片| 欧美xxxxx牲另类人与| 欧美色倩网站大全免费| 一本色道**综合亚洲精品蜜桃冫| 丁香婷婷综合网| 国产精品一区二区免费不卡| 日本免费在线视频不卡一不卡二 | 中文字幕乱码久久午夜不卡 | 国产欧美日韩精品一区| 欧美一区二区日韩| 欧美婷婷六月丁香综合色| av中文字幕一区| 成人高清免费在线播放| 成人午夜av影视| 成人免费视频caoporn| 国产风韵犹存在线视精品| 蜜桃精品视频在线| 欧美aaaaaa午夜精品| 日本午夜精品一区二区三区电影| 亚洲成人自拍网| 无码av免费一区二区三区试看| 亚洲国产三级在线| 视频一区视频二区中文| 蜜臀av一区二区三区| 国产一区二区三区免费观看| 国产精品羞羞答答xxdd| 国产成人午夜精品5599| 成人动漫精品一区二区| av亚洲精华国产精华| 色素色在线综合| 欧美色老头old∨ideo| 欧美美女视频在线观看| 日韩视频免费观看高清在线视频| 日韩三级中文字幕| 国产日韩v精品一区二区| 亚洲人一二三区| 天堂成人免费av电影一区| 日韩中文字幕亚洲一区二区va在线 | 91色在线porny| 欧美日韩中文国产| 精品久久久久久久人人人人传媒| 久久在线观看免费| 亚洲欧美日韩精品久久久久| 天堂一区二区在线免费观看| 国产精品一二三四区| 91视频在线观看免费| 91麻豆精品国产91| 国产精品久久99| 亚洲一区日韩精品中文字幕| 另类专区欧美蜜桃臀第一页| 99久久精品费精品国产一区二区| 欧美色大人视频| 精品国产3级a| 亚洲国产色一区| av毛片久久久久**hd| 91精品国产乱| 亚洲色图制服丝袜| 国产一区二区三区免费观看| 欧美亚洲国产一区在线观看网站| 久久影院午夜论| 五月天中文字幕一区二区| 国产成人精品影院| 日韩一区二区影院| 一区二区三区在线影院| 国产精品一区二区不卡| 欧美日韩不卡一区| 18成人在线视频| 国产老肥熟一区二区三区| 欧美久久久久免费| 一区二区三区四区不卡在线| 国产成人高清在线| 精品国产乱码久久久久久图片 | 捆绑变态av一区二区三区| 日本高清不卡在线观看| 国产精品三级视频| 国产一区二区精品久久99| 欧美三级蜜桃2在线观看| 国产精品高清亚洲| 国产成人综合亚洲91猫咪| 精品久久久网站| 日韩avvvv在线播放| 欧美三级日韩三级国产三级| 亚洲主播在线播放| 在线一区二区三区| 伊人夜夜躁av伊人久久| 波多野结衣一区二区三区 | 国产精品久久久久影院老司| 国产伦精品一区二区三区在线观看| 欧美一级片免费看| 蜜桃91丨九色丨蝌蚪91桃色| 在线播放欧美女士性生活| 香港成人在线视频| 91精品欧美福利在线观看| 天天av天天翘天天综合网色鬼国产 | 亚洲h在线观看| 欧美性一二三区| 香蕉久久夜色精品国产使用方法 | 精品国产一区久久| 精品一区二区三区的国产在线播放| 制服丝袜国产精品| 精品亚洲aⅴ乱码一区二区三区| 欧美一级日韩不卡播放免费| 经典三级视频一区| 国产精品视频看| 91亚洲永久精品| 亚洲一区二区三区精品在线| 欧美麻豆精品久久久久久| 国产综合一区二区| 日本一区二区三区四区在线视频| 成人福利视频在线看| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 国产成人自拍网| 亚洲欧美在线视频| 在线视频欧美精品| 麻豆中文一区二区| 欧美激情综合五月色丁香小说| 99久久99精品久久久久久| 亚洲五码中文字幕| 久久久亚洲午夜电影| 91性感美女视频| 蜜乳av一区二区三区| 亚洲国产精品精华液2区45| 91美女在线看| 美女性感视频久久| 亚洲丝袜制服诱惑| 欧美一区二区日韩一区二区| 成人永久免费视频| 蜜臀精品一区二区三区在线观看| 国产精品私人影院| 91精品婷婷国产综合久久性色| 福利电影一区二区三区| 亚洲超碰精品一区二区| 欧美国产精品一区二区三区| 欧美日韩亚洲国产综合| 国产成人亚洲综合a∨婷婷图片| 亚洲一区中文在线| 国产日本亚洲高清| 欧美精品成人一区二区三区四区| 丁香激情综合五月| 免费在线一区观看| 一区二区三区产品免费精品久久75| 欧美精品一区二区不卡| 欧美日韩一区久久| 91在线观看污| 国产suv一区二区三区88区| 日韩福利视频导航| 洋洋av久久久久久久一区| 国产精品免费aⅴ片在线观看| 欧美成人a视频| 欧美视频一区二区在线观看| av亚洲精华国产精华精| 国产aⅴ精品一区二区三区色成熟| 日韩电影免费在线看| 一区二区三区日韩在线观看| 国产精品免费观看视频| 国产亚洲欧美一级| 久久一区二区三区国产精品| 欧美一区三区四区| 日韩一级二级三级精品视频|