<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        首個AI軟件工程師Devin完整技術(shù)報告出爐,還有人用GPT做出了「復(fù)刻版」

        AIGC動態(tài)1年前 (2024)發(fā)布 機器之心
        417 0 0

        首個AI軟件工程師Devin完整技術(shù)報告出爐,還有人用GPT做出了「復(fù)刻版」

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:首個AI軟件工程師Devin完整技術(shù)報告出爐,還有人用GPT做出了「復(fù)刻版」
        關(guān)鍵字:測試,問題,報告,團隊,智能
        文章來源:機器之心
        內(nèi)容字?jǐn)?shù):8736字

        內(nèi)容摘要:


        機器之心報道
        編輯:杜偉、大盤雞從編碼、編譯到調(diào)試、驗證,AI 智能體能做的事情更多了。這周三,Cognition AI 團隊發(fā)布的首個 AI 軟件工程師 Devin 引爆了 AI 社區(qū),引發(fā)了人們對程序員這個職業(yè)未來前景的熱議。在對 Devin 的評估中,團隊使用了 SWE-bench。這是一個由 GitHub 問題和拉取請求組成的軟件工程系統(tǒng)的自動化基準(zhǔn)測試。他們認(rèn)為 SWE-bench 是一個不錯的選擇,它確定性地評估(通過單元測試)系統(tǒng)解決現(xiàn)實世界代碼庫問題的能力,并與 HumanEval 等僅限于功能的基準(zhǔn)測試不同。
        從結(jié)果來看,在 SWE-Bench 基礎(chǔ)測試中,無需人類輔助,Devin 就可以解決 13.86% 的問題。而當(dāng)前 SOTA 模型,在沒有人類幫忙的情況下,只能完成 1.96% 的問題。即使提供了要編輯(輔助)的確切文件,當(dāng)前 SOTA 模型也只能解決 4.80% 的問題。數(shù)據(jù)集
        具體來講,SWE-bench 是一個包含 2294 個問題和 GitHub 流行開源 Python 存儲庫中拉取請求(pull request)的數(shù)據(jù)集,目的是測試系統(tǒng)編寫真實代碼


        原文鏈接:首個AI軟件工程師Devin完整技術(shù)報告出爐,還有人用GPT做出了「復(fù)刻版」

        聯(lián)系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费永久在线观看黄网站| 免费特级黄毛片在线成人观看 | 亚洲国产精品综合久久2007| 亚洲精品熟女国产| MM1313亚洲精品无码久久| 农村寡妇一级毛片免费看视频| 免费视频一区二区| 免费无码黄十八禁网站在线观看| 午夜国产大片免费观看| 亚洲av无码av在线播放| 一级毛片在线免费观看| 国产麻豆剧传媒精品国产免费| 久久精品九九亚洲精品| 三年片在线观看免费观看大全中国 | 精品一区二区三区免费毛片爱 | 一个人看的www视频免费在线观看| 免费A级毛片无码A∨免费| 亚洲色婷婷综合开心网| 亚洲中字慕日产2020| 一级毛片免费视频网站| 亚洲无av在线中文字幕| 亚洲色欲色欲www| 国产成人久久AV免费| 精品亚洲成α人无码成α在线观看| 亚洲日韩AV一区二区三区中文| 无码精品人妻一区二区三区免费看| 亚洲综合激情九月婷婷 | 国产精品黄页免费高清在线观看| 日韩版码免费福利视频| 人人狠狠综合久久亚洲88| 亚洲AV无码一区二区三区久久精品 | 国产精品免费αv视频| 亚洲一区影音先锋色资源| 欧美a级成人网站免费| 一个人看的免费高清视频日本| 亚洲乱亚洲乱淫久久| 久久99精品免费视频| 亚洲综合小说另类图片动图| 黄在线观看www免费看| 亚洲小视频在线播放| 亚洲av无码天堂一区二区三区|