編碼碾壓ChatGPT!UIUC清華聯(lián)手發(fā)布7B參數(shù)Magicoder,代碼數(shù)據(jù)權(quán)重全開源
AIGC動態(tài)歡迎閱讀
原標題:編碼碾壓ChatGPT!UIUC清華聯(lián)手發(fā)布7B參數(shù)Magicoder,代碼數(shù)據(jù)權(quán)重全開源
關(guān)鍵字:代碼,數(shù)據(jù),模型,片段,指令
文章來源:新智元
內(nèi)容字數(shù):5322字
內(nèi)容摘要:
新智元報道編輯:Mindy
【新智元導讀】全新代碼大模型Magicoder,不到7B參數(shù),就能在代碼生成領(lǐng)域與頂級代碼模型不相上下。開源「代碼大模型」來了!
UIUC清華團隊的研究人員發(fā)布了Magicoder,不到7B參數(shù),就能在代碼生成領(lǐng)域與頂級代碼模型不相上下。
值得一提的是,Magicoder的代碼、權(quán)重和數(shù)據(jù),毫無保留完全開源。
論文地址:https://arxiv.org/abs/2312.02120
Magicoder依靠的OSS-INSTRUCT的方法,是通過對現(xiàn)有頂級代碼模型(例如ChatGPT)的提示,加上網(wǎng)絡上的種子代碼片段,來生成的代碼。
這可真是取之于大模型,用之于大模型;就有網(wǎng)友轉(zhuǎn)發(fā)說道:通過這些結(jié)果,看到了提高用于LLMs的合成數(shù)據(jù)的潛力也是一個非常有趣的領(lǐng)域。
話不多說,那就讓我們來具體了解一下Magicoder的來歷吧!
代碼生成的發(fā)展史代碼生成(Code Generation),也叫程序合成(Program Synthesis),近幾十年來,一直都是學術(shù)界的一塊「硬骨頭」,在此領(lǐng)域進行過的許多嘗試,例如基于抽象的合成和基于示例的編程,都沒有取得很好的
原文鏈接:編碼碾壓ChatGPT!UIUC清華聯(lián)手發(fā)布7B參數(shù)Magicoder,代碼數(shù)據(jù)權(quán)重全開源
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。