AIGC動態歡迎閱讀
原標題:最強開源編程大模型一夜易主:精通80+語言,僅22B
關鍵字:模型,代碼,成績,參數,開發者
文章來源:量子位
內容字數:0字
內容摘要:
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI開源代碼大模型的王座,再次易主!
來自素有“歐洲OpenAI”之稱的Mistral,用22B參數量表現超越了70B的Code Llama。
模型名為Codestral,將代碼的英文Code與公司名結合而成。
在80多種編程語言上進行過訓練后,Codestral用更少的參數實現了更高的性能,窗口長度也達到了32k,相比之前一眾4k、8k的模型大幅增加。
而且已經有人表示,GPT-4o和Claude3-Opus都失敗的代碼編輯任務,被Codestral成功解決了。
于是有網友直言,Codestral的推出,直接改寫了多語言代碼模型的游戲規則。
另一方面,還有網友直接@了知名本地大模型框架Ollama,希望能夠支持Codestral,結果Ollama這邊也迅速響應,在請求發出后1個小時就增加了對Codestral的支持。
那么,Codestral在測試中都取得了哪些成績呢?
開源編程模型的新王者Codestral的參數量為22B,支持32k的上下文窗口。
在開發過程中,研究人員使用了80多種編程語言的代碼數據對Codestral進行了訓練。
原文鏈接:最強開源編程大模型一夜易主:精通80+語言,僅22B
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...