Google 發(fā)布 CodeGemma:7B 力壓 CodeLLaMa-13B
AIGC動態(tài)歡迎閱讀
原標(biāo)題:Google 發(fā)布 CodeGemma:7B 力壓 CodeLLaMa-13B
關(guān)鍵字:模型,代碼,性能,自然語言,作者
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):2984字
內(nèi)容摘要:
夕小瑤科技說 原創(chuàng)作者 | 任同學(xué)剛剛發(fā)布!Google 帶來了新的 Gemma 家族成員,CodeGemma,這是基于預(yù)訓(xùn)練的 Gemma-2B 和 Gemma-7B 的代碼生成模型。
其上下文窗口長度為8K,在另外 500 B 個主要由英語、數(shù)學(xué)和代碼組成的 token 上進(jìn)行了訓(xùn)練,改進(jìn)了邏輯和數(shù)學(xué)推理能力,適合代碼生成任務(wù)。
CodeGemma-7B 在 HumanEval 上的表現(xiàn)優(yōu)于類似大小的7B模型,甚至還要超過 CodeLLaMa-13B。
不過,在 DeepSeekCoder-7B 面前,CodeGemma 還是要稍遜一籌!
CodeGemma支持包括 Python、JavaScript、Java、Kotlin、C++、C#、Rust、Go 在內(nèi)的多種編程語言。
CodeGemma包含三款模型:
CodeGemma 2B Base Model,專門針對代碼生成進(jìn)行訓(xùn)練,旨在快速生成代碼,適合需要隱私或高性能代碼生成的環(huán)境。
CodeGemma 7B Base Model,訓(xùn)練數(shù)據(jù)包括80%的代碼和20%的自然語言,適合代碼生成和理解。
CodeGemma 7B Ins
原文鏈接:Google 發(fā)布 CodeGemma:7B 力壓 CodeLLaMa-13B
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業(yè)、有趣、深度價值導(dǎo)向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國內(nèi)外頂級AI實驗室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189