AIGC動態歡迎閱讀
原標題:iPhone可跑2B小鋼炮!谷歌Gemma 2來襲,最強顯微鏡剖解LLM大腦
關鍵字:解讀,模型,報告,編碼器,特征
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】谷歌DeepMind的小模型來了,Gemma 2 2B直接擊敗了參數大幾個數量級的GPT-3.5和Mixtral 8x7B!而同時發布的Gemma Scope,如顯微鏡一般打破LLM黑箱,讓我們看清Gemma 2是如何決策的。谷歌DeepMind的小模型,又上新了!
就在剛剛,谷歌DeepMind發布Gemma 2 2B。它是從Gemma 2 27B中蒸餾而來。
雖然它的參數只有2.6B,但在LMSYS競技場上的得分,已經超越了GPT-3.5和Mixtral 8x7B!
在MMLU和MBPP基準測試中,它分別取得了56.1和36.6的優異成績;比起前代模型Gemma 1 2B,它的性能超過了10%。
小模型擊敗了大幾個數量級的大模型,再一次印證了最近業界非常看好的小模型方向。
谷歌在今天,一共公布了Gemma 2家族的三個新成員:
Gemma 2 2B:輕量級2B模型,在性能和效率之間實現了最大的平衡
ShieldGemma:基于Gemma 2構建的安全內容分類器模型,用于過濾AI模型的輸入和輸出,確保用戶安全
Gemma Scope:一種可
原文鏈接:iPhone可跑2B小鋼炮!谷歌Gemma 2來襲,最強顯微鏡剖解LLM大腦
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...