2B參數(shù)性能超Mistral-7B：面壁智能多模態(tài)端側(cè)模型開源

AIGC動態(tài)2年前 (2024)發(fā)布機器之心

AIGC動態(tài)歡迎閱讀

原標題：2B參數(shù)性能超Mistral-7B：面壁智能多模態(tài)端側(cè)模型開源
關(guān)鍵字：模型,智能,報告,性能,參數(shù)
文章來源：機器之心
內(nèi)容字數(shù)：4086字

內(nèi)容摘要：

機器之心報道
編輯：澤南千元機也能本地運行。在大模型不斷向著大體量方向前進的同時，最近一段時間，人們在優(yōu)化和部署方面也取得了成果。
2 月 1 日，面壁智能聯(lián)合清華 NLP 實驗室在北京正式發(fā)布了旗艦端側(cè)大模型「面壁 MiniCPM」。新一代大模型被稱為「性能小鋼炮」，直接擁抱終端部署，同時也具有同量級最強的多模態(tài)能力。
面壁智能本次提出的 MiniCPM 2B 參數(shù)量僅有 20 億，使用 1T token 的精選數(shù)據(jù)訓練。這是一個參數(shù)量上與 2018 年 BERT 同級的模型，面壁智能在其之上實現(xiàn)了極致的性能優(yōu)化與成本控制，讓該模型可以「越級打怪」。
面壁智能聯(lián)合創(chuàng)始人、CEO 李大海將新模型與業(yè)內(nèi)知名開源大模型 Mistral-7B 進行了對比，在多項主流評測榜單上，MiniCPM 2B 的性能全面超越了后者。與微軟近期提出的「小模型」Phi-2 相比，MiniCPM 也有很大優(yōu)勢。李大海表示，面壁智能的新模型還能越級實現(xiàn) 13B、30B 甚至 40B 模型的能力。在最接近用戶體驗的評測榜單 MT-Bench 上，MiniCPM 取得了 7 分的成績（GPT-4-Turbo 為 9

原文鏈接：2B參數(shù)性能超Mistral-7B：面壁智能多模態(tài)端側(cè)模型開源