2B參數(shù)性能超Mistral-7B:面壁智能多模態(tài)端側(cè)模型開源

AIGC動態(tài)歡迎閱讀
原標題:2B參數(shù)性能超Mistral-7B:面壁智能多模態(tài)端側(cè)模型開源
關(guān)鍵字:模型,智能,報告,性能,參數(shù)
文章來源:機器之心
內(nèi)容字數(shù):4086字
內(nèi)容摘要:
機器之心報道
編輯:澤南千元機也能本地運行。在大模型不斷向著大體量方向前進的同時,最近一段時間,人們在優(yōu)化和部署方面也取得了成果。
2 月 1 日,面壁智能聯(lián)合清華 NLP 實驗室在北京正式發(fā)布了旗艦端側(cè)大模型「面壁 MiniCPM」。新一代大模型被稱為「性能小鋼炮」,直接擁抱終端部署,同時也具有同量級最強的多模態(tài)能力。
面壁智能本次提出的 MiniCPM 2B 參數(shù)量僅有 20 億,使用 1T token 的精選數(shù)據(jù)訓練。這是一個參數(shù)量上與 2018 年 BERT 同級的模型,面壁智能在其之上實現(xiàn)了極致的性能優(yōu)化與成本控制,讓該模型可以「越級打怪」。
面壁智能聯(lián)合創(chuàng)始人、CEO 李大海將新模型與業(yè)內(nèi)知名開源大模型 Mistral-7B 進行了對比,在多項主流評測榜單上,MiniCPM 2B 的性能全面超越了后者。與微軟近期提出的「小模型」Phi-2 相比,MiniCPM 也有很大優(yōu)勢。李大海表示,面壁智能的新模型還能越級實現(xiàn) 13B、30B 甚至 40B 模型的能力。在最接近用戶體驗的評測榜單 MT-Bench 上,MiniCPM 取得了 7 分的成績(GPT-4-Turbo 為 9
原文鏈接:2B參數(shù)性能超Mistral-7B:面壁智能多模態(tài)端側(cè)模型開源
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務平臺

粵公網(wǎng)安備 44011502001135號