2B參數(shù)性能超Mistral-7B:面壁智能多模態(tài)端側(cè)模型開(kāi)源
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:2B參數(shù)性能超Mistral-7B:面壁智能多模態(tài)端側(cè)模型開(kāi)源
關(guān)鍵字:模型,智能,報(bào)告,性能,參數(shù)
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):4086字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:澤南千元機(jī)也能本地運(yùn)行。在大模型不斷向著大體量方向前進(jìn)的同時(shí),最近一段時(shí)間,人們?cè)趦?yōu)化和部署方面也取得了成果。
2 月 1 日,面壁智能聯(lián)合清華 NLP 實(shí)驗(yàn)室在北京正式發(fā)布了旗艦端側(cè)大模型「面壁 MiniCPM」。新一代大模型被稱(chēng)為「性能小鋼炮」,直接擁抱終端部署,同時(shí)也具有同量級(jí)最強(qiáng)的多模態(tài)能力。
面壁智能本次提出的 MiniCPM 2B 參數(shù)量?jī)H有 20 億,使用 1T token 的精選數(shù)據(jù)訓(xùn)練。這是一個(gè)參數(shù)量上與 2018 年 BERT 同級(jí)的模型,面壁智能在其之上實(shí)現(xiàn)了極致的性能優(yōu)化與成本控制,讓該模型可以「越級(jí)打怪」。
面壁智能聯(lián)合創(chuàng)始人、CEO 李大海將新模型與業(yè)內(nèi)知名開(kāi)源大模型 Mistral-7B 進(jìn)行了對(duì)比,在多項(xiàng)主流評(píng)測(cè)榜單上,MiniCPM 2B 的性能全面超越了后者。與微軟近期提出的「小模型」Phi-2 相比,MiniCPM 也有很大優(yōu)勢(shì)。李大海表示,面壁智能的新模型還能越級(jí)實(shí)現(xiàn) 13B、30B 甚至 40B 模型的能力。在最接近用戶(hù)體驗(yàn)的評(píng)測(cè)榜單 MT-Bench 上,MiniCPM 取得了 7 分的成績(jī)(GPT-4-Turbo 為 9
原文鏈接:2B參數(shù)性能超Mistral-7B:面壁智能多模態(tài)端側(cè)模型開(kāi)源
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)