對(duì)標(biāo)法國(guó)當(dāng)紅大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:對(duì)標(biāo)法國(guó)當(dāng)紅大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年
關(guān)鍵字:知乎,模型,智能,小米,華為
文章來(lái)源:甲子光年
內(nèi)容字?jǐn)?shù):10829字
內(nèi)容摘要:
成本是大模型的隱形競(jìng)爭(zhēng)力。作者|劉楊楠???
編輯|趙健??
今天,清華系大模型公司「面壁智能」發(fā)布了首款終端旗艦大模型“面壁MiniCPM”,面壁智能給它起了個(gè)響亮的名字——“小鋼炮”。
據(jù)面壁智能聯(lián)合創(chuàng)始人、CEO李大海介紹,面壁MiniCPM的參數(shù)規(guī)模為2B,采用1T精選數(shù)據(jù),性能超越法國(guó)當(dāng)紅的大模型Mistral-7B,越級(jí)比肩LLama 2-13B。其中,Mistral-7B背后的公司Mistral AI,被稱(chēng)作“歐洲版的OpenAI”。
面壁MiniCPM核心實(shí)現(xiàn)的是用更小的尺寸、更低的成本,實(shí)現(xiàn)更強(qiáng)的性能。“小尺寸是模型技術(shù)的極限競(jìng)技場(chǎng)。”李大海說(shuō)道。
所謂“端側(cè)大模型”,即模型服務(wù)部署在手機(jī)、電腦、IoT設(shè)備等本地終端,直接由終端芯片完成推理過(guò)程,無(wú)需聯(lián)網(wǎng)。2023年下半年,華為、小米、vivo、OPPO、榮耀、蘋(píng)果、三星等海內(nèi)外主流手機(jī)廠(chǎng)商均在端側(cè)大模型有所布局,面壁智能則是第一個(gè)布局端側(cè)模型的大模型廠(chǎng)商。
端側(cè)大模型戰(zhàn)火越演越烈,為何吸引眾多廠(chǎng)商紛紛參與?以“大模型+Agent”為核心戰(zhàn)略的面壁智能,為何又率先布局端側(cè)大模型?
發(fā)布會(huì)后,「甲子光年」等媒體與面壁智能
原文鏈接:對(duì)標(biāo)法國(guó)當(dāng)紅大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年
聯(lián)系作者
文章來(lái)源:甲子光年
作者微信:jazzyear
作者簡(jiǎn)介:甲子光年是一家科技智庫(kù),包含智庫(kù)、社群、企業(yè)服務(wù)版塊,立足中國(guó)科技創(chuàng)新前沿陣地,動(dòng)態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級(jí)案例,推動(dòng)人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。