對標法國當紅大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年
AIGC動態(tài)歡迎閱讀
原標題:對標法國當紅大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年
關鍵字:知乎,模型,智能,小米,華為
文章來源:甲子光年
內容字數(shù):10829字
內容摘要:
成本是大模型的隱形競爭力。作者|劉楊楠???
編輯|趙健??
今天,清華系大模型公司「面壁智能」發(fā)布了首款終端旗艦大模型“面壁MiniCPM”,面壁智能給它起了個響亮的名字——“小鋼炮”。
據(jù)面壁智能聯(lián)合創(chuàng)始人、CEO李大海介紹,面壁MiniCPM的參數(shù)規(guī)模為2B,采用1T精選數(shù)據(jù),性能超越法國當紅的大模型Mistral-7B,越級比肩LLama 2-13B。其中,Mistral-7B背后的公司Mistral AI,被稱作“歐洲版的OpenAI”。
面壁MiniCPM核心實現(xiàn)的是用更小的尺寸、更低的成本,實現(xiàn)更強的性能?!靶〕叽缡悄P图夹g的極限競技場?!崩畲蠛Uf道。
所謂“端側大模型”,即模型服務部署在手機、電腦、IoT設備等本地終端,直接由終端芯片完成推理過程,無需聯(lián)網(wǎng)。2023年下半年,華為、小米、vivo、OPPO、榮耀、蘋果、三星等海內外主流手機廠商均在端側大模型有所布局,面壁智能則是第一個布局端側模型的大模型廠商。
端側大模型戰(zhàn)火越演越烈,為何吸引眾多廠商紛紛參與?以“大模型+Agent”為核心戰(zhàn)略的面壁智能,為何又率先布局端側大模型?
發(fā)布會后,「甲子光年」等媒體與面壁智能
原文鏈接:對標法國當紅大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年
聯(lián)系作者
文章來源:甲子光年
作者微信:jazzyear
作者簡介:甲子光年是一家科技智庫,包含智庫、社群、企業(yè)服務版塊,立足中國科技創(chuàng)新前沿陣地,動態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術升級案例,推動人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應用與落地。