OpenAI掀小模型血戰(zhàn)!蘋果DCLM強勢登場,碾壓Mistral 7B全開源
AIGC動態(tài)歡迎閱讀
原標題:OpenAI掀小模型血戰(zhàn)!蘋果DCLM強勢登場,碾壓Mistral 7B全開源
關鍵字:模型,數據,權重,蘋果,任務
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:桃子 喬楊
【新智元導讀】小模型時代來了?OpenAI帶著GPT-4o mini首次入局小模型戰(zhàn)場,Mistral AI、HuggingFace本周接布了小模型。如今,蘋果也發(fā)布了70億參數小模型DCLM,性能碾壓Mistral-7B。小模型的戰(zhàn)場,打起來了!
繼GPT-4o mini、Mistral NeMo發(fā)布之后,蘋果也入局了。
DCLM小模型包含兩種參數規(guī)模——70億和14億,發(fā)布即開源。最大70億參數超越了Mistral-7B ,性能接近Llama 3、Gemma。
根據蘋果ML小組研究科學家Vaishaal Shankar(也是DCLM研發(fā)人員)的說法,這是迄今為止性能最好的「真正開源」的模型,不僅有權重和訓練代碼,而且是基于開放數據集DCLM-Baseline。
相比模型性能,DCLM做出的「真正開源」的典范更加引人關注。
對比大部分科技巨頭只搞閉源模型,或「猶抱琵琶半遮面」,只開源代碼或權重的做法,大方的蘋果獲得了網友的好評。
此外,Shankar還預告說,之后會繼續(xù)上線模型中間檢查點和優(yōu)化器狀態(tài)。
難道,這就是LLM開源社區(qū)的春天了嗎?
DCLM
原文鏈接:OpenAI掀小模型血戰(zhàn)!蘋果DCLM強勢登場,碾壓Mistral 7B全開源
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...