國產(chǎn)大模型競技場首超GPT-4o！零一萬物GLM共同躋身Top10

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布量子位

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：國產(chǎn)大模型競技場首超GPT-4o！零一萬物GLM共同躋身Top10
關(guān)鍵字：模型,競技場,能力,萬物,博士
文章來源：量子位
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

西風(fēng) 發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI國產(chǎn)大模型首次在公開榜單上超過GPT-4o！
就在剛剛，“大模型六小強(qiáng)”之一的零一萬物正式對外發(fā)布新旗艦?zāi)Ｐ汀猋i-Lightning（閃電）。
在大模型競技場（Chatbot Arena）上，Yi-Lightning性能直沖總榜單并列第6，數(shù)學(xué)分榜并列第3，代碼等其它分榜也名列前茅。
總成績幾乎與馬斯克最新xAI大模型Grok-2-08-13持平，超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等頂流。
同時(shí)，國內(nèi)清華系大模型公司智譜AI的GLM-4-Plus也殺進(jìn)了總榜，位居第9位。
該榜單結(jié)果來自全球累積超千萬次的人類用戶盲測投票。
前段時(shí)間大模型競技場還剛剛更新了規(guī)則，新榜單對AI回答的長度和風(fēng)格等特征做了降權(quán)處理，分?jǐn)?shù)更能反映模型真正解決問題的能力。
這次Yi-Lightning殺出重圍，Lmsys團(tuán)隊(duì)特意發(fā)帖子，稱這是競技場上的大新聞：
大模型競技場總榜第六、國產(chǎn)第一細(xì)看大模型競技場分類榜上的“賽況”，Yi-Lightning各項(xiàng)能力都排在前頭。
在中

原文鏈接：國產(chǎn)大模型競技場首超GPT-4o！零一萬物GLM共同躋身Top10