國(guó)產(chǎn)大模型競(jìng)技場(chǎng)首超GPT-4o!零一萬(wàn)物GLM共同躋身Top10
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:國(guó)產(chǎn)大模型競(jìng)技場(chǎng)首超GPT-4o!零一萬(wàn)物GLM共同躋身Top10
關(guān)鍵字:模型,競(jìng)技場(chǎng),能力,萬(wàn)物,博士
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI國(guó)產(chǎn)大模型首次在公開(kāi)榜單上超過(guò)GPT-4o!
就在剛剛,“大模型六小強(qiáng)”之一的零一萬(wàn)物正式對(duì)外發(fā)布新旗艦?zāi)P汀猋i-Lightning(閃電)。
在大模型競(jìng)技場(chǎng)(Chatbot Arena)上,Yi-Lightning性能直沖總榜單并列第6,數(shù)學(xué)分榜并列第3,代碼等其它分榜也名列前茅。
總成績(jī)幾乎與馬斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等頂流。
同時(shí),國(guó)內(nèi)清華系大模型公司智譜AI的GLM-4-Plus也殺進(jìn)了總榜,位居第9位。
該榜單結(jié)果來(lái)自全球累積超千萬(wàn)次的人類用戶盲測(cè)投票。
前段時(shí)間大模型競(jìng)技場(chǎng)還剛剛更新了規(guī)則,新榜單對(duì)AI回答的長(zhǎng)度和風(fēng)格等特征做了降權(quán)處理,分?jǐn)?shù)更能反映模型真正解決問(wèn)題的能力。
這次Yi-Lightning殺出重圍,Lmsys團(tuán)隊(duì)特意發(fā)帖子,稱這是競(jìng)技場(chǎng)上的大新聞:
大模型競(jìng)技場(chǎng)總榜第六、國(guó)產(chǎn)第一細(xì)看大模型競(jìng)技場(chǎng)分類榜上的“賽況”,Yi-Lightning各項(xiàng)能力都排在前頭。
在中
原文鏈接:國(guó)產(chǎn)大模型競(jìng)技場(chǎng)首超GPT-4o!零一萬(wàn)物GLM共同躋身Top10
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介: