開源12天,包攬Hugging Face、OpenCompass等權(quán)威榜單冠軍,通義千問狂甩Llama 2成新標(biāo)桿
AIGC動態(tài)歡迎閱讀
原標(biāo)題:開源12天,包攬Hugging Face、OpenCompass等權(quán)威榜單冠軍,通義千問狂甩Llama 2成新標(biāo)桿
文章來源:智東西
內(nèi)容字?jǐn)?shù):8361字
內(nèi)容摘要:國產(chǎn)大模型出圈海外,向GPT-4發(fā)起沖擊。作者|香草編輯|漠影國產(chǎn)大模型又雙叒出圈了?智東西12月12日報道,近日,阿里云通義千問720億參數(shù)的模型Qwen-72B力壓Llama2等國內(nèi)外開源大模型,登頂全球最大模型社區(qū)Hugging Face的開源大模型排行榜(Open LLM Leaderboard)榜首。▲HuggingFace開源大模型排行榜,數(shù)據(jù)截至12月12日在六個維度的測評中,通義千問取得平均73.6分的成績。其中,在考察數(shù)學(xué)推理能力的GSM8K和考察事實(shí)性問答能力的TruthfulQA基準(zhǔn)上,通義千問分別超出Llama2分?jǐn)?shù)的30.3%和34%。而就在今天,在由上海AI實(shí)驗(yàn)室推出的、國內(nèi)權(quán)威開源大模型評測OpenCompass的最新中文大模型榜單上,通義千問72B同樣拿下第一。▲OpenCompass中文大模型榜單,數(shù)據(jù)截至12月12日開源12天,通義千問72B即斬獲多項(xiàng)權(quán)…
原文鏈接:點(diǎn)此閱讀原文:開源12天,包攬Hugging Face、OpenCompass等權(quán)威榜單冠軍,通義千問狂甩Llama 2成新標(biāo)桿
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。