開源12天，包攬Hugging Face、OpenCompass等權(quán)威榜單冠軍，通義千問狂甩Llama 2成新標(biāo)桿

AIGC動態(tài)2年前 (2023)發(fā)布智東西

AIGC動態(tài)歡迎閱讀

原標(biāo)題：開源12天，包攬Hugging Face、OpenCompass等權(quán)威榜單冠軍，通義千問狂甩Llama 2成新標(biāo)桿

文章來源：智東西

內(nèi)容字?jǐn)?shù)：8361字

內(nèi)容摘要：國產(chǎn)大模型出圈海外，向GPT-4發(fā)起沖擊。作者|香草編輯|漠影國產(chǎn)大模型又雙叒出圈了？智東西12月12日報道，近日，阿里云通義千問720億參數(shù)的模型Qwen-72B力壓Llama2等國內(nèi)外開源大模型，登頂全球最大模型社區(qū)Hugging Face的開源大模型排行榜（Open LLM Leaderboard）榜首。▲HuggingFace開源大模型排行榜，數(shù)據(jù)截至12月12日在六個維度的測評中，通義千問取得平均73.6分的成績。其中，在考察數(shù)學(xué)推理能力的GSM8K和考察事實(shí)性問答能力的TruthfulQA基準(zhǔn)上，通義千問分別超出Llama2分?jǐn)?shù)的30.3%和34%。而就在今天，在由上海AI實(shí)驗(yàn)室推出的、國內(nèi)權(quán)威開源大模型評測OpenCompass的最新中文大模型榜單上，通義千問72B同樣拿下第一。▲OpenCompass中文大模型榜單，數(shù)據(jù)截至12月12日開源12天，通義千問72B即斬獲多項(xiàng)權(quán)…

原文鏈接：點(diǎn)此閱讀原文：開源12天，包攬Hugging Face、OpenCompass等權(quán)威榜單冠軍，通義千問狂甩Llama 2成新標(biāo)桿