最強數(shù)學(xué)大模型易主!阿里千問新模型成績超GPT-4o,網(wǎng)友:這才是真“草莓”
AIGC動態(tài)歡迎閱讀
原標(biāo)題:最強數(shù)學(xué)大模型易主!阿里千問新模型成績超GPT-4o,網(wǎng)友:這才是真“草莓”
關(guān)鍵字:模型,數(shù)據(jù),版本,數(shù)學(xué),團(tuán)隊
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI最強數(shù)學(xué)大模型,現(xiàn)在易主!
阿里千問大模型團(tuán)隊發(fā)布的Qwen2-Math,不僅超越了Llama 3.1-405B,也戰(zhàn)勝了GPT-4o、Claude 3.5等一系列閉源模型。
而且還會解決競賽級試題,在GPT-4只能做對一道的AIME 24中,Qwen2-Math答對的題目數(shù)量達(dá)到了兩位數(shù)。
Qwen2-Math一共有三個參數(shù)量的版本——72B,7B和1.5B。
最強的72B版本,在MATH數(shù)據(jù)集上比GPT-4o多得了7分,按比例算高出了9.6%。
7B版本也用不到十分之一的參數(shù)量,超過了72B的開源數(shù)學(xué)模型NuminaMath。
而且這個NuminaMath來頭不小,它的7B版本在全球首屆AIMO中獲獎,獎項由數(shù)學(xué)大牛陶哲軒頒發(fā)。
阿里高級算法專家林俊旸激動地宣布,千問團(tuán)隊把Qwen2模型變成了一個數(shù)學(xué)高手。
fast.ai創(chuàng)始人Jeremy Howard看了直呼amazing。
網(wǎng)友更是驚嘆,原來這才是真正的“草莓”,這是開源的勝利,也是所有人的勝利。
超越GPT4o,會做競賽級試題如前文所說,Qwen2-Math共有72B、7B
原文鏈接:最強數(shù)學(xué)大模型易主!阿里千問新模型成績超GPT-4o,網(wǎng)友:這才是真“草莓”
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: