最強數(shù)學(xué)大模型易主！阿里千問新模型成績超GPT-4o，網(wǎng)友：這才是真“草莓”

AIGC動態(tài)1年前 (2024)發(fā)布量子位

AIGC動態(tài)歡迎閱讀

原標(biāo)題：最強數(shù)學(xué)大模型易主！阿里千問新模型成績超GPT-4o，網(wǎng)友：這才是真“草莓”
關(guān)鍵字：模型,數(shù)據(jù),版本,數(shù)學(xué),團隊
文章來源：量子位
內(nèi)容字數(shù)：0字

內(nèi)容摘要：

克雷西發(fā)自凹非寺量子位 | 公眾號 QbitAI最強數(shù)學(xué)大模型，現(xiàn)在易主！
阿里千問大模型團隊發(fā)布的Qwen2-Math，不僅超越了Llama 3.1-405B，也戰(zhàn)勝了GPT-4o、Claude 3.5等一系列閉源模型。
而且還會解決競賽級試題，在GPT-4只能做對一道的AIME 24中，Qwen2-Math答對的題目數(shù)量達到了兩位數(shù)。
Qwen2-Math一共有三個參數(shù)量的版本——72B，7B和1.5B。
最強的72B版本，在MATH數(shù)據(jù)集上比GPT-4o多得了7分，按比例算高出了9.6%。
7B版本也用不到十分之一的參數(shù)量，超過了72B的開源數(shù)學(xué)模型NuminaMath。
而且這個NuminaMath來頭不小，它的7B版本在全球首屆AIMO中獲獎，獎項由數(shù)學(xué)大牛陶哲軒頒發(fā)。
阿里高級算法專家林俊旸激動地宣布，千問團隊把Qwen2模型變成了一個數(shù)學(xué)高手。
fast.ai創(chuàng)始人Jeremy Howard看了直呼amazing。
網(wǎng)友更是驚嘆，原來這才是真正的“草莓”，這是開源的勝利，也是所有人的勝利。
超越GPT4o，會做競賽級試題如前文所說，Qwen2-Math共有72B、7B

原文鏈接：最強數(shù)學(xué)大模型易主！阿里千問新模型成績超GPT-4o，網(wǎng)友：這才是真“草莓”