大模型的高考數(shù)學(xué)成績單:及格已經(jīng)非常好了
AIGC動態(tài)歡迎閱讀
原標(biāo)題:大模型的高考數(shù)學(xué)成績單:及格已經(jīng)非常好了
關(guān)鍵字:錯誤,豆包,模型,部分,能力
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心發(fā)布
機(jī)器之心編輯部讓考生頭皮發(fā)麻的高考數(shù)學(xué),可難倒了頂尖 AI 大模型。
一年一度的高考即將落幕,衷心希望各位考生都超常發(fā)揮,考出滿意的好成績!!
和往年一樣,除了讓 AI 大模型寫寫高考作文,我們也選取了六家國內(nèi)頭部大模型公司的產(chǎn)品與考生們一同參與一場客觀且公平(讓眾多考生頭皮發(fā)麻)的高考數(shù)學(xué)考試(新課標(biāo) Ⅰ 卷),其中包括 GPT-4o、GLM-4、文心一言 4.0、豆包、百小應(yīng)(百川 4)以及通義千問 2.5。
先來瞧一瞧這份「大模型成績單」:令人驚訝的是,在這次模擬考試中,大模型(產(chǎn)品)的表現(xiàn)并未達(dá)到預(yù)期,甚至出現(xiàn)了幾乎全部不及格的情況,只有智譜最新發(fā)布的 GLM-4-0520 模型超過了及格線。
對大模型產(chǎn)品來說,高考語文作文可以直接測試它們的創(chuàng)造性寫作技巧,包括構(gòu)思、組織和表達(dá)觀點(diǎn)的能力。
而在數(shù)學(xué)考試測試中,除了基本的計算能力、對數(shù)學(xué)知識的掌握,更能體現(xiàn)大模型在邏輯推理、抽象思維和問題解決方面的高級能力。大模型必須理解并運(yùn)用數(shù)學(xué)概念、公式和定理,這要求它具備深厚的數(shù)學(xué)知識基礎(chǔ)。同時,邏輯推理能力是解答數(shù)學(xué)題目的關(guān)鍵,大模型需要通過嚴(yán)密的邏輯推導(dǎo)來解決問題。
具體
原文鏈接:大模型的高考數(shù)學(xué)成績單:及格已經(jīng)非常好了
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺