菲爾茲獎得主親測GPT-4o,經(jīng)典過河難題失敗!最強Claude 3.5回答離譜,LeCun嘲諷LLM

AIGC動態(tài)歡迎閱讀
原標題:菲爾茲獎得主親測GPT-4o,經(jīng)典過河難題失敗!最強Claude 3.5回答離譜,LeCun嘲諷LLM
關(guān)鍵字:農(nóng)夫,模型,測試,問題,比率
文章來源:新智元
內(nèi)容字數(shù):0字
內(nèi)容摘要:
新智元報道編輯:桃子 喬楊
【新智元導讀】LLM能否解決「狼-山羊-卷心菜」經(jīng)典過河難題?最近,菲爾茲獎得主Timothy Gowers分享了實測GPT-4o的過程,模型在最簡單的題目上竟然做錯了,甚至網(wǎng)友們發(fā)現(xiàn),就連Claude 3.5也無法幸免。在經(jīng)典的「狼-山羊-卷心菜」過河問題上,如今所有的LLM都失敗了!
幾天前,菲爾茲獎得主、劍橋大學研究主任Timothy Gowers直接拿GPT-4o開刀,去解決動物過河難題。
在此,他給出了一個新的基準——廢話比率(crapness ratio),即LLM給出的總答案與正確答案之間的比率。
經(jīng)過測試,Gowers發(fā)現(xiàn)大模型的廢話比率可以達到5倍。
一開始,他先給出了一個農(nóng)民帶2只雞過河,一只船只能容納一個人和2個動物,那么農(nóng)夫帶著兩只雞渡河所需的最少渡河次數(shù)是多少?
別說成年人了,就拿低幼小孩子來說,一聽完題目,就立馬給出正確的答案。
搞笑的是,ChatGPT的回答分解了5個步驟,讓人看著極其愚蠢荒謬。
第一次渡河:農(nóng)夫帶著兩只雞一起過河;現(xiàn)狀:農(nóng)夫和兩只雞在河對岸。
第二次渡河:農(nóng)夫把兩只雞留在對岸,然后獨自返回;現(xiàn)狀:農(nóng)夫在起始岸
原文鏈接:菲爾茲獎得主親測GPT-4o,經(jīng)典過河難題失敗!最強Claude 3.5回答離譜,LeCun嘲諷LLM
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。

粵公網(wǎng)安備 44011502001135號