首個AI Kaggle特級大師誕生,o1奪7金封王!
AIGC動態(tài)歡迎閱讀
原標題:首個AI Kaggle特級大師誕生,o1奪7金封王!
關(guān)鍵字:智能,模型,獎牌,報告,政策
文章來源:夕小瑤科技說
內(nèi)容字數(shù):0字
內(nèi)容摘要:
夕小瑤科技說 分享來源 | 新智元首個AI Kaggle特級大師誕生了!
剛剛,OpenAI發(fā)布了智能體基準MLE-bench,專為評估AI智能體在機器學(xué)習(xí)工程任務(wù)中的表現(xiàn)而打造。
為此,團隊從Kaggle上精選了75個真實世界數(shù)據(jù)科學(xué)比賽,并創(chuàng)建出一系列多樣化、具有挑戰(zhàn)性任務(wù)。
比如,訓(xùn)練模型、數(shù)據(jù)集準備、運行實驗等環(huán)節(jié),均有涉及。
要知道,OpenAI內(nèi)部一直都在致力于做出超級AI智能體,o1推理模型發(fā)布已經(jīng)讓他們實現(xiàn)了二級AGI。
在最新MLE-bench論文中,作者還揭示了實現(xiàn)AGI的關(guān)鍵所在——
AI智能體能夠解決MLE-bench所有問題,可能會帶來奇點。
論文地址:https://arxiv.org/abs/2410.07095
實驗結(jié)果表明,最強o1-preview聯(lián)手AIDE,在16.9%的比賽中達到了Kaggle銅牌級別的水平。
這說明,在某些任務(wù)中,AI已經(jīng)能夠與專業(yè)人類數(shù)據(jù)科學(xué)家相媲美。
不過,研究也揭示了AI與人類專業(yè)知識之間的顯著差距。也就是,AI在應(yīng)用標準技術(shù)方面表現(xiàn)良好,但在需要適應(yīng)性、創(chuàng)造性問題上,遇到了困難。
多位網(wǎng)友暗示道,基準都準備好了,明年我們
原文鏈接:首個AI Kaggle特級大師誕生,o1奪7金封王!
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介: