GPT-4不服被Bard反超:最新模型已入場
AIGC動態(tài)歡迎閱讀
原標(biāo)題:GPT-4不服被Bard反超:最新模型已入場
關(guān)鍵字:模型,排行榜,表示,用戶,實時
文章來源:量子位
內(nèi)容字?jǐn)?shù):2666字
內(nèi)容摘要:
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAI“大模型排位賽”權(quán)威榜單Chatbot Arena刷新:
谷歌Bard超越GPT-4,排名位居第二,僅次于GPT-4 Turbo。
然鵝,眾多網(wǎng)友對此卻表示“不服”、“不公平”。
原來,谷歌AI掌門人Jeff Dean透露,Bard性能大幅提升,是因為搭載了新版大模型——Gemini Pro-scale。
這也就意味著,打“排位賽”的Bard具備了聯(lián)網(wǎng)功能。
網(wǎng)友的質(zhì)疑正是圍繞著這一點展開:
在同一個排行榜上混合在線和離線大模型,是極易引起誤解的。
Hugging Face的“首席羊駝官”O(jiān)mar Sanseviero也表示:
既然如此…我也可以向lmsys提交具有搜索功能的Mixtral嗎?
面對種種質(zhì)疑聲,Imsys官方做出了回應(yīng),其中指出:
Arena排行榜是實時的,大家如有疑問,可在Arena中直接比較模型并投票;
投票數(shù)據(jù)公開透明,還會即將發(fā)布關(guān)于用戶提示多樣性和投票質(zhì)量的研究以及相應(yīng)的數(shù)據(jù)集;
對于網(wǎng)友們最關(guān)心的被Bard超越的GPT-4是不聯(lián)網(wǎng)版本的問題,Imsys表示“如果實時數(shù)據(jù)的接入能夠提升用戶體驗,排行榜將予以體現(xiàn)
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破