大模型“腦回路”統(tǒng)一了?LLMs竟然能正確回答其他模型虛構(gòu)的題目
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:大模型“腦回路”統(tǒng)一了?LLMs竟然能正確回答其他模型虛構(gòu)的題目
關(guān)鍵字:模型,問題,正確率,上下文,報(bào)告
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
來源:夕小瑤科技說 原創(chuàng)
作者:謝年年
最近開源模型Llama3.1上線,其405B模型竟超越閉源GPT-4o,一夜之間成最強(qiáng)大模型!
然而榜首的位置還沒坐熱,僅隔一天,Mistral AI團(tuán)隊(duì)發(fā)布Mistral Large 2 ,最強(qiáng)開源再易主!
大模型之間的競(jìng)爭(zhēng)異常激烈,榜單的分?jǐn)?shù)也是越刷越高,你解決不了的問題,對(duì)我來說so easy!比如問倒一眾模型的問題:3.9和3.11哪個(gè)大?Mistral Large 2模型居然答對(duì)了!
LLMs之間的規(guī)模和能力或許各不相同,但在chatgpt之后的LLMs,無論在架構(gòu)、訓(xùn)練方式、數(shù)據(jù)方面都高度統(tǒng)一:比如都使用僅解碼器的 transformer的結(jié)構(gòu),以及都有位置嵌入設(shè)計(jì),預(yù)訓(xùn)練語料庫由書籍、互聯(lián)網(wǎng)文本和代碼組成,使用基于隨機(jī)梯度下降(SGD)進(jìn)行優(yōu)化 ,以及在預(yù)訓(xùn)練后進(jìn)行指令調(diào)優(yōu)和對(duì)齊的類似程序等等。
Salesforce AI團(tuán)隊(duì)最近就發(fā)現(xiàn):不同的大模型家族之間,無論是閉源代表GPT和Claude,還是開源代表Mistral和Llama 3在面對(duì)虛構(gòu)的問題時(shí)展現(xiàn)出驚人的相似性!
團(tuán)隊(duì)首先提示一個(gè)問題模型(QM)生成一個(gè)虛構(gòu)的選擇題并指出
原文鏈接:大模型“腦回路”統(tǒng)一了?LLMs竟然能正確回答其他模型虛構(gòu)的題目
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:
作者簡(jiǎn)介: