400萬(wàn)token,大模型推理飆升22倍!清華校友爆火一作,GitHub狂攬1.8k星
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:400萬(wàn)token,大模型推理飆升22倍!清華校友爆火一作,GitHub狂攬1.8k星
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):9827字
內(nèi)容摘要:新智元報(bào)道編輯:潤(rùn)【新智元導(dǎo)讀】大模型上下文限制不是事兒?大語(yǔ)言模型的上下文長(zhǎng)度限制從此不存在了?!Meta、MIT、CMU的研究者最近剛剛發(fā)表了一篇論文,提出了一種被稱(chēng)為是「高效流式語(yǔ)言模型」(Efficient Streaming Language Models,ESLM)的方法,可以讓有限上下文能力的語(yǔ)言模型能夠支持幾乎無(wú)限的上下文窗口。https://arxiv.org/pdf/2309.…
原文鏈接:點(diǎn)此閱讀原文:400萬(wàn)token,大模型推理飆升22倍!清華校友爆火一作,GitHub狂攬1.8k星
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類(lèi)社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載。
相關(guān)文章

暫無(wú)評(píng)論...