標(biāo)簽:狀態(tài)
Mamba可以替代Transformer,但它們也能組合起來使用
機(jī)器之心報(bào)道 編輯:Panda W1+1>2。Transformer 很厲害,但并不完美,尤其是在處理長序列方面。而狀態(tài)空間模型(SSM)則在長序列上的表現(xiàn)相當(dāng)不俗。早在去年...
一個(gè)框架整合大腦理論 8 具身智能的未來 有生計(jì)算
來源:CreateAMind ?? ??摘要(3萬字長文) 這篇綜述激發(fā)并綜合了神經(jīng)科學(xué)啟發(fā)的人工智能和仿生計(jì)算在人類計(jì)算方面的研究成果。具體來說,我們從感知行為的理論...
誰能撼動(dòng)Transformer統(tǒng)治地位?Mamba作者談LLM未來架構(gòu)
機(jī)器之心編譯 機(jī)器之心編輯部自 2017 年被提出以來,Transformer 已成為 AI 大模型的主流架構(gòu),未來這種情況是一直持續(xù),還是會(huì)有新的研究出現(xiàn),我們不妨先聽...
挑戰(zhàn)Transformer的Mamba是什么來頭?作者博士論文理清SSM進(jìn)化路徑
機(jī)器之心報(bào)道 編輯:張倩對(duì) SSM 感興趣的研究者不妨讀一下這篇博士論文。 在大模型領(lǐng)域,Transformer 憑一己之力撐起了整個(gè)江山。但隨著模型規(guī)模的擴(kuò)展和需要...
逝者如斯夫,不舍晝夜,你,真的懂時(shí)間嗎?
來源:中科院物理所作?者:Areeba Merriam翻譯:小聰審校:利有攸往原文鏈接:The True Nature of Time???????????????????????時(shí)間是自然界的一大謎團(tuán),人們...
Transformer挑戰(zhàn)者出現(xiàn)!斯坦福CMU聯(lián)合團(tuán)隊(duì),開源模型及代碼,公司已創(chuàng)辦
夢晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI現(xiàn)在ChatGPT等大模型一大痛點(diǎn):處理長文本算力消耗巨大,背后原因是Transformer架構(gòu)中注意力機(jī)制的二次復(fù)雜度。Flash...
OpenAI神秘Q*項(xiàng)目解密!誕生30+年「Q學(xué)習(xí)」算法引全球網(wǎng)友終極猜想
新智元報(bào)道編輯:桃子【新智元導(dǎo)讀】OpenAI神秘Q*項(xiàng)目剛被曝出一天,就已經(jīng)引發(fā)了各種猜想。一時(shí)間,「Q-learning」成為許多人的關(guān)注焦點(diǎn)。剛剛過去的一天,O...
圖靈和馮·諾依曼的遺產(chǎn):生命計(jì)算機(jī)的架構(gòu)
來源:返樸撰文:Hashim M. Al-Hashimi翻譯:汪顯意審校:小木球編輯:梁金在通用圖靈機(jī)的基礎(chǔ)上,數(shù)學(xué)家馮·諾依曼進(jìn)一步發(fā)明了自復(fù)制機(jī)器,回答了生物學(xué)中最...
一個(gè)小妙招從Prompt菜鳥秒變專家!加州大學(xué)提出PromptAgent,幫你高效使用ChatGPT!
夕小瑤科技說 原創(chuàng)作者 | 謝年年、王二狗有了ChatGPT、GPT4之后,我們的工作學(xué)習(xí)效率得到大大提升(特別在湊字?jǐn)?shù)方面?(???????)?)。作為一個(gè)工具,有人覺得...
超越強(qiáng)化學(xué)習(xí):生命啟發(fā)的AI
來源:CreateAMind受生命啟發(fā)的內(nèi)感受性人工智能 (萬字長文)摘要構(gòu)建自主的(即基于個(gè)人需求選擇目標(biāo))和自適應(yīng)的(即在不斷變化的環(huán)境中生存)智能 體一直...
逃離「內(nèi)耗」的年輕人,跑進(jìn)了 lululemon
追求快樂也接納脆弱和恐懼你在20-30歲對(duì)自己有疼痛感,這是特別正常的。簡里里在今年的 lululemon 「一起好狀態(tài)」主題活動(dòng)分享上說道。她認(rèn)為,這個(gè)時(shí)期其實(shí)...
TradeMaster最新發(fā)布沙盒工具箱,探索量化交易的全新維度
TradeMaster 是由新加坡南洋理工大學(xué)開發(fā)的一款基于強(qiáng)化學(xué)習(xí)的開源量化交易平臺(tái)。為了更全面地評(píng)價(jià)和提升算法性能,我們推出了沙盒工具箱,同時(shí)搭配了易于使...
功能超全的AI Agents開源庫來了,能寫小說,還能當(dāng)導(dǎo)購、銷售
機(jī)器之心專欄機(jī)器之心編輯部來自波形智能、蘇黎世聯(lián)邦理工和浙江大學(xué)的算法團(tuán)隊(duì)和研究者發(fā)布了名為 Agents 的開源框架。近一年來,隨著大模型突飛猛進(jìn)的發(fā)展...
LLaMA微調(diào)顯存需求減半,清華提出4比特優(yōu)化器
機(jī)器之心專欄作者:李炳睿大模型的訓(xùn)練和微調(diào)對(duì)顯存要求很高,優(yōu)化器狀態(tài)是顯存主要開銷之一。近日,清華大學(xué)朱軍、陳鍵飛團(tuán)隊(duì)提出了用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的 4 比...
粵公網(wǎng)安備 44011502001135號(hào)