標簽:架構
新架構超越Transformer?由CMU和普林斯頓聯合推出,實現五倍推理速度提升并全面優化性能
大數據文摘受權轉載自頭部科技作者丨CongerryTransformer被挑戰了!2017年6月,8位谷歌研究人員共同發表了一篇神作《Attention is All You Need》。之所以稱...
五倍吞吐量,性能全面包圍Transformer:新架構Mamba引爆AI圈
機器之心報道編輯:張倩、蛋醬屹立不倒的 Transformer 迎來了一個強勁競爭者。在別的領域,如果你想形容一個東西非常重要,你可能將其形容為「撐起了某領域的...
Transformer挑戰者出現!斯坦福CMU聯合團隊,開源模型及代碼,公司已創辦
夢晨 發自 凹非寺量子位 | 公眾號 QbitAI現在ChatGPT等大模型一大痛點:處理長文本算力消耗巨大,背后原因是Transformer架構中注意力機制的二次復雜度。Flash...
顛覆Transformer霸權!CMU普林斯頓推Mamba新架構,解決致命bug推理速度暴增5倍
新智元報道編輯:編輯部【新智元導讀】誕生6周年的Transformer,霸主之位終于要被顛覆了?CMU、普林斯頓研究者發布的Mamba,解決了Transformer核心注意力層無...
人工智能基礎創新的第二增長曲線
來源:微軟亞洲研究院作者:韋福如編者按:2023年是微軟亞洲研究院建院25周年。借此機會,我們特別策劃了“智啟未來”系列文章,邀請到微軟亞洲研究院不同研究...
微軟亞洲研究院韋福如:人工智能基礎創新的第二增長曲線
機器之心專欄作者:韋福如本文為微軟亞洲研究院全球研究合伙人韋福如的分享,講述了他對人工智能、計算機及其交叉學科領域的觀點洞察及前沿展望。從人工智能...
MAXIEYE 發布青云BEV架構,重塑自動駕駛底層思考 |甲子光年
高階智駕的終極答卷。2023年11月29日,AI驅動的自動駕駛技術產品提供商——智駕科技MAXIEYE重磅召開主題為「虛實之間-BEV新范式和NOA真無圖」的技術戰略和新品...
大模型深入智慧之地,手機廠商會如何交卷?
受訪嘉賓 | 劉海鋒OPPO 數智工程事業部總裁作者 | 羅燕珊1一條新路出現:跟風與乘勢?大模型浪潮下的未見與先見在蓬勃發展的 AI 浪潮中,各行各業似乎都在積...
Keras 3.0一統江湖!大更新整合PyTorch、JAX,全球250萬開發者在用了
新智元報道編輯:編輯部【新智元導讀】今天,備受廣大開發者歡迎的深度學習框架Keras,正式更新了3.0版本,實現了對PyTorch和JAX的支持,同時性能提升,還能...
NVIDIA 大力支持 InfiniBand
點擊上方藍字關注我們“ NVIDIA最新的第三季度業績表現出色,營收達到181.2億美元,同比增長206%,季度環比增長34%。公司特別強調InfiniBand網絡的貢獻,其年...
智能的本質就是壓縮?馬毅團隊5年心血提出「白盒」Transformer, 打開LLM黑盒!
新智元報道編輯:潤 桃子【新智元導讀】來自UC伯克利,港大等機構的研究人員,開創性地提出了一種「白盒」Transformer結構——CRATE。他們通過將數據從高維度分...
信仰的歸信仰,商業的歸商業|AGI是信仰的游戲,還是商業的操縱?|這場鬧劇是GPT-5的內部覺醒,還是造物主的人性精妙設計?
點擊上方藍字關注我們圖:在這個月初的一個視頻訪談中,Ilya談到最新的GPT進展給他最震驚的突破是:當和GPT對話時,有那種被理解的感覺?!癊lon Musk在周末的O...
粵公網安備 44011502001135號