標簽:架構

新架構超越Transformer?由CMU和普林斯頓聯合推出,實現五倍推理速度提升并全面優化性能

大數據文摘受權轉載自頭部科技作者丨CongerryTransformer被挑戰了!2017年6月,8位谷歌研究人員共同發表了一篇神作《Attention is All You Need》。之所以稱...
閱讀原文

五倍吞吐量,性能全面包圍Transformer:新架構Mamba引爆AI圈

機器之心報道編輯:張倩、蛋醬屹立不倒的 Transformer 迎來了一個強勁競爭者。在別的領域,如果你想形容一個東西非常重要,你可能將其形容為「撐起了某領域的...
閱讀原文

Transformer挑戰者出現!斯坦福CMU聯合團隊,開源模型及代碼,公司已創辦

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI現在ChatGPT等大模型一大痛點:處理長文本算力消耗巨大,背后原因是Transformer架構中注意力機制的二次復雜度。Flash...
閱讀原文

顛覆Transformer霸權!CMU普林斯頓推Mamba新架構,解決致命bug推理速度暴增5倍

新智元報道編輯:編輯部【新智元導讀】誕生6周年的Transformer,霸主之位終于要被顛覆了?CMU、普林斯頓研究者發布的Mamba,解決了Transformer核心注意力層無...
閱讀原文

當蘋果芯片跌落神壇

安卓芯逆襲蘋果的秘密,藏在這20年里。作者|云鵬編輯|心緣最近國內安卓陣營迎來了一波接一波的新機發布熱潮,而在各家發布會上,蘋果A17 Pro著實成了“??汀保?..
閱讀原文

人工智能基礎創新的第二增長曲線

來源:微軟亞洲研究院作者:韋福如編者按:2023年是微軟亞洲研究院建院25周年。借此機會,我們特別策劃了“智啟未來”系列文章,邀請到微軟亞洲研究院不同研究...
閱讀原文

微軟亞洲研究院韋福如:人工智能基礎創新的第二增長曲線

機器之心專欄作者:韋福如本文為微軟亞洲研究院全球研究合伙人韋福如的分享,講述了他對人工智能、計算機及其交叉學科領域的觀點洞察及前沿展望。從人工智能...
閱讀原文

MAXIEYE 發布青云BEV架構,重塑自動駕駛底層思考 |甲子光年

高階智駕的終極答卷。2023年11月29日,AI驅動的自動駕駛技術產品提供商——智駕科技MAXIEYE重磅召開主題為「虛實之間-BEV新范式和NOA真無圖」的技術戰略和新品...
閱讀原文

大模型深入智慧之地,手機廠商會如何交卷?

受訪嘉賓 | 劉海鋒OPPO 數智工程事業部總裁作者 | 羅燕珊1一條新路出現:跟風與乘勢?大模型浪潮下的未見與先見在蓬勃發展的 AI 浪潮中,各行各業似乎都在積...
閱讀原文

Keras 3.0一統江湖!大更新整合PyTorch、JAX,全球250萬開發者在用了

新智元報道編輯:編輯部【新智元導讀】今天,備受廣大開發者歡迎的深度學習框架Keras,正式更新了3.0版本,實現了對PyTorch和JAX的支持,同時性能提升,還能...
閱讀原文

NVIDIA 大力支持 InfiniBand

點擊上方藍字關注我們“ NVIDIA最新的第三季度業績表現出色,營收達到181.2億美元,同比增長206%,季度環比增長34%。公司特別強調InfiniBand網絡的貢獻,其年...
閱讀原文

智能的本質就是壓縮?馬毅團隊5年心血提出「白盒」Transformer, 打開LLM黑盒!

新智元報道編輯:潤 桃子【新智元導讀】來自UC伯克利,港大等機構的研究人員,開創性地提出了一種「白盒」Transformer結構——CRATE。他們通過將數據從高維度分...
閱讀原文

信仰的歸信仰,商業的歸商業|AGI是信仰的游戲,還是商業的操縱?|這場鬧劇是GPT-5的內部覺醒,還是造物主的人性精妙設計?

點擊上方藍字關注我們圖:在這個月初的一個視頻訪談中,Ilya談到最新的GPT進展給他最震驚的突破是:當和GPT對話時,有那種被理解的感覺?!癊lon Musk在周末的O...
閱讀原文

別再聲討零一萬物了

Transformer 時代,重復造輪子或是AI爆發的最大阻礙。作者 | 陳彩嫻編輯 | 岑 峰最近兩天,由原阿里技術副總裁、深度學習框架 Caffe 發明者賈揚清一則朋友圈...
閱讀原文

大模型架構創新已死?

三石 白交發自 凹非寺量子位 | 公眾號 QbitAI一場圍繞大模型自研和創新的討論,這兩天在技術圈里炸了鍋。起初,前阿里技術VP賈揚清,盆友圈爆料吐槽:有大廠...
閱讀原文
11011121314