標簽:節點
【深度萬文】10 萬卡 H100 集群的盡頭……
7月25日上午10點,中國科學技術大學與微軟亞洲研究院聯合培養博士生張博文將在智猩猩直播講解微軟亞洲研究院開源成果GaussianCube,主題為《結構化3DGS為高質...
夏天太熱怎么辦?AI 為“降溫”材料發現提速數千倍,你的手機、電腦或許再也不發燙了
大數據文摘受權轉載自學術頭條 炎炎夏日,智能手機、平板電腦等電子設備常因“過熱”而產生性能、安全問題。如何設計出散熱更好的電子產品,材料是關鍵。 而其...
KDD 2024|港大黃超團隊深度解析大模型在圖機器學習領域的「未知邊界」
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
首個WebAgent在線評測框架和流程數據管理平臺來了,GPT-4、Qwen登頂閉源和開源榜首!
夕小瑤科技說 原創作者 | 潘奕琛、孔德涵、周思達、崔成 在當今科技迅速發展的時代,大型語言模型(Large Language Model,LLM)正以前所未有的速度改變著我...
無損加速最高5x,EAGLE-2讓RTX 3060的生成速度超過A100
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
6700萬參數比肩萬億巨獸GPT-4!微軟MIT等聯手Transformer推理密碼
新智元報道編輯:桃子 喬楊 【新智元導讀】來自微軟、MIT等機構的學者提出了一種創新的訓練范式,攻破了大模型的推理缺陷。他們通過因果模型構建數據集,直接...
五年后的今天,訓練GPT-2只需不到700刀、24小時,Karpathy又整新活
機器之心報道 編輯:杜偉、澤南論老黃賣鏟子的技術含量。2019 年 2 月,OpenAI 發布了 GPT-2,因為在文本生成上的優異表現,以及對于預訓練 Transformer 架構...
阿里發布大模型發布圖結構長文本處理智能體,超越GPT-4-128k
夕小瑤科技說 原創作者 | Richard 隨著大語言模型的發展,處理長文本的能力成為了一個重要挑戰。雖然有許多方法試圖解決這個問題,但都存在不同程度的局限性...
北航、滴滴聯合提出一種新的增量度量框架,實現動態圖結構熵的高效增量計算
作者 | 彭浩 本文介紹來自北京航空航天大學彭浩老師團隊發表在 The journal of Artificial Intelligence 2024 上的一篇文章“Incremental Measurement of Stru...
月之暗面Kimi引擎是怎么煉成的?底層推理系統方案深度揭秘(二)
直播預告 | 7月5日晚7點,「智猩猩機器人新青年講座」第10講正式開講,北京通研院研究員賈寶雄博士主講,主題為《具身智能視角下的三維場景理解、生成與交互...
Kimi論文自曝推理架構,80%流量都靠它承擔
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI月之暗面和清華KVCache.ai團隊的最新論文,首次揭秘了Kimi背后的推理架構! 要知道Kimi是國產大模型的當紅炸子雞,...
月之暗面kimi底層推理系統方案揭秘
7月2日晚七點,「NVIDIA 機器人技術公開課」正式開講,NVIDIA解決方案架構總監舒家明將以《NVIDIA Isaac 加速機器人3D視覺感知與機械臂軌跡規劃》為主題進行...
雙臂機器人高效規劃器DAG-Plan:利用大語言模型生成子任務的有向無環圖
6月27日15點,3位騰訊云專家將在線直播,分享騰訊云在內容創作、Al問答及知識點提煉、智能調研和報告生成等領域的應用探索和落地實踐,歡迎掃碼預約直播。導...
有錢買卡還不夠,10萬卡H100集群有多難搭?一文解析算力集群技術要點
新智元報道編輯:喬楊 好困 【新智元導讀】在英偉達市值猛漲、各家科技巨頭囤芯片的熱潮中,我們往往會忽視GPU芯片是如何轉變為數據中心算力的。最近,一篇Se...
8B模型奧數成績比肩GPT-4!上海AI Lab出品
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI只要1/200的參數,就能讓大模型擁有和GPT-4一樣的數學能力? 來自復旦和上海AI實驗室的研究團隊,剛剛研發出了具有...