標簽:性能
英偉達Blackwell稱霸MLPerf!推理性能暴漲30倍,新一代「AI怪獸」誕生
新智元報道編輯:喬楊 好困 【新智元導讀】MLPerf Inference發布了最新測試結果,英偉達最新的Blackwell架構芯片上場與谷歌、AMD同場競技,展現出明顯的性能...
上交大新型SRAM存內計算架構「COMPASS」,開啟類腦計算新時代
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
明確了:文本數據中加點代碼,訓練出的大模型更強、更通用
機器之心報道 機器之心編輯部代碼知識原來這么重要。如今說起大語言模型(LLM),寫代碼能力恐怕是「君子六藝」必不可少的一項。 在預訓練數據集中包含代碼,...
小模型站起來了,瀏覽器里跑出SOTA,抱抱臉:快逃,合成數據不是未來
夢晨 發自 凹非寺量子位 | 公眾號 QbitAI瀏覽器里直接能跑的SOTA小模型來了,分別在2億、5億和20億級別獲勝,抱抱臉出品。 秘訣只有兩個: 狠狠地過濾數據 在...
比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型
新智元報道編輯:alan 【新智元導讀】近日,來自加州大學爾灣分校等機構的研究人員,利用延遲掩蔽、MoE、分層擴展等策略,將擴散模型的訓練成本降到了1890美...
新PyTorch API:幾行代碼實現不同注意力變體,兼具FlashAttention性能和PyTorch靈活性
機器之心報道 編輯:陳陳用 FlexAttention 嘗試一種新的注意力模式。理論上,注意力機制就是你所需要的一切。然而在實際操作中,我們還需要優化像 FlashAtten...
手機跑大模型提速4-5倍!微軟亞研院開源新技術,有CPU就行
微軟亞洲研究院 投稿量子位 | 公眾號 QbitAI有CPU就能跑大模型,性能甚至超過NPU/GPU! 沒錯,為了優化模型端側部署,微軟亞洲研究院提出了一種新技術——T-MAC...
Llama3訓練每3小時崩一次?豆包大模型、港大團隊為脆皮萬卡訓練提效
機器之心發布 機器之心編輯部伴隨大模型迭代速度越來越快,訓練集群規模越來越大,高頻率的軟硬件故障已經成為阻礙訓練效率進一步提高的痛點,檢查點(Checkp...
87.8%準確率趕超GPT-4o登頂!谷歌DeepMind發布自動評估模型FLAMe
新智元報道編輯:喬楊 耳朵 【新智元導讀】谷歌DeepMind推出LLM自動評估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表現卓越,以87.8%準確率領先GPT-4o...
谷歌開源最強端側小模型:2B參數越級跑贏GPT-3.5-Turbo,蘋果15Pro運行飛快
機器之心報道 機器之心編輯部谷歌也來卷「小」模型了,一出手就是王炸,勝過了比自己參數多得多的GPT-3.5、Mixtral競品模型。今年 6 月底,谷歌開源了 9B、27...
北京大學:利用好不確定性,8B小模型也能超越GPT-4
夕小瑤科技說 原創作者 | 謝年年大模型有一個顯著的特點,那就是不確定性——對于特定輸入,相同的LLM在不同解碼配置下可能生成顯著不同的輸出。 比如問一問cha...
小模型狂飆!6家巨頭爭相發布小模型,Andrej Karpathy:大語言模型的尺寸競爭正在倒退…
夕小瑤科技說 原創作者 | 21#過去一周,可謂是小模型戰場最瘋狂的一周,商業巨頭改變賽道,向大模型say byebye~。 OpenAI、Apple、Mistral等“百花齊放”,紛紛...
老黃再出奇招!首推「版」GB20服務器,或將明年上市
新智元報道編輯:編輯部 【新智元導讀】外媒爆料,英偉達將于明年推出一款專為中國市場定制的AI芯片,甚至還專研了一款與之搭配的服務器,這在英偉達歷史上還...
Mistral AI新旗艦模型挑戰Llama 3.1!1230億參數性能直逼GPT-4o
Mistral AI新旗艦模型重磅發布:“幻覺”控制出色。 編譯|孟強 編輯|云鵬 智東西7月25日消息,繼Meta昨日推出開源Llama3.1模型之后,法國初創AI公司Mistral AI...
Mistral發布Large 2 挑戰 Llama 3.1
點擊上方藍字關注我們“法國人工智能初創公司Mistral推出新一代開源模型Mistral Large 2,以1230億參數挑戰行業巨頭,盡管其參數數量少于Meta的Llama 3.1,但...