標簽：性能

英偉達Blackwell稱霸MLPerf！推理性能暴漲30倍，新一代「AI怪獸」誕生

新智元報道編輯：喬楊好困【新智元導讀】MLPerf Inference發布了最新測試結果，英偉達最新的Blackwell架構芯片上場與谷歌、AMD同場競技，展現出明顯的性能...

閱讀原文

AIGC動態

1年前 (2024)

上交大新型SRAM存內計算架構「COMPASS」，開啟類腦計算新時代

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術...

閱讀原文

AIGC動態

1年前 (2024)

明確了：文本數據中加點代碼，訓練出的大模型更強、更通用

機器之心報道機器之心編輯部代碼知識原來這么重要。如今說起大語言模型（LLM），寫代碼能力恐怕是「君子六藝」必不可少的一項。在預訓練數據集中包含代碼，...

閱讀原文

AIGC動態

1年前 (2024)

小模型站起來了，瀏覽器里跑出SOTA，抱抱臉：快逃，合成數據不是未來

夢晨發自凹非寺量子位 | 公眾號 QbitAI瀏覽器里直接能跑的SOTA小模型來了，分別在2億、5億和20億級別獲勝，抱抱臉出品。秘訣只有兩個：狠狠地過濾數據在...

閱讀原文

AIGC動態

1年前 (2024)

比Stable Diffusion便宜118倍！1890美元訓出11.6億參數高質量文生圖模型

新智元報道編輯：alan 【新智元導讀】近日，來自加州大學爾灣分校等機構的研究人員，利用延遲掩蔽、MoE、分層擴展等策略，將擴散模型的訓練成本降到了1890美...

閱讀原文

AIGC動態

1年前 (2024)

新PyTorch API：幾行代碼實現不同注意力變體，兼具FlashAttention性能和PyTorch靈活性

機器之心報道編輯：陳陳用 FlexAttention 嘗試一種新的注意力模式。理論上，注意力機制就是你所需要的一切。然而在實際操作中，我們還需要優化像 FlashAtten...

閱讀原文

AIGC動態

1年前 (2024)

手機跑大模型提速4-5倍！微軟亞研院開源新技術，有CPU就行

微軟亞洲研究院投稿量子位 | 公眾號 QbitAI有CPU就能跑大模型，性能甚至超過NPU/GPU！沒錯，為了優化模型端側部署，微軟亞洲研究院提出了一種新技術——T-MAC...

閱讀原文

AIGC動態

1年前 (2024)

Llama3訓練每3小時崩一次？豆包大模型、港大團隊為脆皮萬卡訓練提效

機器之心發布機器之心編輯部伴隨大模型迭代速度越來越快，訓練集群規模越來越大，高頻率的軟硬件故障已經成為阻礙訓練效率進一步提高的痛點，檢查點（Checkp...

閱讀原文

AIGC動態

1年前 (2024)

87.8%準確率趕超GPT-4o登頂！谷歌DeepMind發布自動評估模型FLAMe

新智元報道編輯：喬楊耳朵【新智元導讀】谷歌DeepMind推出LLM自動評估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表現卓越，以87.8%準確率領先GPT-4o...

閱讀原文

AIGC動態

1年前 (2024)

谷歌開源最強端側小模型：2B參數越級跑贏GPT-3.5-Turbo，蘋果15Pro運行飛快

機器之心報道機器之心編輯部谷歌也來卷「小」模型了，一出手就是王炸，勝過了比自己參數多得多的GPT-3.5、Mixtral競品模型。今年 6 月底，谷歌開源了 9B、27...

閱讀原文

AIGC動態

1年前 (2024)

北京大學：利用好不確定性，8B小模型也能超越GPT-4

夕小瑤科技說原創作者 | 謝年年大模型有一個顯著的特點，那就是不確定性——對于特定輸入，相同的LLM在不同解碼配置下可能生成顯著不同的輸出。比如問一問cha...

閱讀原文

AIGC動態

1年前 (2024)

小模型狂飆！6家巨頭爭相發布小模型，Andrej Karpathy：大語言模型的尺寸競爭正在倒退…

夕小瑤科技說原創作者 | 21#過去一周，可謂是小模型戰場最瘋狂的一周，商業巨頭改變賽道，向大模型say byebye~。 OpenAI、Apple、Mistral等“百花齊放”，紛紛...

閱讀原文

AIGC動態

1年前 (2024)

老黃再出奇招！首推「版」GB20服務器，或將明年上市

新智元報道編輯：編輯部【新智元導讀】外媒爆料，英偉達將于明年推出一款專為中國市場定制的AI芯片，甚至還專研了一款與之搭配的服務器，這在英偉達歷史上還...

閱讀原文

AIGC動態

1年前 (2024)

Mistral AI新旗艦模型挑戰Llama 3.1！1230億參數性能直逼GPT-4o

Mistral AI新旗艦模型重磅發布：“幻覺”控制出色。編譯|孟強編輯|云鵬智東西7月25日消息，繼Meta昨日推出開源Llama3.1模型之后，法國初創AI公司Mistral AI...

閱讀原文

AIGC動態

1年前 (2024)

Mistral發布Large 2 挑戰 Llama 3.1

點擊上方藍字關注我們“法國人工智能初創公司Mistral推出新一代開源模型Mistral Large 2，以1230億參數挑戰行業巨頭，盡管其參數數量少于Meta的Llama 3.1，但...

閱讀原文

AIGC動態

1年前 (2024)

1…4 567 8…26