標簽:參數

能煉10萬億參數模型!黃仁勛發布全新架構GPU,性能提升30倍,H100已成過去時

GTC 2024 來了。 在今天凌晨的發布會上,英偉達 CEO 黃仁勛發布了新的 AI 芯片,繼 Ampere A100、Hopper H100 芯片之后新產品——Blackwell B200,專為超大參數...
閱讀原文

老黃祭出新B200!30倍H100單機可訓15個GPT-4模型,AI迎新摩爾時代

新智元報道編輯:編輯部 【新智元導讀】就在剛剛,老黃又來打破摩爾定律了:英偉達新核彈B200,一塊能頂5個H100,30倍推理加速,能訓萬億參數大模型!同時推...
閱讀原文

馬斯克正式開源 Grok-1,成為全球最大的開源大模型

開源了 但又沒 完全開源今日凌晨,在一片質疑聲中,信守承諾的馬斯克卡在最后一日正式開源了 GroK。 好消息是, 馬斯克開源了 Grok 1.0 的完整代碼,壞消息是...
閱讀原文

突發:馬斯克Grok開源!

全球最大開源大模型!馬斯克Grok-1參數量3410億,正式開源。 作者|云鵬 編輯|心緣 6個月掏出3410億參數自研大模型,馬斯克說到做到! 智東西3月18日消息,就...
閱讀原文

馬斯克突然開源Grok:3140億參數巨無霸,免費可商用

魚羊 克雷西 發自 凹非寺量子位 | 公眾號 QbitAI馬斯克說到做到: 旗下大模型Grok現已開源! 代碼和模型權重已上線GitHub。官方信息顯示,此次開源的Grok-1是...
閱讀原文

GPT-4級模型Grok開源可商用!卷底層大模型的公司危了

夕小瑤科技說 原創作者 | 醒醒上周,馬斯克宣布 xAI 將開源 Grok。 剛剛,馬斯克終于兌現諾言,xAI 宣布開源了 Grok-1 的模型權重和網絡架構。 Grok-1 是一個...
閱讀原文

馬斯克打臉OpenAI,全球最大巨無霸模型Grok-1開源!3140億參數8個MoE,GitHub狂攬6k星

新智元報道編輯:編輯部 【新智元導讀】xAI的Grok,在七天后如期開源了!公開Grok背后代碼,讓馬斯克對OpenAI啪啪打臉。3140億參數8個MoE,權重架構全開放,...
閱讀原文

巧解「數據稀缺」問題!清華開源GPD:用擴散模型生成神經網絡參數|ICLR 2024

新智元報道編輯:LRS 好困 【新智元導讀】清華大學電子工程系城市科學與計算研究中心最近提出了一種新的時空少樣本學習方法,旨在解決城市計算中廣泛存在的數...
閱讀原文

馬斯克開源Grok-1:3140億參數迄今最大,權重架構全開放,磁力下載

機器之心報道 機器之心編輯部開源社區有福了。 說到做到,馬斯克承諾的開源版大模型 Grok 終于來了! 今天凌晨,馬斯克旗下大模型公司 xAI 宣布正式開源 3140...
閱讀原文

馬斯克開源Grok:參數量近ChatGPT兩倍,成為最強開源模型

點擊上方藍字關注我們“埃隆·馬斯克領導的xAI公司開源了其首個大型語言模型Grok,擁有3140億參數。該舉措挑戰了AI領域的現有格局,向其他競爭對手施加了壓力。...
閱讀原文

4萬億晶體管5nm制程,全球最快AI芯片碾壓H100!單機可訓24萬億參數LLM,Llama 70B一天搞定

新智元報道編輯:桃子 好困 【新智元導讀】AI世界的進化快的有點跟不上了。剛剛,全球最強最大AI芯片WSE-3發布,4萬億晶體管5nm工藝制程。更厲害的是,WSE-3...
閱讀原文

4萬億個晶體管,單機可訓練比GPT4大10倍的模型,最快最大的芯片面世

機器之心報道 編輯:小舟、陳萍剛剛,芯片創業公司 Cerebras 宣布了該公司歷史上最重要的消息,「我們發布了世界上最快的芯片,該芯片擁有高達 4 萬億個晶體...
閱讀原文

ICLR 2024 Spotlight | 大語言模型權重、激活的全方位低bit可微量化,已集成進商用APP

機器之心專欄 作者:邵文琪模型量化是模型壓縮與加速中的一項關鍵技術,其將模型權重與激活值量化至低 bit,以允許模型占用更少的內存開銷并加快推理速度。對...
閱讀原文

一網打盡!深度學習常見問題!

大數據文摘受權轉載自算法進階 1 前言 在傳統軟件工程中,程序問題(即Bugs)會導致程序崩潰,但開發人員可以通過檢查錯誤來了解原因。 然而,在深度學習中,...
閱讀原文

關于scaling law 的正確認識

智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場;分會場將進行具身...
閱讀原文
18910111216