標簽:參數

馬斯克怒告OpenAI案解密:Ilya看到了什么?125萬億參數Q*細節曝光,53頁PDF全網瘋轉

新智元報道編輯:編輯部 【新智元導讀】現在,馬斯克起訴OpenAI案的最大未解之謎,就集中在了「Ilya究竟看到了什么」上。他看到的東西,讓OpenAI大震蕩,所有...
閱讀原文

53頁PDF爆料OpenAI“AGI時間表”,爆料者:馬斯克訴訟攪了局

克雷西 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI神秘的Q*計劃,又有新鮮爆料。 今天凌晨,一篇53頁google文檔開始在網絡上熱傳,透露OpenAI“計劃在2027年前...
閱讀原文

清華、哈工大把大模型壓縮到了1bit,把大模型放在手機里跑的愿望就快要實現了!

機器之心專欄 機器之心編輯部近期,清華大學和哈爾濱工業大學聯合發布了一篇論文:把大模型壓縮到 1.0073 個比特時,仍然能使其保持約 83% 的性能!自從大模...
閱讀原文

60行代碼,從頭開始構建GPT!最全實踐指南來了

新智元報道編輯:桃子 【新智元導讀】GPT早已成為大模型時代的基礎。國外一位開發者發布了一篇實踐指南,僅用60行代碼構建GPT。60行代碼,從頭開始構建GPT? ...
閱讀原文

微軟6頁論文爆火:三進制LLM,真香!

金磊 發自 凹非寺量子位 | 公眾號 QbitAI現在,大語言模型(LLM)迎來了“1-bit時代”。 這就是由微軟和中國中科院大學在最新一項研究中所提出的結論—— 所有的L...
閱讀原文

想訓練類Sora模型嗎?尤洋團隊OpenDiT實現80%加速

機器之心報道 機器之心編輯部作為 2024 開年王炸,Sora 的出現樹立了一個全新的追趕目標,每個文生視頻的研究者都想在最短的時間內復現 Sora 的效果。 根據 O...
閱讀原文

知名AI研究者深挖谷歌Gemma:參數不止70億,設計原則很獨特

機器之心報道 編輯:陳萍、杜偉想要了解谷歌 Gemma 與 Llama 2、Mistral 有哪些異同嗎?這篇文章值得一讀。就在幾天前,開源大模型領域迎來了重磅新玩家:谷...
閱讀原文

用擴散模型生成網絡參數,LeCun點贊尤洋團隊新研究

機器之心報道 機器之心編輯部如果你有被 Sora 生成的視頻震撼到,那你就已經見識過擴散模型在視覺生成方面的巨大潛力。當然,擴散模型的潛力并不止步于此,它...
閱讀原文

打入AI底層!NUS尤洋團隊用擴散模型構建神經網絡參數,LeCun點贊

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI擴散模型,迎來了一項重大新應用—— 像Sora生成視頻一樣,給神經網絡生成參數,直接打入了AI的底層! 這就是新加坡...
閱讀原文

用擴散模型生成神經網絡?NUS 尤洋團隊:這不是開玩笑

Neural Network Diffusion,開始用魔法打敗魔法了。作者丨賴文昕 編輯丨郭思、陳彩嫻 說起擴散模型生成的東西,你會立刻想到什么? 是OpenAI的經典牛油果椅子...
閱讀原文

華為王云鶴:對“小”的大模型的優化重新思考

700個開發硬件免費申請?現金大獎!生成式 AI、機器人 AI、PC AI 三大賽道!AMD Pervasive AI 開發者挑戰賽報名火熱進行中,掃碼了解詳情并報名~導讀作者為華...
閱讀原文

蘋果極致LLM端側方案:LLM in a flash

700個開發硬件免費申請?現金大獎!生成式 AI、機器人 AI、PC AI 三大賽道!AMD Pervasive AI 開發者挑戰賽報名火熱進行中,掃碼了解詳情并報名~導讀本文是知...
閱讀原文

人類偏好優化算法哪家強?跟著高手一文學懂DPO、IPO和KTO

選自 huggingface.co/blog 作者:Kashif Rasul 等 機器之心編譯 編輯:趙陽?盡管收集人類對模型生成內容的相對質量的標簽,并通過強化學習從人類反饋(RLHF)...
閱讀原文

生成速度快SDXL一倍,9GB GPU也能運行,Stable Cascade來搞性價比了

機器之心報道 編輯:大盤雞硬件要求越來越低,生成速度越來越快。Stability AI 作為文本到圖像的「元老」,不僅在引領該領域的潮流方向,也在模型質量上一次...
閱讀原文

專訪面壁曾國洋:踩過 1000 次大模型的坑后 ,造一個性能小鋼炮

以小博大,面壁MiniCPM在大模型賽場上扔出了重磅炸彈。作者丨賴文昕、王悅 編輯丨陳彩嫻 2月1日,剛成立一年的面壁智能發布了兩個在海內外大模型領域「炸裂級...
閱讀原文
191011121316