標簽：參數

馬斯克怒告OpenAI案解密：Ilya看到了什么？125萬億參數Q*細節曝光，53頁PDF全網瘋轉

新智元報道編輯：編輯部【新智元導讀】現在，馬斯克起訴OpenAI案的最大未解之謎，就集中在了「Ilya究竟看到了什么」上。他看到的東西，讓OpenAI大震蕩，所有...

閱讀原文

AIGC動態

2年前 (2024)

53頁PDF爆料OpenAI“AGI時間表”，爆料者：馬斯克訴訟攪了局

克雷西發自凹非寺量子位 | 公眾號 QbitAIOpenAI神秘的Q*計劃，又有新鮮爆料。今天凌晨，一篇53頁google文檔開始在網絡上熱傳，透露OpenAI“計劃在2027年前...

閱讀原文

AIGC動態

2年前 (2024)

清華、哈工大把大模型壓縮到了1bit，把大模型放在手機里跑的愿望就快要實現了！

機器之心專欄機器之心編輯部近期，清華大學和哈爾濱工業大學聯合發布了一篇論文：把大模型壓縮到 1.0073 個比特時，仍然能使其保持約 83% 的性能！自從大模...

閱讀原文

AIGC動態

2年前 (2024)

60行代碼，從頭開始構建GPT！最全實踐指南來了

新智元報道編輯：桃子【新智元導讀】GPT早已成為大模型時代的基礎。國外一位開發者發布了一篇實踐指南，僅用60行代碼構建GPT。60行代碼，從頭開始構建GPT？ ...

閱讀原文

AIGC動態

2年前 (2024)

微軟6頁論文爆火：三進制LLM，真香！

金磊發自凹非寺量子位 | 公眾號 QbitAI現在，大語言模型（LLM）迎來了“1-bit時代”。這就是由微軟和中國中科院大學在最新一項研究中所提出的結論—— 所有的L...

閱讀原文

AIGC動態

2年前 (2024)

想訓練類Sora模型嗎？尤洋團隊OpenDiT實現80%加速

機器之心報道機器之心編輯部作為 2024 開年王炸，Sora 的出現樹立了一個全新的追趕目標，每個文生視頻的研究者都想在最短的時間內復現 Sora 的效果。根據 O...

閱讀原文

AIGC動態

2年前 (2024)

知名AI研究者深挖谷歌Gemma：參數不止70億，設計原則很獨特

機器之心報道編輯：陳萍、杜偉想要了解谷歌 Gemma 與 Llama 2、Mistral 有哪些異同嗎？這篇文章值得一讀。就在幾天前，開源大模型領域迎來了重磅新玩家：谷...

閱讀原文

AIGC動態

2年前 (2024)

用擴散模型生成網絡參數，LeCun點贊尤洋團隊新研究

機器之心報道機器之心編輯部如果你有被 Sora 生成的視頻震撼到，那你就已經見識過擴散模型在視覺生成方面的巨大潛力。當然，擴散模型的潛力并不止步于此，它...

閱讀原文

AIGC動態

2年前 (2024)

打入AI底層！NUS尤洋團隊用擴散模型構建神經網絡參數，LeCun點贊

克雷西發自凹非寺量子位 | 公眾號 QbitAI擴散模型，迎來了一項重大新應用—— 像Sora生成視頻一樣，給神經網絡生成參數，直接打入了AI的底層！這就是新加坡...

閱讀原文

AIGC動態

2年前 (2024)

用擴散模型生成神經網絡？NUS 尤洋團隊：這不是開玩笑

Neural Network Diffusion，開始用魔法打敗魔法了。作者丨賴文昕編輯丨郭思、陳彩嫻說起擴散模型生成的東西，你會立刻想到什么？是OpenAI的經典牛油果椅子...

閱讀原文

AIGC動態

2年前 (2024)

華為王云鶴：對“小”的大模型的優化重新思考

700個開發硬件免費申請?現金大獎！生成式 AI、機器人 AI、PC AI 三大賽道！AMD Pervasive AI 開發者挑戰賽報名火熱進行中，掃碼了解詳情并報名～導讀作者為華...

閱讀原文

AIGC動態

2年前 (2024)

蘋果極致LLM端側方案：LLM in a flash

700個開發硬件免費申請?現金大獎！生成式 AI、機器人 AI、PC AI 三大賽道！AMD Pervasive AI 開發者挑戰賽報名火熱進行中，掃碼了解詳情并報名～導讀本文是知...

閱讀原文

AIGC動態

2年前 (2024)

人類偏好優化算法哪家強？跟著高手一文學懂DPO、IPO和KTO

選自 huggingface.co/blog 作者：Kashif Rasul 等機器之心編譯編輯：趙陽?盡管收集人類對模型生成內容的相對質量的標簽，并通過強化學習從人類反饋（RLHF）...

閱讀原文

AIGC動態

2年前 (2024)

生成速度快SDXL一倍，9GB GPU也能運行，Stable Cascade來搞性價比了

機器之心報道編輯：大盤雞硬件要求越來越低，生成速度越來越快。Stability AI 作為文本到圖像的「元老」，不僅在引領該領域的潮流方向，也在模型質量上一次...

閱讀原文

AIGC動態

2年前 (2024)

專訪面壁曾國洋：踩過 1000 次大模型的坑后，造一個性能小鋼炮

以小博大，面壁MiniCPM在大模型賽場上扔出了重磅炸彈。作者丨賴文昕、王悅編輯丨陳彩嫻 2月1日，剛成立一年的面壁智能發布了兩個在海內外大模型領域「炸裂級...

閱讀原文

AIGC動態

2年前 (2024)

1…9 101112 13…16