標簽:參數
讓Stable Diffusion一秒出圖!清華碩士加速神器爆火,已有公司接入
克雷西 發自 凹非寺量子位 | 公眾號 QbitAIAI圖像生成,已經進入了秒速級別,只要4步推理就能完成繪制,最快更是能在1秒之內完成。現在,清華大學聯合Hugging...
谷歌開源 AI 微調方法: Distilling Step-by-Step
作者 | Anthony Alford 譯者 | 王強 策劃 | 丁曉昀 華盛頓大學和谷歌研究中心的一個團隊最近開源了 Distilling Step-by-Step(逐步蒸餾),一種用于微調規模...
實時文生圖速度提升5-10倍,清華LCM/LCM-LoRA爆火,瀏覽超百萬、下載超20萬
機器之心報道編輯:張倩、陳萍生成式模型進入「實時」時代?文生圖、圖生圖已經不是什么新鮮事。但在使用這些工具的過程中,我們發現它們通常運行緩慢,導致...
舍棄99%的參數,還能達到相同的性能!阿里團隊發現大模型「合二為一」的黑魔法!而且不用GPU,不需重新訓練
夕小瑤科技說 原創作者 | 小戲、Python動漫《龍珠》里,構想了一種“美達摩星人融合術”,通過融合術舞步就可以讓譬如悟空與貝吉塔合體,成為“究極超強合體戰士...
修改LLaMA2-13B一個參數,語言能力全喪失,復旦等發現大模型新秘密
從年初到現在,以 ChatGPT、LLaMA 等為代表的大語言模型(LLM)展現出了類似人類水平的語言能力,這些大模型可以高效的執行復雜任務,而這些任務往往需要抽象...
Llama與ChatGPT,誰是23年AI模型最大的贏家?
夕小瑤科技說 原創作者 | TscomLlama與ChatGPT,誰是23年AI模型最大的贏家?相對于今年爆?的ChatGPT,在短時間內吸引了1億用戶的生成式AI模型 Llama和開源AI...
手機大模型爆發:vivo 發布自研藍心大模型,參數追趕 GPT-3
藍廠,它真的只想當手機廠?作者丨郭 思編輯丨陳彩嫻11月1日vivo開發者大會上,vivo發布自研AI'藍心'大模型,并發布大模型矩陣,包括1750億、1300億、700億、...
ChatGPT真實參數只有200億,首次被微軟曝光!網友:難怪OpenAI對開源很緊張
白交 發自 凹非寺量子位 | 公眾號 QbitAI突然間,整個大模型圈都在談論同一件事。微軟論文里一張「乍一看不足為奇」的統計圖,泄露了“天機”。引領全球風暴的C...
微軟驚天泄密:ChatGPT參數只有200億?
來源:機器之心這合理嗎?誰都沒有想到,ChatGPT 的核心秘密是由這種方式,被微軟透露出來的。昨天晚上,很多討論 AI 的微信群都被一篇 EMNLP 論文和其中的截...
萬萬沒想到,ChatGPT參數只有200億?
夕小瑤科技說 分享來源 | 機器之心這合理嗎?誰都沒有想到,ChatGPT 的核心秘密是由這種方式,被微軟透露出來的。昨天晚上,很多討論 AI 的微信群都被一篇 EM...
微軟論文一張截圖,曝出GPT-3.5僅有200億參數?AI圈巨震,網友大呼太離譜!
新智元報道編輯:編輯部【新智元導讀】微軟最近一篇論文爆料,GPT-3.5的參數量只有20B,遠遠小于之前GPT-3公布175B。網友表示,ChatGPT能力似乎「配得上」這...
8張3090,1天壓縮萬億參數大模型!3.2TB驟降至160GB,壓縮率高達20倍
新智元報道編輯:好困【新智元導讀】最近,來自ISTA的研究人員提出了一種全新的模型量化方法QMoE,可以將1.6萬億個參數的SwitchTransformer壓縮到160GB以下(...
用童話訓練AI模型,微軟找到了探索生成模型參數的新切入點
選自量子雜志作者:Ben Brubaker機器之心編譯編輯:趙陽即便大語言模型的參數規模日漸增長,其模型中的參數到底是如何發揮作用的還是讓人難以琢磨,直接對大...
馬斯克的AI第一槍,被華人科學家大將打響!xAI首個研究成果:訓練無限深度神經網絡
大數據文摘受權轉載自頭部科技文 | Congerry幾個月前,馬斯克通過 Twitter 宣布自己的人工智能公司xAI正式成立:成立一家 xAI 公司去了解宇宙的真實本質。當...
比傳統量子化學計算快約40倍,機器學習揭示了如何將聚合物材料溶解在有機溶劑中
將 ScienceAI設為星標第一時間掌握新鮮的 AI for Science 資訊編輯 | 紫羅用有機溶劑溶解聚合物是高分子材料研究和開發中必不可少的過程,包括塑料回收、聚合...