AIGC動態歡迎閱讀
原標題:4090筆記本0.37秒直出大片!英偉達聯手MIT清華祭出Sana架構,速度秒殺FLUX
關鍵字:模型,華為,高效,圖像,編碼器
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:桃子 好困
【新智元導讀】一臺4090筆記本,秒生1K質量高清圖。英偉達聯合MIT清華團隊提出的Sana架構,得益于核心架構創新,具備了驚人的圖像生成速度,而且最高能實現4k分辨率。一臺16GB的4090筆記本,僅需0.37秒,直接吐出1024×1024像素圖片。
如此神速AI生圖工具,竟是出自英偉達MIT清華全華人團隊之筆!
正如其名字一樣,Sana能以驚人速度合成高分辨率、高質量,且具有強文本-圖像對其能力的模型。
而且,它還能高效生成高達4096×4096像素的圖像。
項目主頁:https://nvlabs.github.io/Sana/
論文地址:https://arxiv.org/abs/2410.10629
Sana的核心設計包含了以下幾個要素:
深度壓縮自編碼器(AE):傳統自編碼器只能將圖像壓縮8倍,全新AE可將圖像壓縮32倍,有效減少了潛在token的數量。
線性DiT(Diffusion Transformer):用「線性注意力」替換了DiT中所有的普通注意力,在高分辨率下更加高效,且不會犧牲質量。
基于僅解碼器模型的文本編碼器:用現代的僅解碼器S
原文鏈接:4090筆記本0.37秒直出大片!英偉達聯手MIT清華祭出Sana架構,速度秒殺FLUX
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...