AIGC動態歡迎閱讀
原標題:ECCV 2024收錄!曠視提出無需訓練的更高分辨率圖像生成框架HiDiffusion | 一作、高級研究員張慎主講預告
關鍵字:圖像,分辨率,框架,問題,模型
文章來源:智猩猩GenAI
內容字數:0字
內容摘要:
在圖像生成領域,高分辨率圖像的生成一直是一個具有挑戰性的工作。Stable Diffusion等強大的預訓練擴散模型目前可以生成1024×1024像素的高質量圖像。但生成更高分辨率的圖像(2K-4K)會遇到不合理的重復物體問題,并且生成時間成倍增加。
為解決這些問題,曠視研究院高級研究員張慎等研究人員提出了一個無需訓練的更高分辨率圖像生成框架 HiDiffusion。該框架通過動態調整特征圖大小來解決重復物體問題,同時改進自注意力機制實現推理速度的提升。相關論文為《HiDiffusion: Unlocking higher-resolution creativity and efficiency in pretrained diffusion models》,已收錄于ECCV 2024。HiDiffusion框架主要由兩部分組成:分辨率感知U-Net(RAU-Net)和改進的移動窗口多頭自注意力 (MSW-MSA)。
RAU-Net通過動態調整特征圖的大小來解決高分辨率圖像生成中的對象重復問題。這種調整是為了匹配U-Net深層塊中卷積的感受野,從而確保在生成更高分辨率圖像時不會發生特征
原文鏈接:ECCV 2024收錄!曠視提出無需訓練的更高分辨率圖像生成框架HiDiffusion | 一作、高級研究員張慎主講預告
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...