曾爆火的 InstantID又有了新玩法:風(fēng)格化圖像生成,已開源
AIGC動態(tài)歡迎閱讀
原標(biāo)題:曾爆火的 InstantID又有了新玩法:風(fēng)格化圖像生成,已開源
關(guān)鍵字:風(fēng)格,圖像,作者,特征,內(nèi)容
文章來源:機器之心
內(nèi)容字?jǐn)?shù):4072字
內(nèi)容摘要:
機器之心專欄
機器之心編輯部InstantID 原班團隊推出了風(fēng)格遷移的新方法InstantStyle。風(fēng)格化圖像生成,也常稱為風(fēng)格遷移,其目標(biāo)是生成與參考圖像風(fēng)格一致的圖像。此前基于 diffusion 的方法(比如 LoRA)通常需要批量的同風(fēng)格數(shù)據(jù)進行訓(xùn)練,無法遷移到新的風(fēng)格中,或者基于 inversion(如 StyleAlign),通過將風(fēng)格圖像還原到 latent noise 后,將其前向傳播得到的 K、V 用于替換風(fēng)格圖像生成中的 K、V,但這類方法往往由于 inversion 的操作,造成風(fēng)格退化。
最近,InstantID 原班團隊推出了風(fēng)格遷移的新方法InstantStyle,與人臉 ID 不同,它是一個通用的圖像風(fēng)格注入框架,采用兩種簡單但非常有效的技術(shù),來實現(xiàn)風(fēng)格和內(nèi)容與參考圖像的有效分離。論文:InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation
論文地址:https://huggingface.co/papers/2404.02733
項目主頁:https:
原文鏈接:曾爆火的 InstantID又有了新玩法:風(fēng)格化圖像生成,已開源
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺