楊冪+小蘭會(huì)是什么樣?中山大學(xué)新AI成果,實(shí)現(xiàn)人臉個(gè)性化SOTA
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:楊冪+小蘭會(huì)是什么樣?中山大學(xué)新AI成果,實(shí)現(xiàn)人臉個(gè)性化SOTA
關(guān)鍵字:面部,騰訊,特征,圖像,區(qū)域
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):3524字
內(nèi)容摘要:
皓楠投稿自 凹非寺量子位 | 公眾號(hào) QbitAI只需上傳一張照片,就能瞬間變換身份,獲得高精度個(gè)人寫真!
或是科幻電影中的超級(jí)英雄,或是穿越時(shí)空的復(fù)古角色……
李飛飛在家做飯的樣子有了,還有讓斯嘉麗一鍵帶圣誕帽。
除此之外,楊冪+小蘭兩位人臉融合在一起會(huì)是什么樣子?
中山大學(xué)、聯(lián)想的研究團(tuán)隊(duì)推出了ConsistentID,可在細(xì)粒度多模態(tài)面部提示下,僅利用單張參考圖像生成多樣的肖像,且保持五官的一致性。
最終在人臉個(gè)性化任務(wù)處理上,相比騰訊的photomaker和小紅書的instantID,在五官一致性保持上更具優(yōu)勢(shì)
只需單張照片就可快速保留五官細(xì)節(jié)ConsistentID框架包括兩個(gè)關(guān)鍵模塊:多模態(tài)面部 ID 生成器和ID保存網(wǎng)絡(luò)。
多模態(tài)面部提示生成器由兩個(gè)基本組件組成:細(xì)粒度多模態(tài)特征提取器,專注于捕獲詳細(xì)的面部信息,以及用來(lái)學(xué)習(xí)面部ID特征的提取器。
另一方面,ID保存網(wǎng)絡(luò)同時(shí)利用面部文本和視覺提示,通過(guò)面部注意力定位策略防止來(lái)自不同面部區(qū)域的 ID 信息混合。
這種方法確保了面部區(qū)域ID一致性的保存。
多模態(tài)面部提示生成器
首先在細(xì)粒度多模態(tài)特征提取器這一模塊中,使用了包括
原文鏈接:楊冪+小蘭會(huì)是什么樣?中山大學(xué)新AI成果,實(shí)現(xiàn)人臉個(gè)性化SOTA
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破