国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

AIGC動態2個月前更新 算泥
9 0 0
圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

導讀: 算泥社區,一個集AI大模型開發服務、算法與算力于一體的開源生態,正以前沿技術驅動AI創作邊界。文本到圖像生成領域,在DALL-E、Midjourney、Stable Diffusion等模型的推動下,已達百花齊放之境。然而,如何讓AI生成的圖像擺脫“AI味”,真正貼近人類的審美偏好,一直是行業難題。騰訊混元團隊聯合香港中文大學(深圳)及清華大學深圳國際研究生院的專家,重磅推出“語義相對偏好優化”(SRPO)技術,顯著提升了AI生成圖像的審美、真實感與藝術感,并將訓練時間大幅縮短至十分鐘。這項突破性進展,解決了AI審美學習的計算成本高昂、獎勵模型離線調試繁瑣兩大痛點。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

AI圖像生成的審美困境

近年來,文本到圖像生成技術取得了飛躍式發展。從最初的DALL-E,到如今百花齊放的模型,AI已經能夠根據文本描述創造出令人驚嘆的視覺作品。然而,這些成果往往在技術上達到了“正確”,卻難以觸及人類內心深處的“美”。生成的圖像常常帶有明顯的“AI痕跡”,缺乏人類所追求的自然、逼真與藝術韻味。究其原因,人類的審美標準復雜且主觀,如何將這種“玄學”般的偏好量化并注入AI模型,一直是研究者們面臨的巨大挑戰。傳統的強化學習方法,通過引入“審美裁判”(獎勵模型)來指導AI學習,即AI創作一張圖,裁判打分,好則獎勵,差則懲罰。但這種方式存在兩大頑疾:一是“獎勵黑客”現象,AI為了追求高分,可能鉆評分漏洞,生成表面上分數高但質量低劣的圖像,例如偏愛某種顏色或細節極簡的“光滑”圖像;二是優化范圍受限,強化學習通常只能在生成過程的末端進行微調,對于早期階段的生成軌跡難以干預,這進一步加劇了獎勵黑客問題。此外,現有的獎勵模型往往基于有限的數據和過時的模型訓練,其“審美”判斷帶有固有偏見,難以適應當前生成模型日新月異的發展和日益挑剔的用戶需求,往往需要昂貴的離線微調才能勉強勝任。

Direct-Align:加速AI圖像生成的“傳送門”

面對上述挑戰,騰訊混元團隊與合作者們并未退縮,而是選擇正面突破。他們首先推出的法寶是Direct-Align。其核心理念堪稱點睛之筆:摒棄繁瑣的回溯式計算,直接構建一個“傳送門”,允許從生成過程中的任何時間點一步到位地恢復出最終的清晰圖像。這一創新源于擴散模型的一個內在數學特性——在任意噪聲水平\(t\)下,帶噪聲圖像\(x_t\)實際上是原始清晰圖像\(x_0\)與高斯噪聲\(\epsilon_{gt}\)的線性組合。Direct-Align正是基于此洞察,不再依賴多步迭代采樣,而是通過引入真實的噪聲先驗,利用封閉形式的解析解,瞬間完成圖像的恢復。這一技術徹底規避了迭代采樣可能導致的梯度等優化不穩定性問題,使得優化過程極為穩健。更重要的是,Direct-Align能夠從生成軌跡的任何階段進行優化,即使是在噪聲極大的早期階段,也能精準恢復圖像,這意味著可以在整個生成過程中進行優化,而非僅限于最后幾個步驟。為了進一步增強優化穩定性,Direct-Align還引入了一個獎勵聚合框架。它從一張清晰圖像\(x_0\)出發,生成一系列不同噪聲程度的中間狀態,對每個狀態進行“一步恢復”并計算獎勵得分。隨后,這些得分通過帶有衰減折扣因子的方式進行聚合,最后統一進行梯度更新。關鍵的折扣因子能夠賦予早期階段獎勵更高的權重,有效遏制模型在后期階段為了追求分數而產生的“獎勵黑客”行為。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

Direct-Align的卓越之處體現在:它實現了在生成過程早期進行優化,這在以往是難以想象的;它擺脫了多步采樣的束縛,極大地提升了計算效率;其優化過程極其穩定,有效避免了梯度;通過全局優化和獎勵聚合,它顯著緩解了獎勵黑客問題。可以說,Direct-Align成功地消除了“計算成本高昂”和“優化范圍狹窄”這兩座橫亙在AI圖像生成道路上的大山。

SRPO:AI的“高級審美”調校大師

在Direct-Align奠定的堅實基礎上,真正的王牌——語義相對偏好優化(SRPO)——橫空出世。若Direct-Align解決了“效率”與“范圍”的問題,那么SRPO則直擊“審美”與“控制”這兩個終極難題。其核心創新在于,將抽象的“獎勵信號”轉化為可通過文本精確控制的“偏好信號”。這意味著,用戶可以實時、動態地向AI傳達自己的意圖,而無需依賴昂貴的離線獎勵模型訓練。SRPO的架構看似簡潔,實則巧妙地融合了Direct-Align與獎勵模型。它運用“語義引導偏好”(Semantic Guided Preference)和“語義相對偏好”(Semantic-Relative Preference)兩大機制,實現了對AI審美的精細化。研究團隊發現,文本提示(prompt)是可以縱的。通過在原始提示前添加特定的“控制詞”,例如“一張逼真的照片”,就能夠巧妙地引導獎勵模型的評分偏好。這如同向裁判發出指令:“今天我們側重‘真實感’的評估標準”,裁判便會心領神會地調整其評分邏輯。這一發現具有劃時代的意義,它表明可以通過簡單的文本操作,轉移獎勵的偏好,實現可控的審美引導。然而,僅僅引導還不足以完全解決獎勵模型的固有偏見。例如,即使引導關注“真實感”,如果獎勵模型本身偏愛紅色,它仍可能傾向于給帶有紅色的“真實”照片打高分。為應對此挑戰,“語義相對偏好”機制應運而生。以往的方法可能通過引入多個具有不同偏見的獎勵模型來尋求折衷,但這往往只能獲得平庸的結果。SRPO則另辟蹊徑,它洞察到獎勵模型的偏見主要源于其圖像編碼器。因此,它創造性地提出:使用同一個獎勵模型,針對同一張圖像,生成一對“正向”和“反向”的獎勵信號。具體實現方式是通過提示增強。例如,輸入一個“正向”提示“一張逼真的照片”,和一個“負向”提示“一張卡通畫”,讓獎勵模型對同一張圖進行兩次評分。在優化過程中,模型會努力靠近“逼真”的特征,同時主動規避“卡通”的特征。在這個過程中,兩個信號中都存在的獎勵模型的一般性偏見(如對紅色的偏愛)會因為一正一負而被抵消,而我們真正期望的語義差異(逼真與卡通)則被保留并放大。這種操作堪稱天才之舉!

更有趣的是,借助Direct-Align的雙向優化能力,SRPO還實現了一種名為“基于反轉的正則化”的創新玩法。在去噪(正向)過程中,模型執行梯度上升,學習好的偏好;而在加噪(反向)過程中,則執行梯度下降,懲罰壞的偏好。通過在不同時間步解耦獎勵項和懲罰項,SRPO進一步增強了優化的魯棒性,使得獎勵黑客無處遁形。SRPO的優勢是顛覆性的:它實現了在線獎勵調整,用戶只需修改提示詞即可指揮AI,告別了繁瑣的微調;通過正負樣本對比,從根本上緩解了獎勵黑客問題;能夠實現對畫面風格、質感的精細化控制。最關鍵的是,它繼承了Direct-Align的高效率,以極低的成本完成了這一重大突破。

性能實測:數據與人眼的雙重認可

為了驗證SRPO的強大能力,研究團隊在FLUX.1.dev這一頂級的開源文生圖模型上進行了嚴格的性能測試。他們選用行業公認的HPSv2.1作為獎勵模型,并在人類偏好數據集HPDv2上進行訓練,隨后與ReFL、DRaFT-LV、DanceGRPO等主流在線強化學習方法進行了全方位的對比。評估維度兼顧了自動化指標和人類主觀評價。在自動化評估方面,SRPO在美學分數(Aesthetic Score)和PickScore上均位列第一。尤為驚人的是其訓練效率,僅需5.3個GPU小時(約等于10分鐘),而效果相當的DanceGRPO卻需要480個GPU小時,效率提升了近90倍。人類評估的結果更是令人矚目。在逼真度、美學和總體偏好方面,SRPO實現了斷層式的領先。其逼真度“優秀”率從基線模型的8.2%飆升至38.9%,提升了近五倍;美學“優秀”率從9.8%提升至40.5%;整體偏好“優秀”率則從5.3%提升至29.4%。這意味著,在未增加額外訓練數據的情況下,SRPO系統性、大幅度地提升了大規模擴散模型的逼真度,堪稱前所未有。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

團隊還進行了深入的詳細分析,例如在不同獎勵模型(CLIP、PickScore、HPSv2.1)下的表現,發現SRPO的增強效果具有普適性,無論在何種評價標準下都能穩定發揮。他們還證明了在生成過程早期進行優化對于避免獎勵黑客至關重要,僅在后期優化時,被“黑”的概率會顯著增加。最令人興奮的是其精細化的控制能力。通過簡單的“控制詞”,SRPO就能讓模型在“明亮”、“暗黑”、“油畫”、“漫畫”、“賽博朋克”等多種風格之間自如切換。實驗結果表明,在獎勵模型訓練數據現頻率較高的詞匯,如“油畫”,控制效果尤為顯著。對于一些較少見的風格,如“文藝復興”,雖然效果稍弱,但通過組合提示(如“文藝復興風格的油畫”)也能獲得改善。這為未來個性化、定制化圖像生成開辟了廣闊的想象空間。

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

盡管SRPO已展現出驚人的實力,研究團隊仍謙虛地指出了其局限性,例如對某些冷門風格的控制力仍有待加強,以及內部工作機制的可解釋性尚需進一步深入研究。SRPO方法的出現,憑借其極致的效率和卓越的質量,將AI從單純的“模仿者”轉變為能夠理解并執行人類復雜審美需求的“藝術家”。

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        国产精品蜜臀在线观看| 激情综合亚洲精品| 亚洲h在线观看| 色综合中文综合网| 亚洲电影一区二区| 欧美人动与zoxxxx乱| 偷拍亚洲欧洲综合| 日韩欧美一级精品久久| 精品在线免费观看| 欧美极品aⅴ影院| 91黄色激情网站| 日韩高清一级片| 精品成人一区二区三区四区| 精品一区二区三区不卡| 国产精品国产精品国产专区不片 | 蜜桃一区二区三区在线| 久久久综合视频| 99精品偷自拍| 午夜成人免费电影| 欧美国产精品专区| 91麻豆精品国产自产在线| 国产毛片精品视频| 亚洲一级二级在线| 国产亚洲福利社区一区| 欧美日韩一区久久| 国产suv精品一区二区三区| 夜夜爽夜夜爽精品视频| 久久综合色播五月| 91激情五月电影| 国产又粗又猛又爽又黄91精品| 亚洲欧美自拍偷拍色图| 精品国内二区三区| 一本色道久久综合精品竹菊| 黄一区二区三区| 午夜精品一区在线观看| 国产精品国产三级国产三级人妇| 欧美一区二区三区在线视频| 91老司机福利 在线| 国产一区二区三区免费在线观看| 亚洲va在线va天堂| 亚洲视频在线观看一区| 精品日韩99亚洲| 欧美日韩www| 欧美在线播放高清精品| 99久久精品一区| 国产精品资源在线看| 七七婷婷婷婷精品国产| 性久久久久久久久久久久| 亚洲男人的天堂在线aⅴ视频| 久久综合久色欧美综合狠狠| 337p亚洲精品色噜噜狠狠| 91国内精品野花午夜精品| 不卡区在线中文字幕| 国产二区国产一区在线观看| 日本亚洲视频在线| 日本女人一区二区三区| 亚洲成人av一区二区| 亚洲一区二区三区四区的| 亚洲免费成人av| 中文字幕亚洲成人| **网站欧美大片在线观看| 国产精品私人影院| 中文字幕亚洲区| 亚洲日本免费电影| 一区av在线播放| 亚洲国产综合色| 五月婷婷色综合| 麻豆91免费看| 国产一区二区视频在线播放| 久久狠狠亚洲综合| 国产精品亚洲人在线观看| 国产aⅴ综合色| 9i看片成人免费高清| 色综合久久久久久久| 色噜噜狠狠色综合中国| 欧美色视频一区| 精品剧情在线观看| 中文字幕一区二区三区不卡| 亚洲青青青在线视频| 亚洲五月六月丁香激情| 精久久久久久久久久久| 成人性生交大片免费| 在线精品亚洲一区二区不卡| 欧美一卡2卡3卡4卡| 国产午夜久久久久| 夜夜精品视频一区二区 | 欧美日本在线播放| 欧美zozo另类异族| 日韩一区在线免费观看| 偷偷要91色婷婷| 丁香亚洲综合激情啪啪综合| 91精品办公室少妇高潮对白| 日韩欧美色综合| 国产精品福利在线播放| 日韩国产精品久久久| 国产精品996| 欧美日韩的一区二区| 中文字幕欧美日韩一区| 五月天中文字幕一区二区| 国产成人精品1024| 欧美性淫爽ww久久久久无| 久久综合久久综合久久综合| 一区二区三区在线视频播放| 国产资源精品在线观看| 欧美亚洲动漫制服丝袜| 久久久一区二区三区| 婷婷久久综合九色国产成人| 国产精品小仙女| 7777精品伊人久久久大香线蕉| 国产精品美女久久久久aⅴ | 日韩高清在线观看| 成人99免费视频| 日韩欧美一区二区三区在线| 亚洲女同ⅹxx女同tv| 风间由美一区二区三区在线观看 | 亚州成人在线电影| www.亚洲精品| 久久久噜噜噜久久人人看 | 国产成人精品三级| 欧美一区二区黄色| 亚洲高清免费一级二级三级| eeuss鲁一区二区三区| 久久亚洲欧美国产精品乐播| 日韩成人免费在线| 欧美日韩高清一区| 亚洲在线视频网站| 色悠悠亚洲一区二区| 国产精品久久国产精麻豆99网站| 国内久久婷婷综合| 欧美岛国在线观看| 另类专区欧美蜜桃臀第一页| 91精品国产全国免费观看| 午夜在线成人av| 欧美三级一区二区| 亚洲成人自拍偷拍| 欧美日韩精品一区二区三区四区 | 日韩国产精品大片| 欧美日韩国产一级片| 亚洲综合色婷婷| 在线观看三级视频欧美| 亚洲女人小视频在线观看| 色一情一乱一乱一91av| 亚洲精品老司机| 在线观看91视频| 亚洲伊人色欲综合网| 欧美视频一区在线| 视频一区欧美精品| 日韩视频一区二区三区 | 91福利精品第一导航| 一区二区三区在线影院| 欧美日韩色一区| 久久99久国产精品黄毛片色诱| 亚洲精品一区二区三区在线观看| 久久99精品久久久久久国产越南 | 精品国产一区二区在线观看| 久久国产剧场电影| 欧美激情在线观看视频免费| 成人激情视频网站| 亚洲免费在线观看视频| 欧美亚洲国产一卡| 蜜桃视频在线一区| 亚洲国产精品精华液ab| 91成人网在线| 美女一区二区三区| 国产精品视频看| 欧美系列亚洲系列| 国内精品伊人久久久久av影院| 久久久久久97三级| 在线观看日韩精品| 国产一区高清在线| 一区二区三区在线免费视频| 日韩欧美中文字幕制服| av影院午夜一区| 亚洲成av人片一区二区三区| 国产欧美日产一区| 欧美少妇一区二区| 国产一区二区三区av电影| 亚洲理论在线观看| 国产拍欧美日韩视频二区| 欧美精品自拍偷拍| av一本久道久久综合久久鬼色| 日本中文字幕一区二区有限公司| 国产精品欧美综合在线| 日韩一区二区三区三四区视频在线观看 | 欧美日韩亚洲高清一区二区| 精品一区二区三区在线观看| 亚洲欧美一区二区三区极速播放| 日韩小视频在线观看专区| av电影在线不卡| 国产美女精品在线| 日本在线不卡视频| 一片黄亚洲嫩模| 17c精品麻豆一区二区免费| wwwwxxxxx欧美| 日韩三级免费观看| 91精品国产乱| 欧美日韩视频专区在线播放| 色综合久久99| 白白色亚洲国产精品| 国产黄人亚洲片|