国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

圖像領域再次與LLM一拍即合!idea撞車OpenAI強化微調,西湖大學發布圖像鏈CoT

AIGC動態1年前 (2024)發布 新智元
192 0 0

新智元報道編輯:LRST【新智元導讀】MAPLE實驗室提出通過強化學習優化圖像生成模型的去噪過程,使其能以更少的步驟生成高質量圖像,在多個圖像生成模型上實現了減少推理步驟,還能提高圖像質量。OpenAI最近推出了在大語言模型LLM上的強化微調(Reinforcement Finetuning,ReFT),能夠讓模型利用CoT進行多步推理之后,通過強化學習讓最終輸出符合人類偏好。無獨有偶,齊國君教授領導的MAPLE實驗室在OpenAI發布會一周前公布的工作中也發現了圖像生成領域的主打方法擴散模型和流模型中也存在類似的過程:模型從高斯噪聲開始的多步去噪過程也類似一個思維鏈,逐步「思考」怎樣生成一張高質量圖像,是一種圖像生成領域的「圖像鏈CoT」。與OpenAI不謀而和的是,機器學習與感知(MAPLE)實驗室認為強化學習微調方法同樣可以用于優化多步去噪的圖像生成過程,論文指出利用與人類獎勵對齊的強化學習監督訓練,能夠讓擴散模型和流匹配模型自適應地調整推理過程中噪聲強度,用更少的步數生成高質量圖像內容。論文地址:https://arxiv.org/abs/2412.01243研究背景擴散和流匹配模型是當前主流的圖像生成模型,從標準高斯分布中采樣的噪聲逐步變換為一張高質量圖像。在訓練時,這些模型會單獨監督每一個去噪步驟,使其具備能恢復原始圖像的能力;而在實際推理時,模型則會事先指定若干個不同的擴散時間,然后在這些時間上依次執行多步去噪過程。這一過程存在兩個問題:1. 經典的擴散模型訓練方法只能保證每一步去噪能盡可能恢復出原始圖像,不能保證整個去噪過程得到的圖像符合人類的偏好;2. 經典的擴散模型所有的圖片都采用了同樣的去噪策略和步數;而顯然不同復雜度的圖像對于人類來說生成難度是不一樣的。如下圖所示,當輸入不同長度的prompt的時候,對應的生成任務難度自然有所區別。那些僅包含簡單的單個主體前景的圖像較為簡單,只需要少量幾步就能生成不錯的效果,而帶有精細細節的圖像則需要更多步數,即經過強化微調訓練后的圖像生成模型就能自適應地推理模型去噪過程,用盡可能少的步數生成更高質量的圖像。值得注意的是,類似于LLM對思維鏈進行的動態優化,對擴散模型時間進行優化的時候也需要動態地進行,而非僅僅依據輸入的prompt;換言之,優化過程需要根據推理過程生成的「圖像鏈」來動態一步步預測圖像鏈下一步的最優去噪時間,從而保證圖像的生成質量滿足reward指標。方法MAPLE實驗室認為,要想讓模型在推理時用更少的步數生成更高質量的圖像結果,需要用強化微調技術對多步去噪過程進行整體監督訓練。既然圖像生成過程同樣也類似于LLM中的CoT:模型通過中間的去噪步驟「思考」生成圖像的內容,并在最后一個去噪步驟給出高質量的結果,也可以通過利用獎勵模型評價整個過程生成的圖像質量,通過強化微調使模型的輸出更符合人類偏好。OpenAI的O1通過在輸出最終結果之前生成額外的token讓LLM能進行額外的思考和推理,模型所需要做的最基本的決策是生成下一個token;而擴散和流匹配模型的「思考」過程則是在生成最終圖像前,在不同噪聲強度對應的擴散時間(diffusion time)執行多個額外的去噪步驟。為此,模型需要知道額外的「思考」步驟應該在反向擴散過程推進到哪一個diffusion time的時候進行。為了實現這一目的,在網絡中引入了一個即插即用的時間預測模塊(Time Prediction Module, TPM)。這一模塊會預測在當前這一個去噪步驟執行完畢之后,模型應當在哪一個diffusion time下進行下一步去噪。具體而言,該模塊會同時取出去噪網絡第一層和最后一層的圖像特征,預測下一個去噪步驟時的噪聲強度會下降多少。模型的輸出策略是一個參數化的beta分布。由于單峰的Beta分布要求α>1且β>1,研究人員對輸出進行了重參數化,使其預測兩個實數a和b,并通過如下公式確定對應的Beta分布,并采樣下一步的擴散時間。在強化微調的訓練過程中,模型會在每一步按輸出的Beta分布隨機采樣下一個擴散時間,并在對應時間執行下一個去噪步驟。直到擴散時間非常接近0時,可以認為此時模型已經可以近乎得到了干凈圖像,便終止去噪過程并輸出最終圖像結果。通過上述過程,即可采樣到用于強化微調訓練的一個決策軌跡樣本。而在推理過程中,模型會在每一個去噪步驟輸出的Beta分布中直接采樣眾數作為下一步對應的擴散時間,以確保一個確定性的推理策略。設計獎勵函數時,為了鼓勵模型用更少的步數生成高質量圖像,在獎勵中綜合考慮了生成圖像質量和去噪步數這兩個因素,研究人員選用了與人類偏好對齊的圖像評分模型ImageReward(IR)用以評價圖像質量,并將這一獎勵隨步數衰減至之前的去噪結果,并取平均作為整個去噪過程的獎勵。這樣,生成所用的步數越多,最終獎勵就越低。模型會在保持圖像質量的前提下,盡可能地減少生成步數。將整個多步去噪過程當作一個動作進行整體優化,并采用了無需值模型的強化學習優化算法RLOO [1]更新TPM模塊參數,訓練損失如下所示:在這一公式中,s代表強化學習中的狀態,在擴散模型的強化微調中是輸入的文本提詞和初始噪聲;y代表決策動作,也即模型采樣的擴散時間;代表決策器,即網絡中A是由獎勵歸一化之后的優勢函數,采用LEAVE-One-Out策略,基于一個Batch內的樣本間獎勵的差值計算優勢函數。通過強化微調訓練,模型能根據輸入圖像自適應地調節擴散時間的衰減速度,在面對不同的生成任務時推理不同數量的去噪步數。對于簡單的生成任務(較短的文本提詞、生成圖像物體少),推理過程能夠很快生成高質量的圖像,噪聲強度衰減較快,模型只需要思考較少的額外步數,就能得到滿意的結果;對于復雜的生成任務(長文本提詞,圖像結構復雜)則需要在擴散時間上密集地進行多步思考,用一個較長的圖像鏈COT來生成符合用戶要求的圖片。通過調節不同的γ值,模型能在圖像生成質量和去噪推理的步數之間取得更好的平衡,僅需要更少的平均步數就能達到與原模型相同的性能。同時,強化微調的訓練效率也十分驚人。正如OpenAI最少僅僅用幾十個例子就能讓LLM學會在自定義領域中推理一樣,強化微調圖像生成模型對數據的需求也很少。不需要真實圖像,只需要文本提詞就可以訓練,利用不到10,000條文本提詞就能取得不錯的明顯的模型提升。經強化微調后,模型的圖像生成質量也比原模型提高了很多。可以看出,在僅僅用了原模型一半生成步數的情況下,無論是圖C中的筆記本鍵盤,圖D中的球棒還是圖F中的遙控器,該模型生成的結果都比原模型更加自然。針對Stable Diffusion 3、Flux-dev等一系列最先進的開源圖像生成模型進行了強化微調訓練,發現訓練后的模型普遍能減少平均約50%的模型推理步數,而圖像質量評價指標總體保持不變,這說明對于圖像生成模型而言,強化微調訓練是一種通用的后訓練(Post Training)方法。結論這篇報告介紹了由MAPLE實驗室提出的,一種擴散和流匹配模型的強化微調方法。該方法將多步去噪的圖像生成過程看作圖像生成領域的COT過程,通過將整個去噪過程的最終輸出與人類偏好對齊,實現了用更少的推理步數生成更高質量圖像。在多個開源圖像生成模型上的實驗結果表明,這種強化微調方法能在保持圖像質量的同時顯著減少約50%推理步數,微調后模型生成的圖像在視覺效果上也更加自然。可以看出,強化微調技術在圖像生成模型中仍有進一步應用和提升的潛力,值得進一步挖掘。參考資料:https://arxiv.org/abs/2412.01243

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        国产一区在线不卡| 99精品视频在线观看播放| 精品三级av在线| 欧美人与禽zoz0善交| 欧美性感一类影片在线播放| 性色av浪潮av| 欧美中文字幕不卡| 天天躁日日躁aaaa视频| 日韩一区二区三区在线观看| 丰满的亚洲女人毛茸茸| 亚洲国产精品国自产拍av秋霞| 青娱乐国产视频| 亚洲国产一区自拍| 精品久久久久久久久久岛国gif| 国产一区二区三区欧美| 免费萌白酱国产一区二区三区| 欧美日韩成人网| 三级电影一区| 亚洲最大福利网站| 精品一区二区三区香蕉蜜桃| 亚洲一区二区在| 91高清一区| 国产91免费视频| 国产麻豆9l精品三级站| 国产成人黄色av| 欧美亚洲视频| 亚欧精品在线| 最近中文字幕一区二区三区| 成人在线短视频| 欧美变态口味重另类| 国产成人手机视频| 色婷婷综合久久久| 制服丨自拍丨欧美丨动漫丨| 一区二区三区在线播放欧美| sdde在线播放一区二区| 91视频-88av| 成人午夜视频在线观看| 欧美韩国日本在线| 成人黄页毛片网站| 精品999在线| 欧美日韩视频在线一区二区| 日韩专区视频网站| 国产69精品久久久| 另类亚洲自拍| 91视频 - 88av| 婷婷国产v国产偷v亚洲高清| 美女网站视频色| 欧美美女操人视频| 久久精品动漫| 国产美女在线一区| 色婷婷综合久久久| 99久热这里只有精品视频免费观看| 欧美最近摘花xxxx摘花| 日韩不卡一区二区三区| 青草视频在线观看视频| 91精品福利在线| 久久精品九色| 成人免费视频网址| 久久影院午夜片一区| 日韩大尺度视频| 日韩视频永久免费观看| 日韩午夜精品| www.亚洲视频.com| 欧美久久久一区| 欧美日韩爱爱| 日韩欧美一区二区三区四区五区 | wwww.国产| 欧美成va人片在线观看| 久久看人人摘| 欧美亚洲视频一区| 欧美视频中文在线看| 伊人久久大香线蕉av超碰| 成人在线观看视频网站| 国产视频在线观看一区二区三区| 超碰超碰超碰超碰超碰| 在线亚洲高清视频| 一区二区小说| 一本一本a久久| 成人av电影在线网| 中文字幕在线免费看线人| 久久99久久亚洲国产| 久久国产免费看| 免费看的av网站| 久久夜色撩人精品| 久久99久国产精品黄毛片色诱| 97超碰成人在线| 中日韩美女免费视频网站在线观看| 国产一区二区你懂的| 国产又大又硬又粗| 尤物tv国产一区| 蜜桃免费网站一区二区三区| 超级砰砰砰97免费观看最新一期| 久久精品视频亚洲| 国产a精品视频| 丰满少妇一区二区| 国产精品视频网站| 亚洲免费观看在线观看| 亚洲欧洲国产精品一区| 日本成人看片网址| 欧美男同性恋视频网站| 尤物在线精品| 天天操狠狠操夜夜操| 久久亚洲精品成人| k8久久久一区二区三区| 懂色av蜜臀av粉嫩av永久| 91免费版黄色| 91国产福利在线| 国产精品多人| 在线观看av免费观看| 午夜精品一区二区三区在线| 欧美国产综合色视频| 久久99精品久久久野外观看| 亚洲韩国在线| 亚洲第一页中文字幕| 日本免费新一区视频| 在线观看av中文字幕| 成人精品在线观看| 色嗨嗨av一区二区三区| 亚洲图片在线| 无码国产精品一区二区高潮| 国产成+人+综合+亚洲欧洲| 一区二区三区免费看视频| 五月天婷婷激情视频| 久久久精品网站| 欧美激情在线看| 欧美人体视频| www.亚洲天堂网| 午夜精品福利在线观看| 有坂深雪av一区二区精品| 日韩片欧美片| 911av视频| 成人精品一区二区三区| 欧美群妇大交群中文字幕| 久久精品综合| 国产免费一区二区三区四区| 午夜精品一区二区三区四区 | 国内外成人免费激情在线视频网站| 国产精品三级电影| 国产又粗又长又爽| 97夜夜澡人人双人人人喊| 在线不卡的av| 国产美女精品人人做人人爽| 国产精久久久| 日本www在线视频| 91wwwcom在线观看| 日韩欧美主播在线| 久久一区二区三区超碰国产精品| 欧美aaa级片| 免费观看黄色大片| 欧美人交a欧美精品| 一区二区三区久久| 亚洲美女网站| 色欲av无码一区二区人妻| 91a在线视频| 欧美性大战久久久久久久蜜臀| 久久精品久久99精品久久| 国产一区二区久久久久| 又粗又黑又大的吊av| 浅井舞香一区二区| 欧美精品日韩一本| 成人av先锋影音| 欧美多人猛交狂配| 黄瓜视频免费观看在线观看www | 欧美怡红院视频| 国产麻豆成人传媒免费观看| 色吊丝一区二区| 污污视频在线免费| 你懂的视频在线一区二区| 午夜伦理一区二区| 蜜桃久久av一区| 自拍亚洲一区| 中文字幕一区三区久久女搜查官| 亚洲精品在线免费| 97视频在线观看免费| 欧美剧情片在线观看| 久久久久久久综合| 激情欧美国产欧美| 男女无套免费视频网站动漫| 98国产高清一区| 亚洲最新av在线网站| 亚洲6080在线| 国产一区二区不卡在线 | 伊人久久av导航| 2019中文字幕在线观看| 日韩一区二区精品在线观看| 制服诱惑一区二区| 99精品在免费线中文字幕网站一区| 91香蕉国产线在线观看| 日本一区二区在线视频| 欧美亚洲另类在线| 欧美成人综合网站| 亚洲免费av观看| 国产美女在线精品| 在线看片不卡| 自拍偷拍一区二区三区四区| 欧美二区三区在线| 青青久久av北条麻妃黑人| 亚洲精品国产免费| 婷婷亚洲久悠悠色悠在线播放| 福利电影一区二区| 伊人精品视频| 色愁久久久久久| www日韩在线| 欧美国产日韩在线视频| 国产成人精品视频| 最近2019中文字幕在线高清| 欧美吞精做爰啪啪高潮| 成人欧美一区二区三区小说| 精品夜夜嗨av一区二区三区| 综合天天久久| 欧美aaaaa级| 亚洲一二三四五六区| 在线观看视频99| 欧美精品在线观看一区二区| 亚洲人成精品久久久久久| 国产成人综合精品三级| 99精品热6080yy久久| 一本色道久久综合狠狠躁的番外| 一级免费黄色录像| 性鲍视频在线观看| 免费国产a级片| 亚洲午夜精品一区二区| 成人欧美视频在线| 日本一本a高清免费不卡| 日韩最新在线视频| 精品国产麻豆免费人成网站| 色噜噜狠狠一区二区三区果冻| 国产精品私房写真福利视频| 成人黄色在线视频| 久国产精品韩国三级视频| 亚洲国产精品第一区二区| 日韩大片在线观看| 欧亚精品一区| 国产精品调教视频| 91精品在线免费视频| 摸摸摸bbb毛毛毛片| 日本japanese极品少妇| 天天爽夜夜爽视频| 午夜一区二区视频| 国产97色在线 | 日韩| 欧美日韩不卡在线视频| 波多野结衣三级在线| 翔田千里亚洲一二三区| 久久99久久久久久久噜噜| 中国china体内裑精亚洲片| 日韩电影第一页| 亚洲黄页视频免费观看| 日韩欧美在线网站| 久久精品视频在线免费观看| 不卡av在线免费观看| 国产91精品一区二区麻豆亚洲| 国内成+人亚洲+欧美+综合在线| 久久久蜜桃一区二区人| 亚洲伊人网站| 欧美一级二区| 日韩国产欧美在线观看| 奇米四色…亚洲| 亚洲午夜久久| 综合国产视频| jlzzjlzz亚洲女人| 99热国内精品永久免费观看| 久久大综合网| 欧美精品色网| 黄色在线成人| 久久精品人人| 久久精品国产亚洲高清剧情介绍| 美女一区二区三区在线观看| 国内精品写真在线观看| 色婷婷色综合| 欧美激情日韩| 久久午夜电影| 国产精品主播直播| 成人动漫av在线| 久久久亚洲国产美女国产盗摄| 久久女同性恋中文字幕| 国产精品久久久久久户外露出| 亚洲视频免费看| 日韩欧美aⅴ综合网站发布| 91福利国产成人精品照片| 在线综合视频播放| 亚洲国内高清视频| 日韩亚洲精品电影| 国产69精品久久久| 91精品在线国产| 欧美一区二区视频在线| 无码人妻精品一区二区蜜桃百度| 国产主播自拍av| 国产精品探花在线播放| 国产jk精品白丝av在线观看| 日韩av懂色| 中文字幕乱码一区二区三区| 最新av网址在线观看| 欧美激情成人网| www.17c.com喷水少妇| 久久av红桃一区二区禁漫| 澳门精品久久国产| 久久中文视频| 日韩精品一级中文字幕精品视频免费观看 | 艳母动漫在线免费观看| 久久久久狠狠高潮亚洲精品| 26uuu国产| 国产在线观看免费视频软件| 精品亚洲自拍| 欧美视频网站| 国产精品小仙女| 亚洲欧洲av一区二区三区久久| 欧美视频在线观看免费| 精品美女一区二区三区| 久久国产视频网站| 91在线中文字幕| 91免费视频黄| 免费成人在线观看av| 91九色丨porny丨国产jk| 欧美xxxx日本和非洲| 日韩欧美激情| 欧美精品国产| 日韩精品水蜜桃| 久久se这里有精品| 综合久久久久综合| 欧美一级免费观看| 欧美黄色性视频| 国产精品对白刺激久久久| 99er在线视频| 色综合久久五月| 国产96在线亚洲| 性欧美长视频| 国产精品网站一区| 777精品伊人久久久久大香线蕉| 久久久精品久久久| 999在线观看免费大全电视剧| 青青草视频国产| 人妻体内射精一区二区三区| а√中文在线天堂精品| 美日韩精品视频| 中文字幕欧美一| 亚洲国产成人91精品| 国产成人精品日本亚洲| 中文字幕精品在线播放| 中国xxxx性xxxx产国| 全国精品免费看| 麻豆一区二区99久久久久| 一区二区三区在线观看动漫| 精品国产一区二区三区久久影院 | 青青草成人影院| 大胆亚洲人体视频| 一本到高清视频免费精品| 久久精品99久久久香蕉| 国内精品视频免费| 美女网站色免费| 日韩精品视频一区二区三区| 久久国产一二区| 亚洲一区在线观看视频| 最近2019年中文视频免费在线观看| 国产日韩一区欧美| 波多野结衣xxxx| 精品无人区一区二区| 国产一区二区三区日韩| 欧美色图12p| 欧美性受xxxx黑人猛交| 欧美极品少妇无套实战| 少妇视频一区二区| 久久精品九九| 欧美日韩国产精品一区二区不卡中文 | 欧美激情综合网| 国产丝袜一区二区| caoporn国产精品免费公开| 亚洲制服中文字幕| 国产一区国产二区国产三区| 91香蕉视频黄| 亚洲国产精品免费| 国产在线一区二区三区欧美| 波多野结衣电影免费观看| 欧美一区2区| 国产精品国产馆在线真实露脸| 亚洲色图狂野欧美| 日本在线观看不卡| 亚洲国产日韩一区无码精品久久久| 精久久久久久| 精品美女国产在线| 日韩美女在线播放| 18岁视频在线观看| 天海翼亚洲一区二区三区| 久久综合成人精品亚洲另类欧美| 日韩av在线直播| 天堂精品视频| 538精品在线视频| 狠狠色伊人亚洲综合成人| 欧美一级淫片007| 久久精品人成| 久久久久亚洲av无码a片| 视频在线观看一区二区三区| 欧美日韩国产片| 97av影视网在线观看| 日本一卡二卡在线| 亚洲最黄网站| 91精品国产欧美日韩| 久久精品人成| 中国一级片在线观看| 成人h版在线观看| 亚洲一区二区三区四区在线免费观看 |