擴散模型和最優傳輸之間到底存在怎樣的聯系?
原標題:擴散模型、最優傳輸存在什么關系?法國數學家4頁論文引網友圍觀
文章來源:機器之心
內容字數:4768字
擴散模型與最優傳輸之間的聯系
擴散模型與最優傳輸(OT)之間的關系仍然是一個未解之謎。雖然在相似的數據集上訓練的擴散模型往往能夠恢復出相似的映射關系,但這些映射關系并不一定是最優傳輸映射。2022年,博科尼大學的Hugo Lavenant與里昂第一大學的Filippo Santambrogio合作發表了論文,探討了流模型在OT框架中的應用,并提供了反例,表明在某些情況下流模型并不實現最優傳輸。
研究背景
在先前的研究中,Khrulkov和Oseledets提出了一個猜想,認為通過積分Fokker-Planck方程的Wasserstein速度所得到的ODE流可以獲得最優傳輸映射。然而,Kim和Milman的研究認為這一猜想是錯誤的,卻沒有提供證明。Lavenant和Santambrogio的論文則為這一點提供了明確的反例。
擴散模型與最優傳輸的定義
生成模型的目標是在參考分布α(通常是高斯分布)與數據分布β之間構建傳輸映射T。通過求解Monge問題,最優傳輸可以找到唯一的映射T。根據Brenier定理,這個映射可以表示成一個凸函數的梯度。另一方面,擴散模型則通過定義從數據分布β演化到高斯分布α的過程來構建流圖。
重要發現
Lavenant和Santambrogio通過矛盾證明了,逆向流圖一般情況下并不是最優傳輸。他們構造了一個接近各向同性高斯分布的β,證明在某些時刻從α到β_t的逆向流圖T_t并不是最優傳輸。這一發現表明,假設流圖T_t是所有t的最優傳輸會導致矛盾。
結論
總體而言,盡管擴散模型和最優傳輸之間存在某種聯系,但流模型并不總是能夠定義最優傳輸映射。Lavenant和Santambrogio的研究為這一復雜關系提供了新的視角,揭示了在某些情況下,流模型的映射可能并不具備最優性。這一領域的研究仍有待進一步深入,以更好地理解擴散模型與最優傳輸之間的本質關系。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺