一句話讓姐為我換了N套衣服，谷歌卷出視頻生成新高度，網友：競賽加碼

AIGC動態2年前 (2024)發布量子位

一句話讓小姐姐為我換了N套衣服，谷歌卷出視頻生成新高度，網友：競賽加碼

AIGC動態歡迎閱讀

原標題：一句話讓姐為我換了N套衣服，谷歌卷出視頻生成新高度，網友：競賽加碼
關鍵字：視頻,模型,研究人員,連貫性,分辨率
文章來源：量子位
內容字數：3198字

內容摘要：

魚羊發自凹非寺量子位 | 公眾號 QbitAI谷歌一出手，又把AI視頻生成卷上了新高度。
一句話生成視頻，現在在名為Lumiere的AI操刀下，可以是醬嬸的：
△“陽光明媚，帆船在湖中航行”如此一致性和質量，再次點燃了網友們對AI視頻生成的熱情：谷歌加入戰局，又有好戲可看了。
不止是文生視頻，Lumiere把Pika的“一鍵換裝”也復現了出來。
左谷歌右pika，同樣是選中區域一句話完成視頻編輯，你pick哪一邊？
讓圖片中靜止的火焰躍動起來，也同樣一選就能完成：
還有圖片轉視頻：
視頻風格化：
總之就是主打一個質量又高又全能。
更多細節，我們論文扒起~
用于視頻生成的時空擴散模型Lumiere旨在解決以往視頻生成中存在的幾個關鍵問題：
真實性
多樣化
的連貫性
在此前的方法中，常見的做法是，擴散模型先生成一些稀疏的關鍵幀，而后通過一系列時間超分辨率（TSR）模型來填補關鍵幀之間的空白，接著再用空間超分辨率模型獲取高清視頻結果。
可以想見，在全局連貫性上，這樣的做法存在先天的缺陷。
Lumiere的創新點在于，提出了時空U-Net（STU-Net）架構：將視頻在空間和時間兩個維

原文鏈接：一句話讓姐為我換了N套衣服，谷歌卷出視頻生成新高度，網友：競賽加碼