Sora不開源，微軟給你開源！全球最接近Sora視頻模型誕生，12秒生成效果逼真炸裂

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：Sora不開源，微軟給你開源！全球最接近Sora視頻模型誕生，12秒生成效果逼真炸裂
關鍵字：視頻,圖像,文本,模型,智能
文章來源：新智元
內容字數：11999字

內容摘要：

新智元報道編輯：編輯部
【新智元導讀】用不了多久，開源版的Sora就會涌來！理海大學微軟團隊已經做出一種全新多AI智能體框架Mora，可以完全復刻Sora能力，且生成視頻效果幾乎不相上下。微軟版Sora誕生了！
Sora雖爆火但閉源，給學術界帶來了不小的挑戰。學者們只能嘗試使用逆向工程來對Sora復現或擴展。
盡管提出了Diffusion Transformer和空間patch策略，但想要達到Sora的性能還是很難，何況還缺乏算力和數據集。
不過，研究者發起的新一波復現Sora的沖鋒，這不就來了么！
就在剛剛，理海大手微軟團隊一種新型的多AI智能體框架———Mora。
論文地址：https://arxiv.org/abs/2403.13248
沒錯，理海大學和微軟的思路，是靠AI智能體。
Mora更像是Sora的通才視頻生成。通過整合多個SOTA的視覺AI智能體，來復現Sora展示的通用視頻生成能力。
具體來說，Mora能夠利用多個視覺智能體，在多種任務中成功模擬Sora的視頻生成能力，包括：
– 文本到視頻生成
– 基于文本條件的圖像到視頻生成
– 擴展已生成視頻
– 視頻到視

原文鏈接：Sora不開源，微軟給你開源！全球最接近Sora視頻模型誕生，12秒生成效果逼真炸裂