AIGC動態歡迎閱讀
原標題:Sora不開源,微軟給你開源!全球最接近Sora視頻模型誕生,12秒生成效果逼真炸裂
關鍵字:視頻,圖像,文本,模型,智能
文章來源:新智元
內容字數:11999字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】用不了多久,開源版的Sora就會涌來!理海大學微軟團隊已經做出一種全新多AI智能體框架Mora,可以完全復刻Sora能力,且生成視頻效果幾乎不相上下。微軟版Sora誕生了!
Sora雖爆火但閉源,給學術界帶來了不小的挑戰。學者們只能嘗試使用逆向工程來對Sora復現或擴展。
盡管提出了Diffusion Transformer和空間patch策略,但想要達到Sora的性能還是很難,何況還缺乏算力和數據集。
不過,研究者發起的新一波復現Sora的沖鋒,這不就來了么!
就在剛剛,理海大手微軟團隊一種新型的多AI智能體框架———Mora。
論文地址:https://arxiv.org/abs/2403.13248
沒錯,理海大學和微軟的思路,是靠AI智能體。
Mora更像是Sora的通才視頻生成。通過整合多個SOTA的視覺AI智能體,來復現Sora展示的通用視頻生成能力。
具體來說,Mora能夠利用多個視覺智能體,在多種任務中成功模擬Sora的視頻生成能力,包括:
– 文本到視頻生成
– 基于文本條件的圖像到視頻生成
– 擴展已生成視頻
– 視頻到視
原文鏈接:Sora不開源,微軟給你開源!全球最接近Sora視頻模型誕生,12秒生成效果逼真炸裂
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...