AIGC動態歡迎閱讀
原標題:OpenAI Sora視頻生成模型技術報告中英全文
關鍵字:報告,視頻,模型,圖像,能力
文章來源:人工智能學家
內容字數:18264字
內容摘要:
來源:專知
OpenAI 探索了視頻數據生成模型的大規模訓練。具體來說,研究人員在可變持續時間、分辨率和寬高比的視頻和圖像上聯合訓練了一個文本條件擴散模型。作者利用對視頻和圖像潛在代碼的時空補丁進行操作的 transformer 架構,其最大的模型 Sora 能夠生成長達一分鐘的高質量視頻。
OpenAI 認為,新展示的結果表明,擴展視頻生成模型是構建物理用模擬器的一條有前途的途徑。
We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios. We leverage a transformer architecture that operates on spacetime patches of video and image la
原文鏈接:OpenAI Sora視頻生成模型技術報告中英全文
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...