AIGC動態歡迎閱讀
原標題:解剖Sora:37頁論文逆向工程推測技術細節,微軟參與,華人團隊出品
關鍵字:報告,視頻,模型,編碼器,視覺
文章來源:量子位
內容字數:12694字
內容摘要:
西風 發自 凹非寺量子位 | 公眾號 QbitAISora剛發布不久,就被逆向工程“解剖”了?!
來自理海大學、微軟研究院的華人團隊發布了首個Sora相關研究綜述,足足有37頁。
他們基于Sora公開技術報告和逆向工程,對模型背景、相關技術、應用、現存挑戰以及文本到視頻AI模型未來發展方向進行了全面分析。
連計算機視覺領域的AI生成模型發展史、近兩年有代表性的視頻生成模型都羅列了出來:
網友們也屬實沒想到,僅僅過了半個月、Sora還暫未公開僅有部分人可使用,學術圈相關研究竟出現得這么快。
不少網友表示,綜述非常全面有條理,建議全文閱讀。
那么這篇綜述具體都講了啥?
量子位在不改變原意的基礎上,對部分內容進行了整理。
目錄
逆向工程剖析Sora技術細節
整體架構
多樣性視覺數據預處理
指令調優:視頻摘要生成器
視頻提示工程
Sora具有里程碑式意義
Sora的五大應用前景及局限性
逆向工程剖析Sora技術細節眾所周知,Sora發布后,OpenAI緊接著發布了技術報告,但未詳細透露技術細節,被有的網友吐槽OpenAI果然還是這么“Close”。
學術圈的猜測也是五花八門,ResNeXt一作
原文鏈接:解剖Sora:37頁論文逆向工程推測技術細節,微軟參與,華人團隊出品
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...