攻陷短視頻后,Sora將需要72萬塊H100 GPU
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:攻陷短視頻后,Sora將需要72萬塊H100 GPU
關(guān)鍵字:報(bào)告,模型,視頻,數(shù)據(jù),本文
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):15573字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:趙陽在被大規(guī)模采用后,Sora 的推理成本將很快超過訓(xùn)練成本。OpenAI 推出的 Sora 模型能夠在各種場景下生成極其逼真的視頻,吸引了全世界的目光。近日,投資機(jī)構(gòu) factorial funds 發(fā)表了一篇博文,深入探討了 Sora 背后的一些技術(shù)細(xì)節(jié),并對這些視頻模型可能產(chǎn)生影響進(jìn)行了探討。
最后,文中還討論了對用于訓(xùn)練 Sora 等模型的算力的看法,并對訓(xùn)練計(jì)算與推理計(jì)算的算力比較進(jìn)行了預(yù)測,這對估計(jì)未來 GPU 需求具有重要意義。機(jī)器之心對此文進(jìn)行了整理。
本報(bào)告的主要調(diào)查結(jié)果總結(jié)如下:
Sora 是一個(gè)建立在擴(kuò)散 Transformers(DiT)、潛在擴(kuò)散模型之上的擴(kuò)散模型,模型和訓(xùn)練數(shù)據(jù)集似乎都更大更多。
Sora 證明,擴(kuò)大視頻模型是有效的,與大語言模型(LLM)類似,將模型做得更大將是快速改進(jìn)模型的主要驅(qū)動(dòng)力。
Runway、Genmo 和 Pika 等公司正在圍繞類 Sora 視頻生成模型構(gòu)建直觀的界面和工作流程。這將決定它們的用途和可用性。
Sora 需要大量的計(jì)算能力來訓(xùn)練,至少需要在 4200~10500 塊英偉達(dá) H100 GPU 上
原文鏈接:攻陷短視頻后,Sora將需要72萬塊H100 GPU
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)