潞晨科技尤洋:如何用低成本做出類Sora?成功復(fù)現(xiàn)有四個要素,時空分割是關(guān)鍵一步|GenAICon2024
AIGC動態(tài)歡迎閱讀
原標(biāo)題:潞晨科技尤洋:如何用低成本做出類Sora?成功復(fù)現(xiàn)有四個要素,時空分割是關(guān)鍵一步|GenAICon2024
關(guān)鍵字:模型,視頻,報告,解讀,技術(shù)
文章來源:智東西
內(nèi)容字?jǐn)?shù):14799字
內(nèi)容摘要:
視頻生成正處于“GPT-2時刻”,模型開源是有意義且重要的。
2024中國生成式AI大會于4月18-19日在北京舉行,在大會第二天的主會場AI Infra專場上,新加坡國立大學(xué)校長青年教授、潞晨科技創(chuàng)始人兼董事長尤洋以《技術(shù)共享:類Sora開源架構(gòu)模型與訓(xùn)練細(xì)節(jié)》為題發(fā)表演講。
潞晨科技在今年3月開源的全球首個類Sora視頻生成模型Open-Sora,是迄今GitHub上獲得星標(biāo)數(shù)最高的開源視頻大模型項目之一,截至發(fā)稿前已有1.6萬個星標(biāo),用戶群體遍及全球。
值得一提的是,這個模型在低成本下訓(xùn)練而成。相比Sora耗費數(shù)千張H100 GPU、花費數(shù)千萬美元乃至數(shù)億美元,Open-Sora的訓(xùn)練成本僅不到1萬美元。
尤洋認(rèn)為,視頻生成正處于“GPT-2時刻”,還沒有出現(xiàn)成熟的應(yīng)用。對于視頻生成模型來說,數(shù)據(jù)可能是最核心的資產(chǎn)。他還談到,模型開源是有意義且重要的。正如Meta最新發(fā)布的Llama 3,極大地調(diào)動了開源社區(qū)的積極性,不但造福大量開發(fā)者,更有助于開源社區(qū)整體的繁榮。
因此,Open-Sora模型也進(jìn)行了全面的訓(xùn)練流程開源,開源了包括模型架構(gòu)、模型權(quán)重、訓(xùn)練細(xì)節(jié)、數(shù)據(jù)處理在內(nèi)的多項
原文鏈接:潞晨科技尤洋:如何用低成本做出類Sora?成功復(fù)現(xiàn)有四個要素,時空分割是關(guān)鍵一步|GenAICon2024
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。