<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Step-Video-T2V

        AI工具5個月前更新 AI工具集
        443 0 0

        Step-Video-T2V – 階躍星辰開源的文本到視頻模型

        Step-Video-T2V 是由階躍星辰團隊開發(fā)的開源文本到視頻生成預訓練模型,具備 300 億參數(shù),能夠生成高達 204 幀的高質(zhì)量視頻。此模型基于深度壓縮的變分自編碼器(Video-VAE),實現(xiàn)了 16×16 的空間壓縮和 8× 的時間壓縮,顯著提高了訓練與推理的效率。

        Step-Video-T2V是什么

        Step-Video-T2V 是一款由階躍星辰團隊推出的開源文本到視頻生成的預訓練模型。它擁有 300 億個參數(shù),能夠生成長達 204 幀的高質(zhì)量視頻。該模型采用了深度壓縮的變分自編碼器(Video-VAE)架構(gòu),能夠?qū)崿F(xiàn) 16×16 的空間壓縮和 8× 的時間壓縮,從而大幅提升了訓練和推理的效率。此外,Step-Video-T2V 配備了雙語文本編碼器,支持中英文提示輸入,并通過直接偏好優(yōu)化(DPO)方法進一步提升視頻生成的質(zhì)量。該模型基于擴散的 Transformer(DiT)架構(gòu)和 3D 全注意力機制,在生成具有豐富動態(tài)和高美學質(zhì)量的視頻方面表現(xiàn)尤為突出。

        Step-Video-T2V

        Step-Video-T2V的主要功能

        • 高質(zhì)量視頻生成:Step-Video-T2V 具備 300 億參數(shù),能夠生成長達 204 幀的高質(zhì)量視頻,支持 544×992 的分辨率。
        • 雙語文本支持:內(nèi)置雙語文本編碼器,能直接處理中文和英文提示,生成與文本描述一致的視頻內(nèi)容。
        • 動態(tài)與美學優(yōu)化:采用 3D 全注意力的 DiT 架構(gòu)和 Flow Matching 訓練方法,生成具有強烈效果和卓越美學的視頻。

        Step-Video-T2V的技術原理

        • 深度壓縮的變分自編碼器(Video-VAE):Step-Video-T2V 采用深度壓縮的變分自編碼器(Video-VAE),實現(xiàn) 16×16 的空間壓縮和 8× 的時間壓縮,有效降低了視頻生成任務的計算復雜度,同時保持了出色的視頻重建質(zhì)量。
        • 雙語文本編碼器:模型配備兩個預訓練的雙語文本編碼器,能夠理解中文和英文提示,從而生成符合文本描述的視頻。
        • 基于擴散的 Transformer(DiT)架構(gòu):Step-Video-T2V 基于擴散的 Transformer(DiT)架構(gòu),結(jié)合 3D 全注意力機制,通過 Flow Matching 訓練逐步去噪輸入噪聲,生成潛在幀,利用文本嵌入和時間步作為條件因子,展現(xiàn)出色的動態(tài)和美學質(zhì)量。
        • 直接偏好優(yōu)化(DPO):為提升生成視頻品質(zhì),Step-Video-T2V 引入視頻直接偏好優(yōu)化(Video-DPO)方法,利用人類偏好數(shù)據(jù)對模型進行微調(diào),降低偽影并增強視覺效果,使生成的視頻更加流暢和真實。
        • 級聯(lián)訓練策略:模型采用級聯(lián)訓練流程,包括文本到圖像(T2I)預訓練、文本到視頻/圖像(T2VI)預訓練、文本到視頻(T2V)微調(diào)及直接偏好優(yōu)化(DPO)訓練,促進模型快速收斂,充分利用不同質(zhì)量的視頻數(shù)據(jù)。
        • 系統(tǒng)優(yōu)化:在系統(tǒng)層面,Step-Video-T2V 進行了優(yōu)化,包括張量并行、序列并行和 Zero1 優(yōu)化,確保高效的分布式訓練。引入高性能通信框架 StepRPC 和雙層監(jiān)控系統(tǒng) StepTelemetry,以優(yōu)化數(shù)據(jù)傳輸效率和識別性能瓶頸。

        Step-Video-T2V的項目地址

        Step-Video-T2V的應用場景

        • 視頻內(nèi)容創(chuàng)作:Step-Video-T2V 可根據(jù)文本提示快速生成創(chuàng)意視頻,幫助創(chuàng)作者節(jié)省時間和精力,降低視頻制作的門檻。
        • 廣告制作:能夠為品牌和廣告商生成個性化的視頻廣告內(nèi)容,提升廣告的吸引力和傳播效果。
        • 教育與培訓:可生成教學視頻,幫助學生更好地理解和記憶知識內(nèi)容。
        • 娛樂與影視:為影視制作提供創(chuàng)意素材,輔助生成特效、動畫或短劇片段,加速創(chuàng)作流程。
        • 社交媒體:Step-Video-T2V 為用戶提供個性化的視頻生成工具,豐富社交平臺的內(nèi)容生態(tài),提升用戶互動性。生成的視頻可用于社交媒體的創(chuàng)意內(nèi)容分享。
        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国拍在线精品视频免费观看 | 久久精品国产亚洲Aⅴ蜜臀色欲| 99精品视频免费| 亚洲欧洲精品成人久久奇米网 | 国产精品免费久久久久电影网| 国产婷婷高清在线观看免费| 国产在亚洲线视频观看| 久久久久国产精品免费看| 大学生一级特黄的免费大片视频 | 久久亚洲春色中文字幕久久久| 亚洲另类无码专区丝袜| 好大好硬好爽免费视频| 亚洲AV日韩AV永久无码色欲 | 亚洲AV一宅男色影视| 久久精品免费观看| 久久综合亚洲色一区二区三区| 色片在线免费观看| 亚洲A∨精品一区二区三区下载| 国产嫩草影院精品免费网址| 国产精品成人免费观看| 亚洲av网址在线观看| 免费看h片的网站| 亚洲国产精华液2020| 亚洲男人天堂2020| 最近2022中文字幕免费视频| 亚洲xxxx视频| 国产亚洲自拍一区| 最近免费2019中文字幕大全| 亚洲中文字幕无码久久2020| 亚洲一级免费毛片| 亚洲精品成a人在线观看☆| 亚洲av无码成人精品区| 免费国产99久久久香蕉| 亚洲精品综合在线影院| 午夜亚洲av永久无码精品| 国产偷国产偷亚洲清高APP| 怡红院亚洲怡红院首页| 亚洲一区免费在线观看| 阿v免费在线观看| 亚洲视频在线免费看| 天堂亚洲免费视频|