用于視頻生成的下一幀預(yù)測(cè)模型。
一鍵將視頻和音頻轉(zhuǎn)化為各種風(fēng)格的文檔。
開(kāi)源視頻生成模型,支持多種生成任務(wù)。
GAIA-2 是一個(gè)先進(jìn)的視頻生成模型,用于創(chuàng)建安全的自動(dòng)駕駛場(chǎng)景。
加速視頻擴(kuò)散模型,生成速度提升 8.5 倍。
從社交媒體視頻中提取食譜并進(jìn)行管理的工具
一種提升場(chǎng)景級(jí)視頻生成能力的技術(shù)。
Jellypod 2.0 是一款革命性的 AI 播客工具,支持視頻和多種。
On-device Sora 是一個(gè)基于擴(kuò)散模型的移動(dòng)設(shè)備端文本到視頻生成項(xiàng)目。
利用先進(jìn)人工智能技術(shù),將靜...
Kawara AI 是一款利用人工智能組織視頻文件、快速查找所需片段的產(chǎn)品。
將YouTube視頻快速轉(zhuǎn)換為AI生成的筆記,節(jié)省時(shí)間,專注學(xué)習(xí)。
一個(gè)開(kāi)源項(xiàng)目,用于在瀏覽器中演示 AI 視頻生成模型。
Zight AI 是一款將視頻轉(zhuǎn)化為可操作文檔的智能工具,支持自動(dòng)生成標(biāo)題、摘要和多語(yǔ)言字幕。
TransPixar 利用突破性的 AI 技術(shù)將文本轉(zhuǎn)換為透明視頻,徹底改變創(chuàng)意制作方式。
Tarsier 是由字節(jié)跳動(dòng)推出的用于生成高質(zhì)量視頻描述的大型視頻語(yǔ)言模型。
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos
OmniHuman-1 是一種基于單張人像和運(yùn)動(dòng)信號(hào)生成人類視頻的多模態(tài)框架。
一種用于控制視頻擴(kuò)散模型運(yùn)動(dòng)模式的高效方法,支持運(yùn)動(dòng)模式的自定義和遷移。
將TikTok視頻轉(zhuǎn)化為簡(jiǎn)單易懂的食譜,提供食材、小貼士和分步指導(dǎo)。
VideoWorld是一個(gè)探索從無(wú)標(biāo)簽視頻中學(xué)習(xí)知識(shí)的深度生成模型。
專業(yè)的視頻口型同步工具,支持多語(yǔ)言和AI驅(qū)動(dòng)的音頻匹配技術(shù)。
使用簡(jiǎn)單的提示和圖像生成視頻片段。
快速輕松地從視頻中訓(xùn)練高質(zhì)量的LoRA模型
Lip Sync AI 是一款強(qiáng)大的 AI 動(dòng)畫(huà)生成工具,可快速創(chuàng)建逼真的口型同步動(dòng)畫(huà)。
SkyReels V1 是一個(gè)開(kāi)源的人類中心視頻基礎(chǔ)模型,專注于高質(zhì)量影視級(jí)視頻生成。
一個(gè)開(kāi)源SDK,用于在應(yīng)用中添加視頻故事和引導(dǎo)頁(yè),提升用戶參與度。
ComfyUI-WanVideoWrapper 是一個(gè)為 WanVideo 提供 ComfyUI 節(jié)點(diǎn)的工具。
這是一個(gè)基于HunyuanVideo模型的適配器,用于基于關(guān)鍵幀的視頻生成。
PSYCHE AI 是一款能夠快速生成逼真 AI 視頻的工具,提供多種高質(zhì)量 AI 角色和語(yǔ)音選擇。
Project Starlight 是一款基于 AI 的視頻增強(qiáng)工具,可將低分辨率和損壞的視頻提升為高清質(zhì)量。
MM_StoryAgent 是一個(gè)多智能體框架,用于生成沉浸式故事視頻。
OpenI AI助手在線工具硅基流動(dòng)豆包Trae扣子Coze即夢(mèng)繪蛙