用于理解任意視頻中的相機(jī)運動的工具。
一款具有 17 億參數(shù)的開源圖像生成基礎(chǔ)模型。
提供高級 AI 聊天體驗,完全私密。
SkyReels V1 是一個開源的人類中心視頻基礎(chǔ)模型,專注于高質(zhì)量影視級視頻生成。
HunyuanVideo-I2V 是騰訊推出的基于 HunyuanVideo 的圖像到視頻生成框架。
Llasa-3B 是一個基于 LLaMA 的文本到語音合成模型,支持中英文語音生成。
Llasa-1B 是一個基于 LLaMA 的文本轉(zhuǎn)語音 (TTS) 模型,支持中英文語音合成。
一個基于強(qiáng)化學(xué)習(xí)優(yōu)化的大型語言模型,專注于數(shù)學(xué)問題解決能力的提升。
Wan2.1-T2V-14B 是一款高性能的文本到視頻生成模型,支持多種視頻生成任務(wù)。
CSM 1B 是一個由 Sesame 開發(fā)的文本到語音生成模型,可生成高質(zhì)量的音頻。
提供深度思考推理能力的開源人工智能大模型DeepSeek AI深度推理官網(wǎng)入口網(wǎng)址
將靜態(tài)圖像一鍵轉(zhuǎn)換為高質(zhì)量、語義準(zhǔn)確、時空連續(xù)的動態(tài)視頻。
一個開源的視頻生成模型,用于創(chuàng)造生動的視頻內(nèi)容。
ComfyUI中集成的最新視頻生成模型
一個擁有8200萬參數(shù)的前沿文本到語音(TTS)模型。
Qwen2.5-Coder系列的3B參數(shù)指令調(diào)優(yōu)模型
Qwen2.5-Coder系列中的1.5B參數(shù)代碼生成模型
Qwen2.5-Coder系列中的3B參數(shù)指令調(diào)優(yōu)模型
Qwen2.5-Coder系列中的3B參數(shù)量指令調(diào)優(yōu)模型
Qwen2.5-Coder系列中的1.5B參數(shù)量級代碼生成模型
高性能英文對話生成模型
開源視頻生成模型,支持10秒視頻和更高分辨率。
開源代碼生成語言模型
領(lǐng)先的指令遵循模型家族,提供開源數(shù)據(jù)、代碼和指南。
領(lǐng)先的指令遵循模型家族,提供開源數(shù)據(jù)、代碼和配方。
文本圖像到視頻生成模型
一款經(jīng)過優(yōu)化的大型語言模型,擅長文本生成和對話。
開源幻覺評估模型
一個專為AI創(chuàng)作者打造的趣玩社區(qū),提供多種AI模型和創(chuàng)作工具,支持用戶進(jìn)行插畫、動漫、寫實等多種風(fēng)格的圖像創(chuàng)作。魔多AI官網(wǎng)入口網(wǎng)址
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙