為LTX視頻模型提供額外控制的ComfyUI節點集合
視頻處理界面,提供視頻編碼和解碼功能
開放高效的視頻水印技術
AI數字人口型同步技術,無限多開貼牌OEM解決方案
一站式AI數字人系統,支持視頻合成、聲音合成、聲音克隆。
領先的文本到語音轉換模型
大規模多語種語音生成數據集
300行代碼實現基于LLM的語音轉錄。
與任何大型語言模型進行快速的免提語音交互。
與大型語言模型進行自然的語音對話
個性化AI助手,記錄每一刻,與AI對話獲取反饋。
極速語音識別,精準時間戳
開源的語音識別和說話人分割模型推理代碼
一款文本轉語音工具,幫助您輕松閱讀文本。
Android平臺上的私有、設備端語音識別鍵盤和文字服務
統一的開放命名實體和語音識別模型
開源AI語音處理工具包,支持語音增強、分離和目標說話人提取。
實時瀏覽器端語音識別應用
開源、注重隱私的語音助手
自動語音識別工具,提供詞級時間戳和說話人識別
AI語音代理測試與可觀測性平臺
基于PyTorch的生成式音頻模型庫
一個開源的GUI音頻書和配音生成器。
ComfyUI節點,用于MMAudio模型的音頻處理
使用API調用suno.ai的音樂生成AI,并輕松集成到GPT等代理中。
開源項目,實現AI音樂服務的API接口
音頻采樣器,創造音樂節奏
一鍵生成海量模板,支持SaaS多開的全開源系統
開源自主軟件開發系統
開源大型語言模型工具集合
利用AI生成的Next.js開源應用模板。
全棧開源機器人
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙