一鍵將視頻和音頻轉化為各種風格的文檔。
開源視頻生成模型,支持多種生成任務。
一個簡單易用的語音克隆和語音模型訓練工具。
輕松將現有代理框架中的工具、代理和調度器轉換為 MCP 服務器。
Pusa 是一個新穎的視頻擴散模型,支持多種視頻生成任務。
一個開放源代碼的 14B 參數編程模型,具備高效的代碼推理能力。
復旦大學發布MOSS大模型開源項目,包含核心代碼和模型權重。
一個強大的文本生成模型,適用于多種對話應用。
通過強化學習驅動的金融推理大模型。
生成高質量 SVG 代碼的基礎模型。
百川智能開發的專為醫療場景優化的開源大語言模型,具備卓越的通用能力和醫療領域性能。
一款幫助用戶整理房間的趣味提醒應用
一種通過文本迷宮解決任務來增強大型語言模型視覺推理能力的創新方法
一個從URL、YouTube視頻或文本提示生成交互式思維導圖的Web應用。
一款開源的14B參數量的數學模型,通過強化學習訓練,性能卓越。
一個開源文本轉語音系統,致力于實現人類語音的自然化。
Gen AI Toolbox for Databases 是一個開源服務器,用于簡化與數據庫交互的 Gen AI 工具的開發。
TableGPT2-7B 是一款專注于表格數據處理的大語言模型,適用于數據分析和商業智能任務。
NeoBase 是一款開源的 AI 數據庫助手,讓你用自然語言與數據庫交互。
一個用于從文本和圖像中提取結構化數據的代理API,基于LLMs實現。
Steiner 是一個基于合成數據訓練的推理模型,旨在探索多種推理路徑并自主驗證。
On-device Sora 是一個基于擴散模型的移動設備端文本到視頻生成項目。
FilmAgent是一個基于LLM的多智能體協作框架,用于虛擬3D空間中的端到端電影自動化制作。
EasyWeb是一個用于構建和部署與瀏覽器交互的AI代理的開放平臺。
CocoIndex 是一個開源的數據索引引擎,支持自定義轉換邏輯和增量更新。
一個開源項目,用于在瀏覽器中演示 AI 視頻生成模型。
一種用于控制視頻擴散模型運動模式的高效方法,支持運動模式的自定義和遷移。
SkyReels V1 是一個開源的人類中心視頻基礎模型,專注于高質量影視級視頻生成。
將電子書轉換為有聲書的工具。
基于Kokoro和ONNX運行時的文本到語音(TTS)項目。
首個面向語境智能的人類級實時交互系統,支持多情感、多風格語音交互。
開源工業級自動語音識別模型,支持普通話、方言和英語,性能卓越。
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙