AI工具

ContentV

ContentV是字節跳動開源的80億參數文生視頻模型框架。將Stable Diffusion 3.5 Large的2D-VAE替換為3D-VAE并引入3D位置編碼,使圖像模型快速獲得視頻生成能力。
閱讀原文

PartCrafter

PartCrafter 是先進的3D生成模型,能從單張RGB圖像中生成多個語義明確且幾何形態各異的3D網格。通過組合潛在空間表示每個3D部件,使用層次化注意力機制在部件...
閱讀原文

MaskSearch

MaskSearch是阿里巴巴通義實驗室推出的新型通用預訓練框架,提升大型語言模型(LLM)的智能體搜索能力。通過檢索增強掩碼預測(RAMP)任務,讓模型在輸入文本...
閱讀原文

MAS-Zero

MAS-Zero是 Salesforce 推出的多智能體系統(MAS)設計框架,能在無需人類監督的情況下自動設計和優化MAS。框架基于元級設計,在推理時動態地對每個問題實例...
閱讀原文

MultiTalk

MultiTalk 是中山大學深圳校區、美團和香港科技大學聯合推出的新型音頻驅動多人對話視頻生成框架。框架根據多聲道音頻輸入、參考圖像和文本提示,生成包含人...
閱讀原文

靈語文檔

靈語文檔(MindLink)是AI驅動的云文檔編輯平臺,為企業提供一站式文檔編輯和共享服務。平臺具備多組態支持,包括思維導圖、原型白板、可視化圖表等功能,支...
閱讀原文

Time-R1

Time-R1是伊利諾伊大學香檳分校研究團隊開發的基于3B參數的語言模型,通過獨特的三階段強化學習訓練方法,在時間推理能力上取得了顯著突破。
閱讀原文

MiniMax-Remover

MiniMax-Remover 是新型的視頻目標移除方法,解決現有技術中常見的幻覺物體、視覺偽影以及推理速度緩慢等問題。采用兩階段方法:第一階段基于簡化版的 DiT 架...
閱讀原文

智譜CoCo

智譜CoCo是智譜AICO平臺推出的首個企業級超級助手Agent,具備交付導向、記憶機制和無縫嵌入三大企業級特性。智譜CoCo能全流程輔助工作,根據員工職能和需求主...
閱讀原文

MonkeyOCR

MonkeyOCR 是華中科技大學聯合金山辦公(Kingsoft Office)推出的文檔解析模型,模型支持高效地將非結構化文檔內容轉換為結構化信息。基于精確的布局分析、內...
閱讀原文

Playmate

Playmate是廣州趣丸科技團隊推出的人臉動畫生成框架。框架基于3D隱式空間引導擴散模型,用雙階段訓練框架,根據音頻和指令精準控制人物的表情和頭部姿態,生...
閱讀原文

Lillian

Lillian是Scrumball團隊推出的AI網紅營銷助手,基于AI技術為品牌提供高效、精準的網紅合作解決方案。Lillian能在短時間內完成網紅發現、分析與管理,解決傳統...
閱讀原文

dots.llm1

dots.llm1 是小紅書 hi lab 開源的中等規模 Mixture of Experts(MoE)文本大模型,具有 1420 億參數,激活參數為 140 億。模型在 11.2T 高質量 token 數據上...
閱讀原文

美亞影擎

美亞影擎是美亞光電聯合影擎推出的口腔影像智能體。美亞影擎集成先進的成像技術和智能算法,為口腔醫生提供高清晰度的口腔影像,幫助更精準地診斷口腔疾病。
閱讀原文

建筑學長

建筑學長是專為建筑師及相關專業人員打造的資源庫和AI繪圖創作平臺。提供了一系列強大的AI工具,如AI繪圖創作、AI圖轉三維模型、AI圖轉視頻高級版、AI消除工...
閱讀原文
14849505152279