標簽:智能助手

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是英偉達推出的開源自動語音識別(ASR)模型。采用FastConformer編碼器和TDT解碼器架構,通過預測文本標記及其持續時間加速推理,減少計算...
閱讀原文

Agent Development Kit

Agent Development Kit(ADK)是谷歌開源的首個AI智能體開發工具包,是一個代碼優先的Python工具包,簡化復雜AI代理的構建、評估和部署過程。ADK支持多智能體...
閱讀原文

ACTalker

ACTalker 是用于生成逼真說話人頭部視頻的端到端視頻擴散框架。支持單信號或多信號控制,如音頻、表情等。核心架構包括并行 Mamba 結構,通過多個分支利用不...
閱讀原文

Augment Agent

Augment Agent 是Augment推出的AI編程助手,幫助軟件工程師高效編寫高質量代碼。Augment Agent能深度理解大型代碼庫,隨著用戶工作自動學習和適應代碼風格。
閱讀原文

OThink-MR1

OThink-MR1是OPPO研究院和香港科技大學(廣州)聯合推出的多模態語言模型優化框架。基于動態調整Kullback-Leibler(KL)散度策略(GRPO-D)和獎勵模型,提升...
閱讀原文

MCP.so

MCP.so 是MCP資源平臺,專注于收集和整理第三方 MCP(Model Context Protocol)服務器。MCP.so將資源分為三類,MCP Servers(目前有2995個)、MCP Clients,...
閱讀原文

AndroidGen

AndroidGen 是智譜技術團隊推出增強基于大語言模型(LLM)的 Agent 能力的框架,特別是在數據稀缺的情況下。框架通過收集人類任務軌跡基于這些軌跡訓練語言模...
閱讀原文

LHM

LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通義實驗室推出的從單張圖像重建可動畫化3D人體模型。基于多模態Transformer架構,融合3D幾何...

GEN3C

GEN3C 是NVIDIA、多倫多大學和向量研究所推出的新型生成式視頻模型,基于精確的相機控制和時空一致性生成高質量的 3D 視頻內容。GEN3C構建基于點云的 3D 緩存...
閱讀原文

AgiBot Digital World

AgiBot Digital World 是智元機器人推出的高保真機器人仿真框架,為機器人操作技能研究與應用提供高效支持。AgiBot Digital World集成海量逼真的三維資產、多...
閱讀原文

AgentRefine

AgentRefine 是北京郵電大學和美團聯合提出的智能體合成框架,通過“精煉調整”(Refinement Tuning)提升基于大型語言模型(LLM)的智能體在多樣化任務中的泛...
閱讀原文

Aider

Aider 是開源的AI輔助編程工具,基于終端與大型語言模型(LLM)配合,實現高效代碼編輯和開發。Aider支持多種編程語言,如 Python、JavaScript、TypeScript ...
閱讀原文

華為小藝

華為小藝是華為推出的小藝AI助手網頁端,用戶可以通過瀏覽器直接訪問使用。適配了手機和PC布局,提供多種功能,包括AI問答、AI寫作、編程助手和AI翻譯等。小...
閱讀原文

LIMO

LIMO(Less Is More for Reasoning)是上海交通大學研究團隊提出的高效推理方法,通過極少量高質量的訓練樣本激活大語言模型(LLM)的復雜推理能力。核心假設...
閱讀原文

Loora

Loora 是先進的 AI 英語輔導應用,能幫助用戶提高英語口語能力。基于模擬各種真實場景的對話,讓用戶在商務、面試、日常交流等情境中練習英語。Loora 能實時...
閱讀原文