AI項目和框架

ComoRAG

ComoRAG 是華南理工大學未來技術學院、微信 AI 團隊等機構聯(lián)合推出的認知啟發(fā)式檢索增強生成(RAG)框架,專門用在長篇敘事文本的理解和推理。
閱讀原文

Grok 2.5

Grok 2.5 是埃隆·馬斯克旗下 xAI 公司開源的人工智能模型。模型文件可在 Hugging Face 下載,包含 42 個文件,總大小約 500GB,需 8 張顯存超 40GB 的 GPU 才...
閱讀原文

Fun-ASR

Fun-ASR 是釘釘與通義實驗室語音團隊聯(lián)合推出的新一代語音識別大模型。經(jīng)過海量音頻數(shù)據(jù)訓練,能精準識別互聯(lián)網(wǎng)、科技、家裝、畜牧等十多個行業(yè)的專業(yè)術語,...
閱讀原文

Intern-S1-mini

Intern-S1-mini是上海人工智能實驗室推出的輕量級開源多模態(tài)推理模型。基于與 Intern-S1 相同的技術構建。模型融合 8B 密集語言模型(Qwen3)和 0.3B 視覺編...
閱讀原文

Seed-OSS

Seed-OSS 是字節(jié)跳動 Seed 團隊開源的系列大型語言模型,專注于長文本處理、推理和智能代理能力。模型包含多個版本,如 Seed-OSS-36B-Base 和 Seed-OSS-36B-I...
閱讀原文

AutoCodeBench

AutoCodeBench 是騰訊混元推出的專門測評大模型代碼能力基準測試集,包含 3920 個問題,均勻分布在 20 種編程語言中。數(shù)據(jù)集具有高難度、實用性和多樣性,能...
閱讀原文

NVIDIA Nemotron Nano 2

NVIDIA Nemotron Nano 2 是英偉達推出的高效推理模型,參數(shù)量為9B。模型基于混合Mamba-Transformer架構,在20萬億個token上預訓練,支持128k上下文長度。
閱讀原文

CombatVLA

CombatVLA 是淘天集團未來生活實驗室團隊推出的專為3D動作角色扮演游戲(ARPG)中的戰(zhàn)斗任務設計的高效視覺-語言-動作(VLA)模型。模型基于3B參數(shù)規(guī)模,通過...
閱讀原文

Klear-Reasoner

Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,專注于提升數(shù)學和代碼推理能力。模型通過長思維鏈監(jiān)督微調(diào)(long CoT SFT)和強化學習(RL)訓...
閱讀原文

Nano Banana

Nano Banana 是 AI 圖像編輯模型,目前僅在 LMArena 網(wǎng)站上隨機出現(xiàn)。模型因極高的人物一致性著稱,能精準還原人物的面部特征和表情,同時在背景替換和風格轉(zhuǎn)...
閱讀原文

Matrix-Game 2.0

Matrix-Game 2.0 是昆侖萬維 SkyWork AI 發(fā)布的自研世界模型。是業(yè)內(nèi)首個開源的通用場景實時長序列交互式生成模型,全面開源,推動交互式世界模型領域的發(fā)展...
閱讀原文

RynnVLA-001

RynnVLA-001 是阿里達摩院推出的視覺-語言-動作模型。模型通過在大量第一人稱視角的視頻上進行預訓練,學習人類操作技能,并隱式遷移到機器人手臂的操控中。
閱讀原文

RynnRCP

RynnRCP 是阿里達摩院開源的機器人上下文協(xié)議(Robotics Context Protocol),能打通具身智能開發(fā)全流程。RynnRCP 包含 RCP 框架 和 RobotMotion 兩大模塊,...
閱讀原文

RynnEC

RynnEC是阿里巴巴達摩院推出的世界理解模型 (MLLM),專門用在具身認知任務。模型能從位置、功能、數(shù)量等11個維度全面解析場景中的物體,支持物體理解、空間...
閱讀原文

GLM-4.5V

GLM-4.5V是智譜開源的最新一代視覺推理模型。模型基于106B參數(shù)規(guī)模構建,擁有12B激活能力,是目前領先的視覺語言模型(VLM)。模型在GLM-4.1V-Thinking的基礎...
閱讀原文