標簽:文本生成
GLM-Z1-Rumination
GLM-Z1-Rumination 是智譜公司推出的沉思模型,基于 GLM-Z1 進一步優化而成。GLM-Z1-Rumination基于擴展強化學習訓練,提升模型結合工具使用完成長程推理的能...
DistilQwen2.5-R1
DistilQwen2.5-R1 是阿里巴巴推出的基于知識蒸餾技術的小型化系列深度推理模型,包含3B、7B、14B和32B四個參數量級的模型。DistilQwen2.5-R1將超大規模模型(...
Mistral Small 3.1
Mistral Small 3.1 是 Mistral AI 開源的多模態人工智能模型,有 240 億參數,基于 Apache 2.0 許可證發布。在文本和多模態任務上表現出色,支持長達 128k to...
Responses API
Responses API 是 OpenAI 推出的用在構建 AI Agents 的核心接口,Responses API是 Chat Completions API 的升級版,結合 Assistants API 的工具調用能力,支...
TinyR1-Preview
TinyR1-Preview是北京大學計算機學院與360公司聯合推出的32B參數量的推理模型。模型僅用5%的參數量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在數學領域...
Moonlight-16B-A3B
Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 億總參數和 30 億激活參數。模型使用了優化后的 Muon 優化器進行訓練...
Mistral Saba
Mistral Saba 是法國 Mistral AI 推出的專注于中東和南亞地區語言及文化的區域定制 AI 模型。模型擁有 240 億參數,規模雖小,在處理阿拉伯語和印度起源語言...