標簽:文本生成

GLM-Z1-Rumination

GLM-Z1-Rumination 是智譜公司推出的沉思模型,基于 GLM-Z1 進一步優化而成。GLM-Z1-Rumination基于擴展強化學習訓練,提升模型結合工具使用完成長程推理的能...
閱讀原文

DistilQwen2.5-R1

DistilQwen2.5-R1 是阿里巴巴推出的基于知識蒸餾技術的小型化系列深度推理模型,包含3B、7B、14B和32B四個參數量級的模型。DistilQwen2.5-R1將超大規模模型(...
閱讀原文

Entie

Entie 是專為情侶設計的關系助手應用。基于AI技術和科學支持的見解,為情侶提供個性化建議,幫助減少沖突、增進情感連接。應用包含情侶健康評分、情感追蹤等...
閱讀原文

LangManus

LangManus 是 AI 自動化框架,基于分層多智能體系統設計。包含多種智能體,如協調員、規劃員、研究員、程序員等,各司其職,協同完成復雜任務。框架支持多種...
閱讀原文

Mistral Small 3.1

Mistral Small 3.1 是 Mistral AI 開源的多模態人工智能模型,有 240 億參數,基于 Apache 2.0 許可證發布。在文本和多模態任務上表現出色,支持長達 128k to...
閱讀原文

文心大模型4.5

文心大模型4.5是百度正式發布的最新一代首個原生多模態大模型,在多模態理解、文本和邏輯推理等方面有顯著提升,多項測試表現優于GPT4.5。模型已上線百度智能...
閱讀原文

文心大模型X1

文心大模型X1是百度推出的深度思考模型。具備“長思維鏈”,擅長中文知識問答、文學創作、邏輯推理等。X1增加了多模態能力,能理解和生成圖片,能調用工具生成...
閱讀原文

Responses API

Responses API 是 OpenAI 推出的用在構建 AI Agents 的核心接口,Responses API是 Chat Completions API 的升級版,結合 Assistants API 的工具調用能力,支...
閱讀原文

GO-1

GO-1(Genie Operator-1,智元啟元大模型)是智元機器人推出的首個通用具身基座模型。模型采用Vision-Language-Latent-Action(ViLLA)架構,由VLM(多模態大...
閱讀原文

Tanka

Tanka 是具有長期記憶功能的 AI 智能通訊工具,專為團隊協作設計。Tanka基于記憶過去的對話和業務上下文,提供智能回復、總結要點、設置提醒等服務,幫助團隊...
閱讀原文

SepLLM

SepLLM是香港大學、華為諾亞方舟實驗室等機構聯合提出的用于加速大語言模型(LLM)的高效框架,通過壓縮段落信息并消除冗余標記,顯著提高了模型的推理速度和...
閱讀原文

TinyR1-Preview

TinyR1-Preview是北京大學計算機學院與360公司聯合推出的32B參數量的推理模型。模型僅用5%的參數量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在數學領域...
閱讀原文

VLM-R1

VLM-R1 是 Om AI Lab 推出的基于強化學習技術的視覺語言模型,通過自然語言指令精確定位圖像中的目標物體,如根據描述“圖中紅色的杯子”找到對應的圖像區域。...
閱讀原文

Moonlight-16B-A3B

Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 億總參數和 30 億激活參數。模型使用了優化后的 Muon 優化器進行訓練...
閱讀原文

Mistral Saba

Mistral Saba 是法國 Mistral AI 推出的專注于中東和南亞地區語言及文化的區域定制 AI 模型。模型擁有 240 億參數,規模雖小,在處理阿拉伯語和印度起源語言...
閱讀原文
123410