AI工具

GPT-5-Codex

GPT-5-Codex 是 OpenAI 推出的專為編程優(yōu)化的模型,基于 GPT-5 進一步強化。模型聚焦于真實世界的軟件工程任務,如從零搭建項目、代碼重構、調試、測試和代碼...
閱讀原文

ROMA

ROMA(Recursive Open Meta-Agent) 是Sentient AGI團隊開源的多Agent系統(tǒng)框架,通過遞歸層次結構將復雜任務拆解為可并行的子任務,由父節(jié)點分配給子節(jié)點執(zhí)行...
閱讀原文

Grok 4 Fast

Grok 4 Fast是xAI推出的快速版人工智能模型,最大的特點是響應速度快,最高可達標準版的10倍,生成速度每秒75個token,能快速完成簡單查詢、基礎代碼生成等任...
閱讀原文

Mini-o3

Mini-o3 是字節(jié)跳動和香港大學聯(lián)合推出的開源模型,專為解決復雜的視覺搜索問題而設計。模型通過強化學習和基于圖像的工具,能執(zhí)行深度多輪推理,推理輪次可...
閱讀原文

ERNIE-4.5-21B-A3B-Thinking

ERNIE-4.5-21B-A3B-Thinking 是百度推出的專注于推理任務的大型語言模型。采用混合專家(MoE)架構,總參數(shù)量達210億,每個token激活30億參數(shù),支持128K的長...
閱讀原文

FunAudio-ASR

FunAudio-ASR 是阿里巴巴達摩院推出的端到端語音識別大模型,專為解決企業(yè)落地中的關鍵問題設計。通過創(chuàng)新的 Context 增強模塊,有效優(yōu)化了“幻覺”和“串語種”...
閱讀原文

xiaohongshu-mcp

xiaohongshu-mcp是基于 Model Context Protocol (MCP) 協(xié)議開發(fā)的開源工具,幫助用戶實現(xiàn)小紅書平臺的自動化操作。支持多種功能,包括登錄小紅書、發(fā)布圖文、...
閱讀原文

YouStory

YouStory是智能AI故事書平臺,基于人工智能技術為家庭創(chuàng)造獨特的成長故事。用戶可以通過上傳孩子的照片、寵物、繪畫、涂鴉或喜歡的玩具來讓它們成為故事的主...
閱讀原文

ZipVoice

ZipVoice 是小米集團 AI 實驗室發(fā)布的高效零樣本語音合成(TTS)模型。模型基于 Flow Matching 架構,包含 ZipVoice(單說話人)和 ZipVoice-Dialog(對話語...
閱讀原文

PP-OCRv5

PP-OCRv5 是百度推出的高效、精準的文字識別模型。模型基于兩階段處理流程,專門用在快速、準確地檢測和識別圖像中的文字。
閱讀原文

Stable Audio 2.5

Stable Audio 2.5 是 Stability AI 推出的最新音頻生成模型,專為企業(yè)級聲音制作設計。模型具備快速生成(三分鐘音頻僅需兩秒)、動態(tài)音樂創(chuàng)作和音頻修復功能。
閱讀原文

Live Interpreter API

Live Interpreter API 是 Azure 語音翻譯的新功能,能實現(xiàn)實時的多語言語音翻譯。無需用戶手動設置輸入語言, Live Interpreter API 能自動連續(xù)識別正在使用...
閱讀原文

veCLI

veCLI 是字節(jié)跳動火山引擎推出的命令行 AI 工具,提升開發(fā)效率。無縫集成豆包大模型 1.6 等多種模型,開發(fā)者可通過自然語言交互,快速生成代碼并完成本地部署...
閱讀原文

MobileLLM-R1

MobileLLM-R1是Meta推出的一系列專為數(shù)學、編程和科學推理設計的高效推理模型。系列包含基礎模型和最終模型,分別有1.4億、3.6億和9.5億參數(shù)版本。模型并非通...
閱讀原文

Oboe

Oboe 是 Spotify 前高管創(chuàng)立的 AI 驅動的個性化學習平臺。用戶只需輸入一個關鍵詞或主題,Oboe 能在幾秒鐘內生成一門量身定制的課程,涵蓋科學、歷史、外語、...
閱讀原文
11213141516278