AI工具

Bing Video Creator

Bing Video Creator 是微軟推出AI視頻生成工具。由OpenAI的Sora模型提供支持,能根據(jù)用戶輸入的文本描述快速生成視頻內(nèi)容。用戶只需在Bing移動應(yīng)用中輸入詳細(xì)...
閱讀原文

從容大模型

從容大模型是云從科技推出的多模態(tài)AI模型。模型在國際權(quán)威評測平臺OpenCompass的多模態(tài)榜單中以80.7分登頂,超越谷歌、OpenAI等頂尖團(tuán)隊(duì)。
閱讀原文

PPT.cn

PPT.cn 是基于 AI 技術(shù)的智能 PPT 制作平臺,幫助用戶快速、高效地生成高質(zhì)量的 PPT 演示文稿。用戶只需輸入主題或上傳相關(guān)文檔,平臺通過 AI 智能解析,快速...
閱讀原文

DeepEyes

DeepEyes 是小紅書團(tuán)隊(duì)和西安交通大學(xué)聯(lián)合推出的多模態(tài)深度思考模型?;诙说蕉藦?qiáng)化學(xué)習(xí),實(shí)現(xiàn)類似 OpenAI o3 的“用圖思考”能力,無需依賴監(jiān)督微調(diào)(SFT)。...
閱讀原文

Circuit Tracer

Circuit Tracer 是 Anthropic 推出的開源工具,用在研究大型語言模型的內(nèi)部工作機(jī)制。Circuit Tracer 基于生成歸因圖(attribution graphs)揭示模型在生成特...
閱讀原文

DGM

DGM(Darwin G?del Machine)是自改進(jìn)人工智能系統(tǒng),通過迭代修改自身代碼來提升性能。DGM從其維護(hù)的編碼代理檔案中選擇一個代理,基于基礎(chǔ)模型生成新版本,...
閱讀原文

Fairies

Fairies 是通用 AI Agent 智能助手,可提升個人和團(tuán)隊(duì)的生產(chǎn)力。具備強(qiáng)大的多任務(wù)執(zhí)行能力,可處理文件管理、代碼生成、郵件發(fā)送等 1000 多種操作。Fairies ...
閱讀原文

SignGemma

SignGemma 是谷歌 DeepMind 團(tuán)隊(duì)推出的全球最強(qiáng)大的手語翻譯AI模型。專注于將美國手語(ASL)翻譯成英語文本,通過多模態(tài)訓(xùn)練方法,結(jié)合視覺數(shù)據(jù)和文本數(shù)據(jù),...
閱讀原文

FLUX.1 Kontext

FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進(jìn)行生成與編輯,支持對象修改、風(fēng)格...
閱讀原文

MiMo-VL

MiMo-VL 是小米開源的多模態(tài)大模型,由視覺編碼器、跨模態(tài)投影層和語言模型構(gòu)成,視覺編碼器基于Qwen2.5-ViT,語言模型是小米自研的MiMo-7B。
閱讀原文

靈碼 IDE

靈碼 IDE是通義推出的AI原生IDE。用戶可以在通義靈碼官網(wǎng)免費(fèi)下載使用。IDE深度適配了最新的千問3大模型,全面集成了通義靈碼插件能力,具備編程智能體、行間...
閱讀原文

EVI 3

EVI 3是Hume AI推出的全新語音語言模型,模型能同時處理文本和語音標(biāo)記,實(shí)現(xiàn)自然、富有表現(xiàn)力的語音交互。模型支持高度個性化,根據(jù)用戶提示生成任何聲音和...
閱讀原文

OmniSync

OmniSync是中國人民大學(xué)、快手科技和清華大學(xué)聯(lián)合推出的通用對口型框架,基于擴(kuò)散變換器(Diffusion Transformers)實(shí)現(xiàn)視頻中人物口型與語音的精準(zhǔn)同步。Omn...
閱讀原文

Mobvoi MCP Server

Mobvoi MCP Server 是出門問問推出的一站式集成各項(xiàng) AI 能力的工具,Mobvoi MCP Server集成語音生成、聲音克隆、圖片驅(qū)動數(shù)字人、視頻配音等多項(xiàng)多模態(tài) AI 能...
閱讀原文

FLUX.1Kontext

FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進(jìn)行生成與編輯,支持對象修改、風(fēng)格...
閱讀原文
15152535455279