AI工具

VLAC

VLAC是上海人工智能實(shí)驗(yàn)室發(fā)布的具身獎(jiǎng)勵(lì)大模型。以InternVL多模態(tài)大模型為基礎(chǔ),融合互聯(lián)網(wǎng)視頻數(shù)據(jù)和機(jī)器人操作數(shù)據(jù),為機(jī)器人在真實(shí)世界中的強(qiáng)化學(xué)習(xí)提供...
閱讀原文

Orchids

Orchids 是全球首款具備全棧開(kāi)發(fā)能力的 AI 工具,能實(shí)現(xiàn)從前端到后端的全流程開(kāi)發(fā)。工具在 UI 設(shè)計(jì)和全棧開(kāi)發(fā)性能上表現(xiàn)卓越,超越多個(gè)主流競(jìng)品,如 Lovable...
閱讀原文

RustGPT

RustGPT 是用 Rust 編寫(xiě)的 Transformer 架構(gòu)語(yǔ)言模型。RustGPT從零開(kāi)始構(gòu)建,不依賴任何外部機(jī)器學(xué)習(xí)框架,僅用 ndarray 進(jìn)行矩陣運(yùn)算。
閱讀原文

PromptEnhancer

PromptEnhancer是騰訊混元團(tuán)隊(duì)開(kāi)源的用在提升文本到圖像(T2I)模型的提示重寫(xiě)框架,通過(guò)思維鏈(Chain-of-Thought,CoT)提示重寫(xiě)和專用的獎(jiǎng)勵(lì)模型AlignEval...
閱讀原文

MasterGo Agent

MasterGo Agent是MasterGo AI推出的全球首個(gè)數(shù)字界面生產(chǎn)級(jí)AI Agent,支持基于設(shè)計(jì)系統(tǒng)(DSM)的文生UI,能調(diào)用團(tuán)隊(duì)已有設(shè)計(jì)規(guī)范,實(shí)現(xiàn)高效協(xié)作和生產(chǎn)。
閱讀原文

Nano Bananary

Nano Bananary(香蕉超市) 是開(kāi)源的圖像編輯工具,基于 Google Gemini 圖像模型開(kāi)發(fā),支持中文界面和明暗主題切換,提供 50 多種圖像轉(zhuǎn)換效果,無(wú)需復(fù)雜提示...
閱讀原文

數(shù)說(shuō)Social Research

數(shù)說(shuō)Social Research 是數(shù)說(shuō)故事旗下的全能營(yíng)銷 Agent 工具,依托領(lǐng)先大模型技術(shù),接入海量社交媒體數(shù)據(jù),能快速解答營(yíng)銷、市場(chǎng)、消費(fèi)者口碑等專業(yè)問(wèn)題并生成...
閱讀原文

Evoker

Evoker 是一站式 AI 創(chuàng)作平臺(tái),激發(fā)創(chuàng)意靈感并加速創(chuàng)作過(guò)程。支持文本、圖像和視頻生成,提供多模態(tài)創(chuàng)作體驗(yàn)。用戶可以在一個(gè)聊天框中輕松創(chuàng)作和完善作品,平...
閱讀原文

InfiniteTalk

InfiniteTalk是美團(tuán)視覺(jué)智能部推出的新型數(shù)字人驅(qū)動(dòng)技術(shù),通過(guò)稀疏幀video dubbing范式,僅需少量關(guān)鍵幀能驅(qū)動(dòng)數(shù)字人人生成自然流暢的視頻,解決傳統(tǒng)技術(shù)中口...
閱讀原文

LLaSO

LLaSO(Large Language and Speech Model)是北京深度邏輯智能科技有限公司推出的全球首個(gè)完全開(kāi)源的語(yǔ)音模型,能解決大型語(yǔ)音語(yǔ)言模型(LSLM)領(lǐng)域長(zhǎng)期存在...
閱讀原文

混元3D 3.0

混元3D 3.0是騰訊最新發(fā)布的先進(jìn)的3D生成模型。采用了首創(chuàng)的3D-DiT分級(jí)雕刻技術(shù),能生成超高清的3D幾何結(jié)構(gòu),建模精度提升3倍,幾何分辨率高達(dá)15363,支持36...
閱讀原文

Lumina-DiMOO

Lumina-DiMOO是上海人工智能實(shí)驗(yàn)室等機(jī)構(gòu)開(kāi)源的新一代多模態(tài)生成與理解模型。模型采用全離散擴(kuò)散架構(gòu),統(tǒng)一處理文本、圖像等多模態(tài)數(shù)據(jù),支持文本到圖像生成...
閱讀原文

UnifoLM-WMA-0

UnifoLM-WMA-0 是宇樹(shù)科技開(kāi)源的跨多類機(jī)器人本體的世界模型 - 動(dòng)作架構(gòu),專為通用機(jī)器人學(xué)習(xí)設(shè)計(jì)。核心是世界模型,能理解機(jī)器人與環(huán)境的物理交互,具備仿真...
閱讀原文

GPT-5-Codex

GPT-5-Codex 是 OpenAI 推出的專為編程優(yōu)化的模型,基于 GPT-5 進(jìn)一步強(qiáng)化。模型聚焦于真實(shí)世界的軟件工程任務(wù),如從零搭建項(xiàng)目、代碼重構(gòu)、調(diào)試、測(cè)試和代碼...
閱讀原文

ROMA

ROMA(Recursive Open Meta-Agent) 是Sentient AGI團(tuán)隊(duì)開(kāi)源的多Agent系統(tǒng)框架,通過(guò)遞歸層次結(jié)構(gòu)將復(fù)雜任務(wù)拆解為可并行的子任務(wù),由父節(jié)點(diǎn)分配給子節(jié)點(diǎn)執(zhí)行...
閱讀原文
11112131415278