AI工具
PromptEnhancer
PromptEnhancer是騰訊混元團(tuán)隊(duì)開(kāi)源的用在提升文本到圖像(T2I)模型的提示重寫(xiě)框架,通過(guò)思維鏈(Chain-of-Thought,CoT)提示重寫(xiě)和專用的獎(jiǎng)勵(lì)模型AlignEval...
MasterGo Agent
MasterGo Agent是MasterGo AI推出的全球首個(gè)數(shù)字界面生產(chǎn)級(jí)AI Agent,支持基于設(shè)計(jì)系統(tǒng)(DSM)的文生UI,能調(diào)用團(tuán)隊(duì)已有設(shè)計(jì)規(guī)范,實(shí)現(xiàn)高效協(xié)作和生產(chǎn)。
Nano Bananary
Nano Bananary(香蕉超市) 是開(kāi)源的圖像編輯工具,基于 Google Gemini 圖像模型開(kāi)發(fā),支持中文界面和明暗主題切換,提供 50 多種圖像轉(zhuǎn)換效果,無(wú)需復(fù)雜提示...
數(shù)說(shuō)Social Research
數(shù)說(shuō)Social Research 是數(shù)說(shuō)故事旗下的全能營(yíng)銷 Agent 工具,依托領(lǐng)先大模型技術(shù),接入海量社交媒體數(shù)據(jù),能快速解答營(yíng)銷、市場(chǎng)、消費(fèi)者口碑等專業(yè)問(wèn)題并生成...
InfiniteTalk
InfiniteTalk是美團(tuán)視覺(jué)智能部推出的新型數(shù)字人驅(qū)動(dòng)技術(shù),通過(guò)稀疏幀video dubbing范式,僅需少量關(guān)鍵幀能驅(qū)動(dòng)數(shù)字人人生成自然流暢的視頻,解決傳統(tǒng)技術(shù)中口...
Lumina-DiMOO
Lumina-DiMOO是上海人工智能實(shí)驗(yàn)室等機(jī)構(gòu)開(kāi)源的新一代多模態(tài)生成與理解模型。模型采用全離散擴(kuò)散架構(gòu),統(tǒng)一處理文本、圖像等多模態(tài)數(shù)據(jù),支持文本到圖像生成...
UnifoLM-WMA-0
UnifoLM-WMA-0 是宇樹(shù)科技開(kāi)源的跨多類機(jī)器人本體的世界模型 - 動(dòng)作架構(gòu),專為通用機(jī)器人學(xué)習(xí)設(shè)計(jì)。核心是世界模型,能理解機(jī)器人與環(huán)境的物理交互,具備仿真...
GPT-5-Codex
GPT-5-Codex 是 OpenAI 推出的專為編程優(yōu)化的模型,基于 GPT-5 進(jìn)一步強(qiáng)化。模型聚焦于真實(shí)世界的軟件工程任務(wù),如從零搭建項(xiàng)目、代碼重構(gòu)、調(diào)試、測(cè)試和代碼...