AI工具

3DV-TON

3DV-TON(Textured 3D-Guided Consistent Video Try-on via Diffusion Models)是阿里巴巴達摩院、湖畔實驗室和浙江大學聯合推出的基于擴散模型的視頻虛擬試...
閱讀原文

ACE-Step

ACE-Step 是 ACE Studio 和 StepFun 聯合推出的開源音樂生成基礎模型,基于創新的架構設計實現高效、連貫且可控的音樂創作。ACE-Step結合擴散模型、深度壓縮...
閱讀原文

ReasonIR-8B

ReasonIR-8B 是 Meta AI 推出的專為推理密集型檢索任務設計的模型?;?LLaMA3.1-8B 訓練,采用雙編碼器架構,將查詢和文檔分別編碼為嵌入向量,通過余弦相...
閱讀原文

Omni Reference

Omni Reference 是 Midjourney 推出的全能參考功能,支持用戶將特定的人物、物體或場景從參考圖像中嵌入到生成的圖像中。Omni Reference 適用于Midjourney V7...
閱讀原文

Pixelfox

Pixelfox 是免費的在線圖片編輯工具,基于AI技術簡化圖片編輯過程。Pixelfox 提供多種功能,如背景移除、對象移除、圖片增強、AI 修復、換臉、圖片擴展和圖像...
閱讀原文

ChatWise

ChatWise 是高性能的 AI 聊天工具,支持多種語言模型(LLM),如 GPT-4、Claude 和 Gemini 等。ChatWise基于簡潔易用的設計理念為核心,提供多模態交互功能,...
閱讀原文

Cobra

Cobra(Efficient Line Art COlorization with BRoAder References)是清華大學、香港中文大學和騰訊ARC實驗室推出的漫畫線稿上色框架,專為高精度、高效率和...
閱讀原文

KeySync

KeySync 是帝國理工學院和弗羅茨瓦夫大學推出的用在高分辨率口型同步框架,支持將輸入音頻與視頻中的口型動作對齊。KeySync 基于兩階段框架實現,首先生成關...
閱讀原文

HoloTime

HoloTime 是北京大學深圳研究生院和鵬城實驗室推出的全景 4D 場景生成框架,基于視頻擴散模型將單張全景圖像轉化為具有真實動態效果的全景視頻,進一步重建為...
閱讀原文

Hula

Hula 是 Prequel Inc. 推出的 AI 視頻生成工具,通過簡單操作將用戶的靜態照片或視頻轉換為創意內容。用戶可以通過上傳照片,變成動態視頻,例如模擬在巴黎漫...
閱讀原文

T2I-R1

T2I-R1 是香港中文大學和上海AI Lab聯合推出的新型文本生成圖像模型?;谝腚p層推理機制,語義級鏈式思維(CoT)和 Token 級 CoT,實現高層次圖像規劃與低...
閱讀原文

X-Fusion

X-Fusion 是加州大學洛杉磯分校、威斯康星大學麥迪遜分校和 Adobe Research 聯合提出的多模態融合框架,將預訓練的大型語言模型(LLMs)擴展到多模態任務中,...
閱讀原文

ScienceOne

ScienceOne是中國科學院自動化研究所聯合多家單位及產業化平臺共同研發的智能科研平臺。基于科學基礎大模型構建,推動多學科協同的智能科研新范式,賦能科研...
閱讀原文

Phi-4-reasoning

Phi-4-reasoning 是微軟推出的 140 億參數的推理模型,專為復雜推理任務設計。通過監督微調(SFT)訓練而成,使用了 OpenAI 的 o3-mini 模型生成的高質量推理...
閱讀原文

Rabbithole

Rabbithole 是專注于歷史探索的智能問答平臺,通過對話式交互幫助用戶深入了解各種歷史事件和話題。用戶可以登錄平臺后,選擇預設問題或輸入自己的問題,與智...
閱讀原文
1234211