AI輔助編程,代碼自動修復(fù)
Fotol AI是強(qiáng)大AI解決方案的終極中心,提供AGI技術(shù)和服務(wù)。
一個強(qiáng)大的統(tǒng)一多模態(tài)模型,支持文本到圖像生成及圖像編輯。
OneReach是一個用于創(chuàng)建高級多模態(tài)AI代理的平臺,旨在提升員工和客戶體驗。
革命性的AI圖像編輯與生成技術(shù),結(jié)合了文字指令和視覺語境,實現(xiàn)精準(zhǔn)編輯和風(fēng)格轉(zhuǎn)移。
騰訊發(fā)布的混元游戲視覺生成平臺,這是依托混元大模型打造的首個工業(yè)級AIGC游戲內(nèi)容生產(chǎn)引擎,可以優(yōu)化游戲資產(chǎn)生成與游戲制作流程。騰訊混元游戲官網(wǎng)入口網(wǎng)址
InternVL3開源:7種尺寸覆蓋文、圖、視頻處理,多模態(tài)能力擴(kuò)展至工業(yè)圖像分析
字節(jié)跳動AI編程助手,中文界面,代碼智能生成
字節(jié)跳動旗下AI編程工具悠碼(Yoma)
領(lǐng)先AI智能聚合平臺,助您高效辦公,事半功倍。
字節(jié)跳動推出免費AI編程IDE,協(xié)作提升效率,加速項目交付。
Gemini 2.5 是谷歌最智能的 AI 模型,具備推理能力。
Trae是字節(jié)跳動推出的國內(nèi)首款A(yù)I原生IDE,集成Claude3.5與GPT-4o兩款頂尖AI模型,專為中文開發(fā)場景設(shè)計,將AI深度集成于IDE環(huán)境,帶來更流暢、準(zhǔn)確的開發(fā)體驗。
一站式AI聚合平臺
Doubao-1.5-pro 是一個高性能的稀疏 MoE 大語言模型,專注于推理性能與模型能力的極致平衡。
一款支持多模態(tài)功能的全功能大語言模型安卓應(yīng)用。
CUA 是一種能夠通過圖形界面與數(shù)字世界交互的通用接口。
OpenAI Agents SDK 是一個用于構(gòu)建自主智能體的開發(fā)工具包,簡化多智能體工作流的編排。
OmniHuman-1 是一種基于單張人像和運動信號生成人類視頻的多模態(tài)框架。
CLaMP 3 是一個用于跨模態(tài)和跨語言音樂信息檢索的統(tǒng)一框架。
Kimi k1.5 是一個通過強(qiáng)化學(xué)習(xí)擴(kuò)展的多模態(tài)語言模型,專注于提升推理和邏輯能力。
Gemini 2.0 是谷歌推出的最新一代生成式 AI 模型,包含 Flash、Flash-Lite 和 Pro 版本。
DeepSeek 是一款先進(jìn)的 AI 語言模型,擅長邏輯推理、數(shù)學(xué)和編程任務(wù),提供免費使用。
VideoLLaMA3是前沿的多模態(tài)基礎(chǔ)模型,專注于圖像和視頻理解。
Janus-Pro-1B 是一個統(tǒng)一多模態(tài)理解和生成的自回歸框架。
Qwen2.5-VL 是一款強(qiáng)大的視覺語言模型,能夠理解圖像和視頻內(nèi)容并生成相應(yīng)文本。
UniTok是一個用于視覺生成和理解的統(tǒng)一視覺分詞器。
EgoLife是一個長期、多模態(tài)、多視角的日常生活A(yù)I助手項目,旨在推進(jìn)長期上下文理解研究。
一個用于智能設(shè)備等的多模態(tài)原生代理框架。
SmolVLM-500M 是一個輕量級多模態(tài)模型,能夠處理圖像和文本輸入并生成文本輸出。
Phi-4-multimodal-instruct 是微軟開發(fā)的輕量級多模態(tài)基礎(chǔ)模型,支持文本、圖像和音頻輸入。
用于多模態(tài)上下文中的檢索增強(qiáng)生成的基準(zhǔn)測試代碼庫。
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙