一個(gè)基于深度學(xué)習(xí)的圖像和視頻描述模型。
Aya Vision 32B 是一個(gè)支持多語(yǔ)言的視覺(jué)語(yǔ)言模型,適用于OCR、圖像描述、視覺(jué)推理等多種用途。
SmolVLM-500M 是一個(gè)輕量級(jí)多模態(tài)模型,能夠處理圖像和文本輸入并生成文本輸出。
8億參數(shù)的多語(yǔ)言視覺(jué)語(yǔ)言模型,支持OCR、圖像描述、視覺(jué)推理等功能
小型高效的視覺(jué)語(yǔ)言模型,讓資源有限的研究者和開(kāi)發(fā)者也能輕松使用先進(jìn)的視覺(jué)語(yǔ)言功能。
PaliGemma 2是一個(gè)強(qiáng)大的視覺(jué)-語(yǔ)言模型,支持多種視覺(jué)語(yǔ)言任務(wù)。
PaliGemma 2是一款強(qiáng)大的視覺(jué)-語(yǔ)言模型,支持多種語(yǔ)言的圖像和文本處理任務(wù)。
自動(dòng)化為網(wǎng)站圖片生成描述性文本
多模態(tài)大型語(yǔ)言模型,提升視覺(jué)和語(yǔ)言的綜合理解能力
多模態(tài)大型語(yǔ)言模型,提升視覺(jué)與語(yǔ)言的交互能力。
OpenI AI助手在線工具硅基流動(dòng)豆包Trae扣子Coze即夢(mèng)繪蛙