一個(gè)基于音頻驅(qū)動(dòng)的實(shí)時(shí)2D聊天頭像生成模型,可在僅使用CPU的設(shè)備上實(shí)現(xiàn)30fps的實(shí)時(shí)推理。
小型高效的視覺語言模型,讓資源有限的研究者和開發(fā)者也能輕松使用先進(jìn)的視覺語言功能。
輕量級1.7B參數(shù)的語言模型,適用于多種任務(wù)。
OpenI AI助手在線工具硅基流動(dòng)豆包Trae扣子Coze即夢繪蛙