AIGC動態歡迎閱讀
原標題:開源數字人實時對話:形象可自定義,支持語音輸入,對話首包延遲可低至3s|已上線阿里ModelScope魔搭社區
關鍵字:項目,數字,模塊,語音,實時
文章來源:量子位
內容字數:0字
內容摘要:
池煒恒(池化) 投稿量子位 | 公眾號 QbitAI開源數字人實時對話Demo來了~
支持語音輸入和實時對話,數字人形象可自定義的那種。
生成的數字人效果belike:
目前這個數字人實時對話Demo已在阿里巴巴ModelScope魔搭社區上線。
無需預訓練即可使用自定義的數字人形象進行實時對話,支持選擇不同的數字人形象和音色,對話首包延遲可低至3s。
基于開源技術,該項目采用模塊化系統設計,各模塊均可快速更換,開發者可以擴展和優化,適用于多種應用場景,包括但不限于直播、新聞播報和助手等。
此外,該項目基于Gradio 5實現流式視頻輸出,方便部署和快速構建交互式數字人應用。
項目介紹現有的熱門開源數字人項目主要有以下幾個:
Linly Talker,基于Gradio的數字人對話項目,多模型集成,功能豐富,但不支持實時對話和流式輸出。
LiveTalking,基于流媒體的數字人生成項目,數字人響應快,但交互界面比較簡陋,且需要配置服務器,部署難度較高。
awesome-digital-human-live2d,基于Dify編排的數字人互動項目,輕量化,交互方式豐富,但數字人形象
原文鏈接:開源數字人實時對話:形象可自定義,支持語音輸入,對話首包延遲可低至3s|已上線阿里ModelScope魔搭社區
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...