AIGC動態歡迎閱讀
原標題:阿里最新圖生視頻模型效果好得可比肩Sora,但0代碼“假”開源讓國內友罵翻了天?
關鍵字:字節跳動,華為,阿里,模型,視頻
文章來源:AI前線
內容字數:8407字
內容摘要:
整理 | 凌敏、核子可樂國外有文生視頻的 Sora,國內有圖生視頻的 EMO。 阿里開發出 AI 圖生視頻模型 EMO近日,阿里巴巴集團智能計算研究院上線了一款 AI 圖生視頻模型 EMO(Emote Portrait Alive)。據悉,EMO 是一種富有表現力的音頻驅動型肖像視頻生成框架,用戶用戶只需要提供一張照片和一段任意音頻文件,EMO 即可生成具有豐富面部表情和多種頭部姿態的語音頭像視頻。此外,EMO 還可以根據輸入音頻的長度生成任意長度的視頻。
在阿里給出的示例中,奧黛麗·赫本深情吟唱:
小李子演唱超“燙嘴”Rap《哥斯拉》:
蒙娜麗莎聲情并茂地演講:
高啟強化身羅翔普法:
據了解,為了訓練這套模型,阿里建立起一套龐大且多樣化的音頻視頻數據集,共收集了超過 250 小時的視頻與超過 1.5 億張圖像。這套龐大的數據集涵蓋廣泛內容,包括演講、影視片段、歌唱表演,并涵蓋漢語、英語等多種語言。豐富多樣的語音和歌唱視頻確保訓練素材能夠涵蓋廣泛的人類表情與聲樂風格,為 EMO 模型的開發提供堅實基礎。
論文:https://arxiv.org/abs/2402.17485
目前,EM
原文鏈接:阿里最新圖生視頻模型效果好得可比肩Sora,但0代碼“假”開源讓國內友罵翻了天?
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...