AIGC動態歡迎閱讀
原標題:比阿里EMO搶先開源!蔡徐坤“復出”唱RAP,騰訊AniPortrait讓照片變視頻,鬼畜區UP狂喜!看看哪家效果好
關鍵字:騰訊,面部,模型,視頻,頭部
文章來源:夕小瑤科技說
內容字數:2341字
內容摘要:
夕小瑤科技說 原創作者 | Zicy3月26號,騰訊放了個大招,開源了Audio2Video大模型AniPortrait,話不多說,先看效果!
不得不說,從肌肉到連貫程度,效果都是相當驚艷的。可以預見,以后的視頻網站的鬼畜區又有新工具了
下面我們先來看看,這個模型究竟是個啥東西?
Audio2Video大模型的較量早在2月27號的時候,阿里就宣布要開源自己的圖生視頻大模型:EMO,還把論文掛到了Arxiv上面
https://arxiv.org/abs/2402.17485
EMO的效果也是相當的炸裂,你只需要提供一張照片和一段任意音頻文件,EMO即可生成會說話唱歌的 AI 視頻,以及實現無縫對接的動態小視頻,最長時間可達1分30秒左右。表情非常到位,任意語音、任意語速、任意圖像都可以一一對應。但現在,EMO的“開源”倉庫是這樣的
只有一個Readme文件,這波開源屬于是開了個寂寞。有網友調侃道
好好好,沒有人比你更懂開源。
阿里本來是靠EMO賺足了噱頭,但這回讓騰訊搶先一步,EMO可能是真要emo了。
AniPortrait是什么總地來說,框架分為兩個階段。首先,從音頻中提取3D
原文鏈接:比阿里EMO搶先開源!蔡徐坤“復出”唱RAP,騰訊AniPortrait讓照片變視頻,鬼畜區UP狂喜!看看哪家效果好
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI一線開發者、互聯網中高管和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備行業嗅覺與報道深度。