AIGC動態歡迎閱讀
原標題:國產神級AI登場!高啟強化身羅翔,蔡徐坤變Rap之王,還跟Sora聯動
關鍵字:視頻,解讀,音頻,模型,角色
文章來源:智東西
內容字數:11628字
內容摘要:
17個演示視頻+技術解讀,揭秘阿里如何讓任何人開口說話。
作者|香草
編輯|心緣
開局一張圖,后期可以全靠AI了!
智東西2月29日報道,繼視頻生成模型Sora橫空出世、語音克隆創企ElevenLabs用AI為Sora演示視頻配音相繼爆火全網后,國產AI模型又在視頻生成領域整了個大事!
只用輸入一張圖+一段音頻,就能讓照片里的人物動起來并開口說話:比如讓張國榮翻唱陳奕迅的歌,讓高啟強用羅翔的聲音講普法課,把蔡徐坤變成“Rap之王”,還跟Sora生成的超逼真東京街頭散步女子視頻玩起了聯動。
這是阿里通義實驗室團隊亮出的新絕活——肖像視頻生成框架EMO(Emote Portrait Alive)。
用單張照片+任意語速的人聲音頻,EMO就能根據音頻時長,生成對應時長的視頻,并保持角色身份的一致性,讓照片里的人物開口說話唱歌,語言涵蓋普通話、粵語、日語、韓語、英語等,而且表情自然、聲畫同步,頭部姿勢也很靈活,細節處理細致到連頭發絲都會隨之晃動。
別的不說,對AI視頻解說、AI動漫制作、短視頻制作、讓逝去人物復活等應用場景而言,這可是妥妥的生產力工具!
效果多以假亂真呢?比如輸入一張高啟強的照
原文鏈接:國產神級AI登場!高啟強化身羅翔,蔡徐坤變Rap之王,還跟Sora聯動
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...