無(wú)需訓(xùn)練即可創(chuàng)建數(shù)字人,字節(jié)PersonaTalk視頻口型編輯超SOTA
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:無(wú)需訓(xùn)練即可創(chuàng)建數(shù)字人,字節(jié)PersonaTalk視頻口型編輯超SOTA
關(guān)鍵字:字節(jié)跳動(dòng),視頻,口型,侵權(quán),技術(shù)
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專(zhuān)欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專(zhuān)欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在 AIGC 的熱潮下,基于語(yǔ)音驅(qū)動(dòng)的視頻口型編輯技術(shù)成為了視頻內(nèi)容個(gè)性化與智能化的重要手段之一。尤其是近兩年爆火的數(shù)字人直播帶貨,以及傳遍全網(wǎng)的霉霉講中文、郭德綱用英語(yǔ)講相聲,都印證著視頻口型編輯技術(shù)已經(jīng)逐漸在行業(yè)中被廣泛應(yīng)用,備受市場(chǎng)關(guān)注。
近期,字節(jié)跳動(dòng)一項(xiàng)名為 PersonaTalk 的相關(guān)技術(shù)成果入選了 SIGGRAPH Asia 2024-Conference Track,該方案能不受原視頻質(zhì)量的影響,保障生成視頻質(zhì)量的同時(shí)兼顧 zero-shot 技術(shù)的便捷和穩(wěn)定,可以通過(guò)非常便捷高效的方式用語(yǔ)音修改視頻中人物的口型,完成高質(zhì)量視頻編輯,快速實(shí)現(xiàn)數(shù)字人視頻制作以及口播內(nèi)容的二次創(chuàng)作。肖像來(lái)自學(xué)術(shù)數(shù)據(jù)集 HDTF
目前的視頻改口型技術(shù)大致可以分為兩
原文鏈接:無(wú)需訓(xùn)練即可創(chuàng)建數(shù)字人,字節(jié)PersonaTalk視頻口型編輯超SOTA
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: