百度又放大招!視覺生成模型 Hallo2 或?qū)⒙涞財?shù)字人等場景
AIGC動態(tài)歡迎閱讀
原標(biāo)題:百度又放大招!視覺生成模型 Hallo2 或?qū)⒙涞財?shù)字人等場景
關(guān)鍵字:模型,動畫,視覺,視頻,音頻
文章來源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者 | 華衛(wèi)
近日,百度聯(lián)合復(fù)旦大學(xué)等發(fā)布 Hallo2,一個可以生成長達(dá)數(shù)小時且分辨率為 4K 的人物動畫的視覺模型。Hallo2 目前已經(jīng)在 GitHub 平臺開源,供全球開發(fā)者免費(fèi)使用和研究,預(yù)計將促進(jìn)視頻生成技術(shù)的廣泛應(yīng)用和發(fā)展。(項目地址:https://fudan-generative-vision.github.io/hallo2/#/)
Hallo2 發(fā)布后,在海外引發(fā)了不小的震動。有人驚嘆視頻生成的長度和分辨率,也有老用戶從 Hallo 第一代模型就被圈粉,還有對 Hallo2 開源模型和代碼的認(rèn)可。
Hallo2 備受關(guān)注,很重要一個原因是百度和復(fù)旦的研究團(tuán)隊解決了人像視頻生成一個很大的痛點(diǎn):如何提升視頻生成的時長和質(zhì)量。
一直以來,生成高質(zhì)量的人物動畫需要耗費(fèi)大量的時間和人力成本。而百度與復(fù)旦聯(lián)合發(fā)布的 Hallo2 的出現(xiàn),有望徹底改變這一現(xiàn)狀,為數(shù)字人、電影制作、虛擬助手、游戲開發(fā)等領(lǐng)域帶來性的變化。
?
Hallo2 是能夠?qū)崿F(xiàn)長達(dá)一小時、4K 分辨率的音頻驅(qū)動人像動畫生成模型。通過創(chuàng)新的圖像塊丟棄、噪聲增強(qiáng)和時間對齊等技術(shù),Hallo2 解決了長時
原文鏈接:百度又放大招!視覺生成模型 Hallo2 或?qū)⒙涞財?shù)字人等場景
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡介: