拳打Gen-2腳踢Pika,谷歌爆肝7個(gè)月祭出AI視頻大模型!首提時(shí)空架構(gòu),時(shí)長(zhǎng)史詩(shī)級(jí)延長(zhǎng)

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:拳打Gen-2腳踢Pika,谷歌爆肝7個(gè)月祭出AI視頻大模型!首提時(shí)空架構(gòu),時(shí)長(zhǎng)史詩(shī)級(jí)延長(zhǎng)
關(guān)鍵字:視頻,模型,研究人員,時(shí)間,架構(gòu)
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):7468字
內(nèi)容摘要:
新智元報(bào)道編輯:編輯部
【新智元導(dǎo)讀】爆肝7個(gè)月,谷歌祭出了AI視頻大模型Lumiere,直接改變了游戲規(guī)則!全新架構(gòu)讓視頻時(shí)長(zhǎng)和一致性全面飛升,時(shí)長(zhǎng)直接碾壓Gen-2和Pika。AI視頻賽道上,谷歌又再次放出王炸級(jí)更新!
這個(gè)名為Google Lumiere的模型,是個(gè)大規(guī)模視頻擴(kuò)散模型,徹底改變了AI視頻的游戲規(guī)則。
跟其他模型不同,Lumiere憑借最先進(jìn)的時(shí)空U-Net架構(gòu),在一次一致的通道中生成整個(gè)視頻。
具體來(lái)說(shuō),現(xiàn)有AI生成視頻的模型,大多是在生成的簡(jiǎn)短視頻的基礎(chǔ)上并對(duì)其進(jìn)行時(shí)間采樣而完成任務(wù)。
而谷歌推出的新模型Google Lumiere是通過(guò)是聯(lián)合空間和「時(shí)間」下采樣(downsampling)來(lái)實(shí)現(xiàn)生成,這樣能顯著增加生成視頻的長(zhǎng)度和生成的質(zhì)量。
論文地址:https://arxiv.org/abs/2401.12945
值得一提的是,這是谷歌團(tuán)隊(duì)歷時(shí)7個(gè)月做出的最新成果。
對(duì)于這驚人的「谷歌速度」,網(wǎng)友們紛紛表示驚嘆——
谷歌從來(lái)不睡覺啊?
開發(fā)者回答:不睡
居然做出了走路、跳舞這樣的人體力學(xué)視頻,我的天,我以為這需要6到12個(gè)月才能做出來(lái),AI真的是在以閃電
原文鏈接:拳打Gen-2腳踢Pika,谷歌爆肝7個(gè)月祭出AI視頻大模型!首提時(shí)空架構(gòu),時(shí)長(zhǎng)史詩(shī)級(jí)延長(zhǎng)
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。

粵公網(wǎng)安備 44011502001135號(hào)