震撼來襲!谷歌Veo2視頻模型挑戰(zhàn)海螺可靈,打破極限的視覺盛宴!
原標(biāo)題:錘爆Sora,尺度最大,谷歌發(fā)布最強(qiáng)視頻模型Veo2,叫板海螺可靈
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):10917字
谷歌Veo 2與Imagen 3重磅發(fā)布
近期,谷歌在OpenAI發(fā)布會(huì)之前推出了兩個(gè)重磅更新,分別是視頻生成模型Veo 2和文生圖模型Imagen 3。這些新產(chǎn)品在生成視頻和圖像的能力上表現(xiàn)出色,顯然是對(duì)OpenAI的回應(yīng)。
1. Veo 2的視頻生成能力
谷歌的Veo 2模型能夠生成高達(dá)4K分辨率、約2分鐘的視頻,表現(xiàn)出極高的表現(xiàn)力和細(xì)節(jié)保真度。與OpenAI的Sora相比,Veo 2在生成視頻時(shí)的參數(shù)和基準(zhǔn)測(cè)試結(jié)果均大幅領(lǐng)先,提供了更長(zhǎng)的時(shí)長(zhǎng)和更高的分辨率。
2. 精準(zhǔn)的指令遵循
Veo 2在理解物理世界和遵循詳細(xì)指令方面也有顯著進(jìn)步。用戶可以輸入復(fù)雜的提示語,模型能夠生動(dòng)地再現(xiàn)各種場(chǎng)景,展現(xiàn)出優(yōu)秀的陰影、反射和力學(xué)效果。例如,Veo 2能夠自然地處理物體之間的互動(dòng),生成的畫面仿佛真實(shí)拍攝而成。
3. 展示效果及用戶反饋
谷歌還展示了多段Veo 2生成的視頻,涵蓋從場(chǎng)景到靜物攝影的多種主題。用戶可以通過VideoFX平臺(tái)進(jìn)行體驗(yàn),但目前該平臺(tái)僅開放了Veo 2的試用版,用戶需申請(qǐng)加入等待名單。
4. Imagen 3的圖像生成能力
除了Veo 2,谷歌還發(fā)布了Imagen 3模型,具備更好的圖像細(xì)節(jié)和光照效果。用戶可以直接使用Imagen 3進(jìn)行圖像生成,體驗(yàn)其強(qiáng)大的視覺表現(xiàn)力。
5. 谷歌的快速迭代與未來展望
谷歌DeepMind的副總裁Eli Collins表示,Veo 2會(huì)根據(jù)用戶反饋進(jìn)行迭代更新,并預(yù)計(jì)明年將推出更多功能。與OpenAI的逐步釋放不同,谷歌的交付速度備受期待。
總的來說,谷歌的Veo 2和Imagen 3在AI視頻和圖像生成領(lǐng)域展現(xiàn)了強(qiáng)大的競(jìng)爭(zhēng)力,勢(shì)必對(duì)OpenAI造成壓力,未來的發(fā)展值得用戶關(guān)注。
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:
作者簡(jiǎn)介:解碼AI世界,硬核也可愛!聚集35萬AI發(fā)燒友、開發(fā)者和從業(yè)者,廣泛覆蓋互聯(lián)網(wǎng)大廠中高管、AI公司創(chuàng)始人和機(jī)構(gòu)投資人。一線作者來自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189