谷歌Veo 2逆襲：揭開(kāi)AI領(lǐng)域的新競(jìng)爭(zhēng)格局！

視頻生成領(lǐng)先 OpenAI 了？

原標(biāo)題：OpenAI被偷家，谷歌Veo 2反超Sora
文章來(lái)源：機(jī)器之心
內(nèi)容字?jǐn)?shù)：4389字

谷歌發(fā)布新一代視頻生成模型Veо 2

近日，谷歌宣布推出了兩款新視覺(jué)生成模型和一個(gè)工具，引發(fā)了廣泛關(guān)注。其中，Veо 2被認(rèn)為是當(dāng)前最先進(jìn)的視頻生成模型，能夠通過(guò)文本或圖像提示生成高質(zhì)量、高真實(shí)感的視頻。此舉標(biāo)志著谷歌在生成模型領(lǐng)域的重大突破，尤其是在與OpenAI的競(jìng)爭(zhēng)中。

Veо 2的主要特點(diǎn)

1. **高質(zhì)量視頻生成**：Veо 2能夠創(chuàng)建超過(guò)2分鐘長(zhǎng)度的4K分辨率視頻，并能夠理解提示中的相機(jī)控制指令，如廣角鏡頭和POV等。

2. **物理世界理解力**：該模型在物理交互和人臉表情的生成上表現(xiàn)出色，能夠生成看似真實(shí)拍攝的場(chǎng)景，諸如水下波紋和狗狗潛水時(shí)的協(xié)調(diào)動(dòng)作。

3. **人類評(píng)估結(jié)果優(yōu)異**：谷歌通過(guò)人類評(píng)估者對(duì)比了多個(gè)模型，結(jié)果顯示Veо 2的生成視頻在整體偏好和指令遵從度方面均遙遙領(lǐng)先。

其他功能與應(yīng)用

Veо 2不僅在生成現(xiàn)實(shí)場(chǎng)景方面表現(xiàn)突出，還能在幻想和動(dòng)畫(huà)內(nèi)容的生成上同樣優(yōu)秀。用戶可以通過(guò)簡(jiǎn)單的提示實(shí)現(xiàn)復(fù)雜視覺(jué)效果，極大降低了創(chuàng)作的門檻。此外，Veо 2已被集成到谷歌的VideoFX工具中，未來(lái)還將擴(kuò)展至YouTube Shorts等平臺(tái)。

市場(chǎng)競(jìng)爭(zhēng)與未來(lái)展望

此次發(fā)布無(wú)疑是谷歌對(duì)OpenAI及其Sora模型的有力反擊。盡管OpenAI在直播活動(dòng)中吸引了大量關(guān)注，但其產(chǎn)品的實(shí)質(zhì)內(nèi)容卻逐漸減少。隨著技術(shù)的快速迭代，谷歌有望在未來(lái)的競(jìng)爭(zhēng)中占據(jù)更有利的位置，甚至可能在明年將OpenAI遠(yuǎn)遠(yuǎn)甩在后面。

總之，Veо 2的推出標(biāo)志著視頻生成技術(shù)的新高度，未來(lái)我們可能會(huì)看到更多創(chuàng)新的應(yīng)用場(chǎng)景。