谷歌Veo 2逆襲:揭開AI領(lǐng)域的新競(jìng)爭(zhēng)格局!
視頻生成領(lǐng)先 OpenAI 了?
原標(biāo)題:OpenAI被偷家,谷歌Veo 2反超Sora
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):4389字
谷歌發(fā)布新一代視頻生成模型Veо 2
近日,谷歌宣布推出了兩款新視覺生成模型和一個(gè)工具,引發(fā)了廣泛關(guān)注。其中,Veо 2被認(rèn)為是當(dāng)前最先進(jìn)的視頻生成模型,能夠通過文本或圖像提示生成高質(zhì)量、高真實(shí)感的視頻。此舉標(biāo)志著谷歌在生成模型領(lǐng)域的重大突破,尤其是在與OpenAI的競(jìng)爭(zhēng)中。
Veо 2的主要特點(diǎn)
1. **高質(zhì)量視頻生成**:Veо 2能夠創(chuàng)建超過2分鐘長(zhǎng)度的4K分辨率視頻,并能夠理解提示中的相機(jī)控制指令,如廣角鏡頭和POV等。
2. **物理世界理解力**:該模型在物理交互和人臉表情的生成上表現(xiàn)出色,能夠生成看似真實(shí)拍攝的場(chǎng)景,諸如水下波紋和狗狗潛水時(shí)的協(xié)調(diào)動(dòng)作。
3. **人類評(píng)估結(jié)果優(yōu)異**:谷歌通過人類評(píng)估者對(duì)比了多個(gè)模型,結(jié)果顯示Veо 2的生成視頻在整體偏好和指令遵從度方面均遙遙領(lǐng)先。
其他功能與應(yīng)用
Veо 2不僅在生成現(xiàn)實(shí)場(chǎng)景方面表現(xiàn)突出,還能在幻想和動(dòng)畫內(nèi)容的生成上同樣優(yōu)秀。用戶可以通過簡(jiǎn)單的提示實(shí)現(xiàn)復(fù)雜視覺效果,極大降低了創(chuàng)作的門檻。此外,Veо 2已被集成到谷歌的VideoFX工具中,未來還將擴(kuò)展至YouTube Shorts等平臺(tái)。
市場(chǎng)競(jìng)爭(zhēng)與未來展望
此次發(fā)布無疑是谷歌對(duì)OpenAI及其Sora模型的有力反擊。盡管OpenAI在直播活動(dòng)中吸引了大量關(guān)注,但其產(chǎn)品的實(shí)質(zhì)內(nèi)容卻逐漸減少。隨著技術(shù)的快速迭代,谷歌有望在未來的競(jìng)爭(zhēng)中占據(jù)更有利的位置,甚至可能在明年將OpenAI遠(yuǎn)遠(yuǎn)甩在后面。
總之,Veо 2的推出標(biāo)志著視頻生成技術(shù)的新高度,未來我們可能會(huì)看到更多創(chuàng)新的應(yīng)用場(chǎng)景。
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)