原標題:錘爆Sora,尺度最大,谷歌發布最強視頻模型Veo2,叫板海螺可靈
文章來源:夕小瑤科技說
內容字數:10917字
谷歌AI反擊戰:Veo 2和Imagen 3強勢來襲,OpenAI的Sora黯然失色
近期,谷歌DeepMind強勢發布了兩個重量級AI模型,直接挑戰OpenAI的領先地位。其中,視頻生成模型Veo 2以其卓越的性能,引發業界廣泛關注,而文生圖模型Imagen 3也展現出令人驚艷的細節和光照效果。此舉被視為谷歌對OpenAI近期一系列產品發布的強力反擊。
Veo 2:年度最佳視頻生成模型?
Veo 2在視頻生成時長、分辨率和質量上全面超越OpenAI的Sora。Sora 20美元版本僅能生成5秒720p視頻,而200美元版本也只有20秒1080p。相比之下,Veo 2可生成約2分鐘4K高清視頻。在第三方評測中,Veo 2在整體滿意度和指令遵循度上均優于Sora、Meta Movie Gen、Kling v1.5和Minimax等模型。Veo 2的顯著改進體現在保真度(細節真實,減少偽影)、準確度(理解物理世界,精準遵循指令)和相機控制(掌握電影攝影技巧,可創建各種拍攝風格)等方面。眾多官方演示視頻展示了Veo 2在模擬真實場景(如切西紅柿、早餐場景、動物游泳等)和虛構場景(如夢境般的光影效果)方面的出色表現,其生成的視頻質量已達到以假亂真的程度。
Imagen 3:細節更勝一籌的文生圖模型
除了Veo 2,谷歌還同步發布了Imagen 3文生圖模型。該模型在圖像細節、光照效果和減少干擾方面均有顯著提升,其benchmark得分也遠超其他同類模型。Imagen 3目前已開放使用,用戶可直接體驗其強大的生成能力。
谷歌與OpenAI的AI競賽:級更新vs.炒作過度?
谷歌此次發布的Veo 2和Imagen 3,與OpenAI近期持續發布新產品形成鮮明對比。谷歌的更新更側重于技術實力的展現,每次發布都具有“級”的影響力,例如Gemini 2.0和這次的Veo 2都搶占了OpenAI的風頭。而OpenAI則被部分評論認為存在過度炒作的情況,預告的12天直播雖然吸引了大量關注,但實際發布內容未能完全滿足用戶的期待。 Veo 2目前僅通過VideoFX平臺提供版(8秒720p視頻),完整版將于未來幾個月陸續推出。盡管如此,其性能仍遠超Sora。
總而言之,谷歌此次AI反擊戰可謂聲勢浩大,Veo 2和Imagen 3的驚艷表現為AI技術發展樹立了新的標桿,也為這場AI巨頭之間的競爭增添了更多看點。未來,谷歌和OpenAI之間的較量將持續引發關注。
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:低負擔解碼AI世界,硬核也可愛!聚集35萬AI發燒友、開發者和從業者,廣泛覆蓋互聯網大廠中高管、AI公司創始人和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189