谷歌Veo 2與Imagen 3重磅發布
近期,谷歌在OpenAI發布會之前推出了兩個重磅更新,分別是視頻生成模型Veo 2和文生圖模型Imagen 3。這些新產品在生成視頻和圖像的能力上表現出色,顯然是對OpenAI的回應。
1. Veo 2的視頻生成能力
谷歌的Veo 2模型能夠生成高達4K分辨率、約2分鐘的視頻,表現出極高的表現力和細節保真度。與OpenAI的Sora相比,Veo 2在生成視頻時的參數和基準測試結果均大幅領先,提供了更長的時長和更高的分辨率。
2. 精準的指令遵循
Veo 2在理解物理世界和遵循詳細指令方面也有顯著進步。用戶可以輸入復雜的提示語,模型能夠生動地再現各種場景,展現出優秀的陰影、反射和力學效果。例如,Veo 2能夠自然地處理物體之間的互動,生成的畫面仿佛真實拍攝而成。
3. 展示效果及用戶反饋
谷歌還展示了多段Veo 2生成的視頻,涵蓋從場景到靜物攝影的多種主題。用戶可以通過VideoFX平臺進行體驗,但目前該平臺僅開放了Veo 2的試用版,用戶需申請加入等待名單。
4. Imagen 3的圖像生成能力
除了Veo 2,谷歌還發布了Imagen 3模型,具備更好的圖像細節和光照效果。用戶可以直接使用Imagen 3進行圖像生成,體驗其強大的視覺表現力。
5. 谷歌的快速迭代與未來展望
谷歌DeepMind的副總裁Eli Collins表示,Veo 2會根據用戶反饋進行迭代更新,并預計明年將推出更多功能。與OpenAI的逐步釋放不同,谷歌的交付速度備受期待。
總的來說,谷歌的Veo 2和Imagen 3在AI視頻和圖像生成領域展現了強大的競爭力,勢必對OpenAI造成壓力,未來的發展值得用戶關注。
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:解碼AI世界,硬核也可愛!聚集35萬AI發燒友、開發者和從業者,廣泛覆蓋互聯網大廠中高管、AI公司創始人和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189