谷歌推出全新視頻與圖像生成模型
在今日凌晨,谷歌正式宣布推出其最新的生成模型——Veo 2和Imagen 3,旨在進一步提升視頻與圖像的生成質量,稱其已達到當前的最高標準(SOTA)。這兩款模型的發布,標志著谷歌在生成技術領域的一次重大進展,意在與OpenAI等競爭對手形成競爭。
1. Veo 2:SOTA視頻生成
Veo 2是谷歌新推出的視頻生成模型,表現出色。根據人類評價者的測試,Veo 2在畫質、細節和真實性方面均達到SOTA水準。該模型對現實物理、人體動作和表情的理解更加深入,生成的視頻內容更加真實。用戶可以通過提示詞來定制場景效果,包括鏡頭類型和畫面風格,生成高達4K分辨率、時長數分鐘的視頻。
2. Veo 2的技術特點
Veo 2的技術能力包括減少生成視頻中不必要的細節(如多余的手指)的問題,增強輸出內容的真實性。此外,為了確保生成技術的安全性,Veo 2采用了無形水印技術SynthID,以識別AI生成內容,從而降低誤導信息傳播的風險。
3. Imagen 3:圖像生成模型再升級
谷歌還對其圖像生成模型Imagen進行了全面升級。升級后的Imagen 3在生成質量上超過多個競爭對手,支持更豐富的藝術風格,從寫實主義到動漫風格,用戶可以獲得更高質量和多樣化的圖像生成體驗。
4. Whisk:基于圖像的創意工具
此外,谷歌還推出了Whisk,一個基于圖像的創意可視化工具。Whisk允許用戶輸入或創建圖像,并結合Imagen 3的技術能力,自動生成詳細描述,以實現對場景和風格的靈活組合,滿足各種創意需求。
總結
谷歌的Veo 2和Imagen 3模型的推出,不僅展示了其在視頻和圖像生成領域的技術實力,也為用戶提供了更高質量的創作工具。隨著這些技術的逐步開放,未來用戶在創作方面將有更多的可能性。
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...