AIGC動態歡迎閱讀
原標題:字節視頻大模型比賽!無縫鏡頭切換,運鏡技巧拉滿,音樂創作和翻譯也實現了
關鍵字:模型,字節跳動,豆包,視頻,快手
文章來源:智東西
內容字數:0字
內容摘要:
豆包大模型兇猛上新:輕松創作電影質感大片、歌曲,同音色翻譯趕超人類同傳。
作者|程茜
編輯|云鵬
智東西9月24日報道,今天,字節的視頻生成大模型首次亮相,分分鐘化身超級導演,鏡頭切換、電影質感、多主體交互都能輕松拿捏;其通用模型Pro綜合能力提升25%,初始TPM(每分鐘處理Tokens數量)支持800k,高于業界其他模型。
這些都是今天字節跳動豆包大模型家族的重磅更新,連添了視頻、音樂、同聲傳譯三大新成員;還有文生圖模型優化了六類復雜生成,語音合成模型可混合數百種音色……
其中的重磅發布莫過于視頻生成模型,這意味著繼快手后,另一大短視頻巨頭字節(抖音集團)也正式進軍AI視頻生成賽道。
豆包的視頻生成模型可以實現對復雜指令的理解和遵循,平滑實現鏡頭的變焦、環繞、縮放,保持多鏡頭切換的一致性以及多尺寸、多風格生成。據火山引擎總裁譚待透露,該模型會在國慶節之后上線到火山方舟平臺。
它可以根據提示詞生成電影質感的畫面:
超現實的提示詞也能輕松應對,如有翅膀的青蛙、浮空小島中生長的樹等:
在真實使用場景中,人們往往需要不同比例或者尺寸大小的視頻,該模型可以滿足多比例、多尺寸的視頻生成:
即使
原文鏈接:字節視頻大模型比賽!無縫鏡頭切換,運鏡技巧拉滿,音樂創作和翻譯也實現了
聯系作者
文章來源:智東西
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...