為什么說 2023 年是人工智能視頻的突破之年,以及對 2024 年可以期待什么?

AIGC動態(tài)歡迎閱讀
原標(biāo)題:為什么說 2023 年是人工智能視頻的突破之年,以及對 2024 年可以期待什么?
關(guān)鍵字:視頻,模型,字節(jié)跳動,產(chǎn)品,公司
文章來源:AI范兒
內(nèi)容字?jǐn)?shù):7315字
內(nèi)容摘要:
點(diǎn)擊上方藍(lán)字關(guān)注我們“2023年是AI視頻的突破之年。從無公開文本到視頻模型,到十幾種視頻生成產(chǎn)品,數(shù)百萬用戶使用文本或圖像提示創(chuàng)建短片。產(chǎn)品尚有限,質(zhì)量參差,但仍處于發(fā)展初期,迎來了巨大轉(zhuǎn)變。對于AI視頻的未來,仍有控制、時間連貫性、長度等核心問題亟待解決。大型科技公司如何介入,訓(xùn)練數(shù)據(jù)來源,工作流程歸屬等問題也亟待探討。2023 年是人工智能視頻的突破之年。年初時,還沒有公開的文本轉(zhuǎn)視頻模型。僅僅過了 12 個月,全球已有數(shù)十種視頻生成產(chǎn)品投入使用,數(shù)百萬用戶通過文本或圖像提示創(chuàng)作了短視頻剪輯。
盡管這些產(chǎn)品還相對有限 — 大多數(shù)只能生成 3 到 4 秒的視頻,而且質(zhì)量參差不齊,角色一致性等問題還沒有解決。要實(shí)現(xiàn)通過簡單文本提示(甚至多個提示!)創(chuàng)作出皮克斯級別的短片,我們還有很長的路要走。
然而,過去一年視頻生成領(lǐng)域取得的進(jìn)展表明,我們正處于一場巨大轉(zhuǎn)型的早期階段 — 類似于圖像生成領(lǐng)域所經(jīng)歷的轉(zhuǎn)變。我們看到文本到視頻模型以及圖像到視頻、視頻到視頻等相關(guān)模型不斷改進(jìn),并逐漸受到關(guān)注。
為了更好地理解這一創(chuàng)新潮流,我們追蹤了迄今為止的最重要發(fā)展,關(guān)注了一些值得關(guān)注的公司,并且探討了
原文鏈接:為什么說 2023 年是人工智能視頻的突破之年,以及對 2024 年可以期待什么?
聯(lián)系作者
文章來源:AI范兒
作者微信:AI_Insights
作者簡介:智能未來,始于Prompt!

粵公網(wǎng)安備 44011502001135號