
原標(biāo)題:快手發(fā)布“可靈”視頻生成大模型:開啟AI視頻創(chuàng)作新紀(jì)元
文章來源:小夏聊AIGC
內(nèi)容字?jǐn)?shù):2546字
快手推出“可靈”視頻生成大模型,引領(lǐng)AI創(chuàng)作新潮流
6月6日,國內(nèi)短視頻平臺(tái)快手正式發(fā)布了一款名為“可靈(Kling)”的視頻生成大模型。這一由快手AI團(tuán)隊(duì)自主研發(fā)的創(chuàng)新技術(shù),標(biāo)志著中國在人工智能視頻創(chuàng)作領(lǐng)域邁出了重要的一步。可靈大模型具備多重優(yōu)勢(shì),能夠生成大幅度的合理,模擬真實(shí)物理世界的特性,并擁有強(qiáng)大的概念組合能力和創(chuàng)意想象力。
突破性的視頻生成能力
可靈大模型通過簡單的文本輸入,便能生成時(shí)長長達(dá)2分鐘、1080P高清、每秒30幀的流暢視頻。在色彩呈現(xiàn)、視頻清晰度、動(dòng)作連貫性及對(duì)文本語義的準(zhǔn)確理解方面,可靈表現(xiàn)出色,足以與OpenAI的Sora相媲美。同時(shí),它還具備模擬真實(shí)物理世界的技術(shù)特性,為用戶帶來了更為真實(shí)的觀看體驗(yàn)。
先進(jìn)的技術(shù)架構(gòu)
在技術(shù)上,可靈采用了3D時(shí)空聯(lián)合注意力機(jī)制,更有效地建模視頻中的復(fù)雜時(shí)空。這一創(chuàng)新意味著可靈不僅能生成大幅度的,而且這些將遵循客觀的規(guī)律。例如,在官方展示的視頻中,一位宇航員在月球上奔跑,隨著鏡頭的提升,宇航員的步態(tài)和影子都保持了合理的表現(xiàn)。此外,可靈還能夠模擬光影反射、流體等真實(shí)物理特性,使得生成的視頻更加生動(dòng)。比如,在一段關(guān)于“小男孩吃漢堡”的視頻中,男孩咬下漢堡時(shí),漢堡上出現(xiàn)了明顯的缺口,并且在整個(gè)視頻中保持如一。
表情與身體驅(qū)動(dòng)的創(chuàng)新玩法
可靈大模型還引入了表情身體驅(qū)動(dòng)技術(shù),結(jié)合自研的3D人臉和人體重建技術(shù),用戶只需上傳一張全身照片,便能體驗(yàn)生動(dòng)的“唱跳”玩法。這種技術(shù)的運(yùn)用,為視頻創(chuàng)作帶來了全新的可能性。
可靈的五大優(yōu)勢(shì)
1. 流暢合理的模擬:通過創(chuàng)新的3D時(shí)空聯(lián)合注意力機(jī)制,精準(zhǔn)捕捉視頻中的復(fù)雜動(dòng)態(tài),生成自然且符合物理法則的。
2. 高清視頻輸出:可靈能夠生成長達(dá)兩分鐘、每秒30幀的流暢視頻,保證高質(zhì)量的觀看體驗(yàn)。
3. 真實(shí)物理特性的模擬:能夠逼真地模擬光影效果、流體等,確保視頻內(nèi)容符合自然界的規(guī)律。
4. 概念組合與創(chuàng)意轉(zhuǎn)化能力:結(jié)合Diffusion Transformer架構(gòu),將用戶的想象轉(zhuǎn)化為生動(dòng)的視覺畫面,甚至創(chuàng)造超現(xiàn)實(shí)的場景。
5. 靈活的視頻寬高比支持:通過可變分辨率訓(xùn)練策略,適應(yīng)不同寬高比需求,滿足多樣化的創(chuàng)作需求。
未來展望
通過這些顯著優(yōu)勢(shì),可靈不僅為視頻創(chuàng)作帶來了前所未有的便捷和高效,也為AI視頻生成領(lǐng)域開辟了新的天地。目前,可靈大模型已在快手旗下的快影App開放邀測體驗(yàn),支持創(chuàng)作者申請(qǐng)并體驗(yàn)其最新的文生視頻功能。快手表示,將持續(xù)加速大模型的研發(fā)與應(yīng)用,力求帶來更豐富的AI創(chuàng)作與互動(dòng)體驗(yàn)。
可靈視頻生成大模型的發(fā)布,不僅為快手帶來了新的競爭優(yōu)勢(shì),也為整個(gè)AI創(chuàng)作領(lǐng)域注入了新的活力。我們期待這一創(chuàng)新技術(shù)在未來的廣泛應(yīng)用,為用戶帶來更多精彩紛呈的視頻內(nèi)容。
聯(lián)系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內(nèi)容的前沿信息與技術(shù)分享。我們提供AI生成藝術(shù)、文本、音樂、視頻等領(lǐng)域的最新動(dòng)態(tài)與應(yīng)用案例。每日新聞速遞、技術(shù)解讀、行業(yè)分析、專家觀點(diǎn)和創(chuàng)意展示。期待與您一起探索AI的無限潛力。歡迎關(guān)注并分享您的AI作品或?qū)氋F意見。

粵公網(wǎng)安備 44011502001135號(hào)