過(guò)去一年我開(kāi)發(fā) AI 視頻編輯器的收獲
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:過(guò)去一年我開(kāi)發(fā) AI 視頻編輯器的收獲
關(guān)鍵字:元宇宙,模型,視頻,小米,提示
文章來(lái)源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者 | Kirk Kaiser 譯者 | Sambodhi 策劃 | 褚杏娟
去年,我在一個(gè)新崗位上僅工作 6 個(gè)月就被解雇了。
我離開(kāi)了一家很棒的公司和老板,去冒險(xiǎn)加入一家初創(chuàng)公司,但還沒(méi)真正開(kāi)始,一切就結(jié)束了。
我決定以此為契機(jī),探索 LLM(大語(yǔ)言模型)、擴(kuò)散模型以及越來(lái)越多的其他開(kāi)放模型在視頻領(lǐng)域中的新可能性。
多年前,我曾幫助打造了一個(gè)后來(lái)成為獨(dú)角獸的生成式視頻編輯#Launch_and_Early_years),并從那時(shí)起就有了一些想要實(shí)現(xiàn)的想法。
在 2015 年,這些想法大多顯得不切實(shí)際,但隨著 LLM 和計(jì)算機(jī)視覺(jué)模型的進(jìn)步,現(xiàn)在它們已經(jīng)變得有實(shí)現(xiàn)的可能了。GPU 資源緊缺與本地優(yōu)先、
多模態(tài)生成式人工智能
我最初專注于構(gòu)建一個(gè)通過(guò)多模態(tài)人工智能改進(jìn)的本地視頻編輯器。它利用計(jì)算機(jī)視覺(jué)檢測(cè)、提取和跟蹤視頻中的物體,并結(jié)合擴(kuò)散模型為視頻添加和動(dòng)畫化新物體。
5 年前,我曾使用 Mask-RCNN 每天制作視頻草稿,嘗試滑板視頻的創(chuàng)作。
這些視頻草稿讓我在沒(méi)有任何強(qiáng)烈預(yù)期的情況下,探索了人工智能輔助視頻編輯這一媒介。我認(rèn)為,開(kāi)發(fā)一個(gè)工具來(lái)繼續(xù)探索這項(xiàng)工作將會(huì)取得豐碩的成
原文鏈接:過(guò)去一年我開(kāi)發(fā) AI 視頻編輯器的收獲
聯(lián)系作者
文章來(lái)源:AI前線
作者微信:
作者簡(jiǎn)介: