視覺AI的「Foundation Model」,已經(jīng)發(fā)展到哪一步?丨CVPR 2024現(xiàn)場直擊
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:視覺AI的「Foundation Model」,已經(jīng)發(fā)展到哪一步?丨CVPR 2024現(xiàn)場直擊
關(guān)鍵字:模型,視覺,數(shù)據(jù),報(bào)告,快手
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自AI科技評論
作者:房曉楠
編輯:陳彩嫻
2024 年美國時(shí)間 6 月 17 日至 21 日,IEEE 國際計(jì)算機(jī)視覺與模式識別會(huì)議(CVPR)在美國西雅圖召開。
如大家預(yù)料,視覺 Foundation Model 成為今年 CVPR 除自動(dòng)駕駛、3D 視覺等傳統(tǒng)研究課題以外的核心會(huì)議主題。
此外,由于會(huì)議召開前后,國內(nèi)快手「可靈」開放圖生視頻功能火爆出圈、Runway 時(shí)隔一年推出新模型 Gen-3 Alpha,文生視頻也成為 CVPR 2024 的一大熱詞。
今年, CVPR 的兩篇最佳論文都頒給了 AIGC。從論文接收數(shù)量的角度看,圖像和視頻合成與生成(Image and video synthesis and generation)以329 篇論文成功占據(jù)榜首。而文生視頻也屬于視覺 Foundation Model 的研究討論范疇。
事實(shí)上,F(xiàn)oundation Model 在人工智能領(lǐng)域的最早出圈就是在計(jì)算機(jī)視覺領(lǐng)域。
2021 年 8 月,斯坦福大學(xué)百位學(xué)者聯(lián)名發(fā)表 Foundation Model 綜述,作者隊(duì)列里就有多位計(jì)算機(jī)視覺領(lǐng)域的翹楚,如李飛飛
原文鏈接:視覺AI的「Foundation Model」,已經(jīng)發(fā)展到哪一步?丨CVPR 2024現(xiàn)場直擊
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:BigDataDigest
作者簡介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化