視覺 AI 的「Foundation Model」,已經(jīng)發(fā)展到哪一步?丨CVPR 2024 現(xiàn)場直擊
AIGC動態(tài)歡迎閱讀
原標(biāo)題:視覺 AI 的「Foundation Model」,已經(jīng)發(fā)展到哪一步?丨CVPR 2024 現(xiàn)場直擊
關(guān)鍵字:模型,視覺,數(shù)據(jù),報告,快手
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
CVPR 不再只是一個純粹的學(xué)術(shù)會議,也是產(chǎn)業(yè)發(fā)展的嗅覺源。作者|房曉楠
編輯|陳彩嫻
2024 年美國時間 6 月 17 日至 21 日,IEEE 國際計算機(jī)視覺與模式識別會議(CVPR)在美國西雅圖召開。
如大家預(yù)料,視覺 Foundation Model 成為今年 CVPR 除自動駕駛、3D 視覺等傳統(tǒng)研究課題以外的核心會議主題。
此外,由于會議召開前后,國內(nèi)快手「可靈」開放圖生視頻功能火爆出圈、Runway 時隔一年推出新模型 Gen-3 Alpha,文生視頻也成為 CVPR 2024 的一大熱詞。
今年, CVPR 的兩篇最佳論文都頒給了 AIGC。從論文接收數(shù)量的角度看,圖像和視頻合成與生成(Image and video synthesis and generation)以329 篇論文成功占據(jù)榜首。而文生視頻也屬于視覺 Foundation Model 的研究討論范疇。
事實(shí)上,F(xiàn)oundation Model 在人工智能領(lǐng)域的最早出圈就是在計算機(jī)視覺領(lǐng)域。
2021 年 8 月,斯坦福大學(xué)百位學(xué)者聯(lián)名發(fā)表 Foundation Model 綜述,作者隊列里就有多位計算
原文鏈接:視覺 AI 的「Foundation Model」,已經(jīng)發(fā)展到哪一步?丨CVPR 2024 現(xiàn)場直擊
聯(lián)系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。