視覺 AI 的「Foundation Model」，已經發展到哪一步？丨CVPR 2024 現場直擊

AIGC動態1年前 (2024)發布 AI科技評論

AIGC動態歡迎閱讀

原標題：視覺 AI 的「Foundation Model」，已經發展到哪一步？丨CVPR 2024 現場直擊
關鍵字：模型,視覺,數據,報告,快手
文章來源：AI科技評論
內容字數：0字

內容摘要：

CVPR 不再只是一個純粹的學術會議，也是產業發展的嗅覺源。作者｜房曉楠
編輯｜陳彩嫻
2024 年美國時間 6 月 17 日至 21 日，IEEE 國際計算機視覺與模式識別會議（CVPR）在美國西雅圖召開。
如大家預料，視覺 Foundation Model 成為今年 CVPR 除自動駕駛、3D 視覺等傳統研究課題以外的核心會議主題。
此外，由于會議召開前后，國內快手「可靈」開放圖生視頻功能火爆出圈、Runway 時隔一年推出新模型 Gen-3 Alpha，文生視頻也成為 CVPR 2024 的一大熱詞。
今年， CVPR 的兩篇最佳論文都頒給了 AIGC。從論文接收數量的角度看，圖像和視頻合成與生成（Image and video synthesis and generation）以329 篇論文成功占據榜首。而文生視頻也屬于視覺 Foundation Model 的研究討論范疇。
事實上，Foundation Model 在人工智能領域的最早出圈就是在計算機視覺領域。
2021 年 8 月，斯坦福大學百位學者聯名發表 Foundation Model 綜述，作者隊列里就有多位計算

原文鏈接：視覺 AI 的「Foundation Model」，已經發展到哪一步？丨CVPR 2024 現場直擊