視覺AI的「Foundation Model」，已經發展到哪一步？丨CVPR 2024現場直擊

AIGC動態2年前 (2024)發布大數據文摘

AIGC動態歡迎閱讀

原標題：視覺AI的「Foundation Model」，已經發展到哪一步？丨CVPR 2024現場直擊
關鍵字：模型,視覺,數據,報告,快手
文章來源：大數據文摘
內容字數：0字

內容摘要：

大數據文摘授權轉載自AI科技評論
作者：房曉楠
編輯：陳彩嫻
2024 年美國時間 6 月 17 日至 21 日，IEEE 國際計算機視覺與模式識別會議（CVPR）在美國西雅圖召開。
如大家預料，視覺 Foundation Model 成為今年 CVPR 除自動駕駛、3D 視覺等傳統研究課題以外的核心會議主題。
此外，由于會議召開前后，國內快手「可靈」開放圖生視頻功能火爆出圈、Runway 時隔一年推出新模型 Gen-3 Alpha，文生視頻也成為 CVPR 2024 的一大熱詞。
今年， CVPR 的兩篇最佳論文都頒給了 AIGC。從論文接收數量的角度看，圖像和視頻合成與生成（Image and video synthesis and generation）以329 篇論文成功占據榜首。而文生視頻也屬于視覺 Foundation Model 的研究討論范疇。
事實上，Foundation Model 在人工智能領域的最早出圈就是在計算機視覺領域。
2021 年 8 月，斯坦福大學百位學者聯名發表 Foundation Model 綜述，作者隊列里就有多位計算機視覺領域的翹楚，如李飛飛

原文鏈接：視覺AI的「Foundation Model」，已經發展到哪一步？丨CVPR 2024現場直擊