AIGC動態歡迎閱讀
原標題:視覺如何模型統一?牛津大學Shuyang Sun博士論文《邁向統一視覺感知》全面闡述
關鍵字:視覺,粒度,報告,任務,模型
文章來源:人工智能學家
內容字數:0字
內容摘要:
來源:專知
來自牛津大學Shuyang (Kevin) Sun博士論文《Towards Unified Visual Perception 》值得關注!探討統一視覺感知系統的構建。
Shuyang (Kevin) Sun
牛津大學Torr視覺組的DPhil(博士)學生,導師為Philip Torr教授和Victor Prisacariu教授。曾在悉尼大學SIGMA實驗室攻讀碩士學位,師從Ouyang Wanli教授。有幸與谷歌研究院的Weijun Wang和Liang-Chieh Chen,Intel ISL的Vladlen Koltun、Philipp Kr?henbühl和René Ranftl緊密合作。于2016年在中國大學獲得軟件工程學士學位。目前,他的研究重點是構建具有統一感知的綜合視覺系統。
https://kevin-ssy.github.io/
本論文通過利用視覺Transformer(Vision Transformers, ViTs)的能力,探索計算機視覺中視覺感知的前沿領域,旨在創建一個統一的框架來應對跨任務和跨粒度的挑戰。我們從人類視覺系統在不同細節層次處理
原文鏈接:視覺如何模型統一?牛津大學Shuyang Sun博士論文《邁向統一視覺感知》全面闡述
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...