AIGC動態歡迎閱讀
原標題:ECCV 2024 | 提升GPT-4V、Gemini檢測任務性能,你需要這種提示范式
關鍵字:物體,提示,任務,目標,沖浪板
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者來自浙江大學、上海人工智能實驗室、香港中文大學、悉尼大學和牛津大學。作者列表:吳逸璇,王逸舟,唐詩翔,吳文灝,賀通,Wanli Ouyang,Philip Torr,Jian Wu。其中,共同第一作者吳逸璇是浙江大學博士生,王逸舟是上海人工智能實驗室科研助理。通訊作者唐詩翔是香港中文大學博士后研究員。
多模態大模型(Multimodal Large Language Models,MLLMs)在不同的任務中表現出了令人印象深刻的能力,盡管如此,這些模型在檢測任務中的潛力仍被低估。在復雜的目標檢測任務中需要精確坐標時,MLLMs 帶有的幻覺又讓它常常錯過目標物體或給出不準確的邊界框。為了讓 MLLMs 賦能檢測,現有的工作不僅需要收集大量高質量的指令數據
原文鏈接:ECCV 2024 | 提升GPT-4V、Gemini檢測任務性能,你需要這種提示范式
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...