精確率提升7.8%!首個多模態(tài)開放世界檢測大模型MQ-Det登NeurIPS 2023
AIGC動態(tài)歡迎閱讀
原標(biāo)題:精確率提升7.8%!首個多模態(tài)開放世界檢測大模型MQ-Det登NeurIPS 2023
關(guān)鍵字:文本,模型,目標(biāo),視覺,示例
文章來源:新智元
內(nèi)容字?jǐn)?shù):10172字
內(nèi)容摘要:新智元報道編輯:LRS【新智元導(dǎo)讀】MQ-Det在已有基于文本查詢的檢測大模型基礎(chǔ)上,加入了視覺示例查詢功能,同時保留了高泛化性能和細(xì)粒度多模態(tài)查詢,在ODinW-35基準(zhǔn)上實現(xiàn)SOTA性能。目前的開放世界目標(biāo)檢測模型大多遵循文本查詢的模式,即利用類別文本描述在目標(biāo)圖像中查詢潛在目標(biāo),但這種方式往往會面臨「廣而不精」的問題。論文鏈接:https://arxiv.org/abs/2305.18980…
原文鏈接:點此閱讀原文:精確率提升7.8%!首個多模態(tài)開放世界檢測大模型MQ-Det登NeurIPS 2023
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對人類社會與文明進(jìn)化的影響,領(lǐng)航中國新智能時代。
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...