橫掃16大榜單,最強開源單目深度估計算法來了,精度可以直接用于3D重建|TPAMI 2024
AIGC動態(tài)歡迎閱讀
原標題:橫掃16大榜單,最強開源單目深度估計算法來了,精度可以直接用于3D重建|TPAMI 2024
關(guān)鍵字:深度,尺度,模型,數(shù)據(jù),相機
文章來源:量子位
內(nèi)容字數(shù):0字
內(nèi)容摘要:
Metric3Dv2團隊 投稿量子位 | 公眾號 QbitAI單目深度估計新成果來了!
方法名為Metric3D v2,是CVPR單目深度估計挑戰(zhàn)賽冠軍方案Metric3D的加強版。
用一套模型參數(shù),在未知環(huán)境中,同時解決帶尺度深度估計和法向估計兩個問題。
可用于生成真實世界的幾何估計:
在密集場景和特殊樣本上也有較好效果:
無需微調(diào)和優(yōu)化,可直接用于無人機感知:
無需調(diào)整尺度參數(shù),提供單幀3D點云,其精度可以直接用于3D重建:
可部分替代物理深度估計工具,用于增強自動駕駛場景的單目SLAM:
Metric3D v2在16個單目深度和法向估計基準榜單上拿下SOTA,涵蓋絕對深度、相對深度和法向估計的域內(nèi)和域外測試。
不做尺度對齊或微調(diào),在KITTI上的單目深度估計相對誤差可低至5%。
這項工作由來自香港科技大學(xué)、阿德萊德大學(xué)、西湖大學(xué)、英特爾、香港大學(xué)、浙江大學(xué)的研究人員共同打造,目前已被AI頂刊TPAMI接收。
單目深度估計受限于尺度二義性單目深度估計技術(shù)在計算機視覺領(lǐng)域具有重要意義。這項技術(shù)能從單幅2D圖像中推斷出場景的3D結(jié)構(gòu),為眾多應(yīng)用提供了關(guān)鍵支持。
在傳統(tǒng)領(lǐng)域,單目深度估計
原文鏈接:橫掃16大榜單,最強開源單目深度估計算法來了,精度可以直接用于3D重建|TPAMI 2024
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: