首個公開發(fā)表的SAR圖像目標識別基礎模型!國防科大劉永祥&劉麗教授團隊提出SARATR-X 1.0
SAR(合成孔徑雷達)圖像解譯領域新進展。

原標題:首個公開發(fā)表的SAR圖像目標識別基礎模型!國防科大劉永祥&劉麗教授團隊提出SARATR-X 1.0
文章來源:機器之心
內容字數(shù):8929字
國防科技大學團隊突破SAR目標識別瓶頸,打造首個公開SAR圖像目標識別基礎模型SARATR-X
合成孔徑雷達(SAR)目標識別是SAR圖像智能解譯的核心,但面臨技術和生態(tài)兩大挑戰(zhàn)。技術層面,現(xiàn)有方法多為有監(jiān)督、靜態(tài)、單任務的,導致計算冗余、泛化能力不足等問題;生態(tài)層面,缺乏高質量的開源數(shù)據(jù)和評估基準。為解決這些問題,國防科技大學劉永祥&劉麗教授團隊研發(fā)了首個公開發(fā)布的SAR圖像目標識別基礎模型SARATR-X 1.0,并構建了相應的開源數(shù)據(jù)集和評估基準,為SAR圖像解譯領域技術創(chuàng)新和發(fā)展生態(tài)帶來了突破。
1. SARATR-X 1.0的核心技術突破
SARATR-X 1.0在技術層面取得了多項突破:首先,它率先開展了基于自監(jiān)督學習的SAR目標特征表示學習,創(chuàng)新性地提出了SAR-JEPA框架,該框架僅預測SAR圖像稀疏且重要的梯度特征表示,有效抑制了相干斑噪聲。其次,SARATR-X 1.0(0.66億參數(shù),基于Transformer架構)突破了對大規(guī)模高質量標注數(shù)據(jù)的依賴,大幅提升了預訓練基礎模型的認知能力。 該模型采用HiViT架構,能夠更好地處理遙感圖像的空間表示,尤其針對大圖像中的小目標。
2. 構建完善的SAR目標識別開源生態(tài)
在生態(tài)層面,團隊致力于構建良好的開源生態(tài):規(guī)范和整合已有公開數(shù)據(jù)集,形成較大規(guī)模SAR圖像陸海目標識別數(shù)據(jù)集SARDet-180K;構建了新的SAR車輛目標識別數(shù)據(jù)集NUDT4MSTAR(40種車輛型號,規(guī)模超過同類型數(shù)據(jù)集十倍);并開源相關的目標識別算法代碼和評估基準。
3. SARATR-X 1.0的性能及可擴展性
SARATR-X 1.0在多個下游目標識別任務(包括小樣本目標識別、穩(wěn)健目標識別、目標檢測等)上取得了國際先進或領先水平。例如,在細粒度車輛MSTAR數(shù)據(jù)集中,其目標分類性能優(yōu)于現(xiàn)有的SSL方法,提升了4.5%。在目標檢測方面,平均提升約4%。研究團隊還對模型的可擴展性進行了研究,結果表明,隨著數(shù)據(jù)和參數(shù)量的增加,下游任務性能顯著提升,展現(xiàn)了良好的可擴展性。
4. 未來的發(fā)展方向
團隊正在研制SARATR-X 2.0,預計參數(shù)規(guī)模將達到3億,SAR目標切片樣本規(guī)模200萬,并將收集的數(shù)據(jù)形成開源數(shù)據(jù)集,進一步服務生態(tài)建設。
5. 研究成果的影響
該團隊的代表性工作已引起國內外同行的廣泛關注,獲得積極評價,被國際頂級學術期刊《IEEE Transactions on Image Processing》和《ISPRS Journal of Photogrammetry and Remote Sensing》錄用或發(fā)表。 國際同行對其工作給予了高度評價,例如ISPRS Journal主編Clement Mallet認為SAR-JEPA首次將聯(lián)合嵌入預測框架概念應用于對地觀測,并專門用于SAR數(shù)據(jù)。
聯(lián)系作者
文章來源:機器之心
作者微信:
作者簡介:專業(yè)的人工智能媒體和產業(yè)服務平臺

粵公網(wǎng)安備 44011502001135號