<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        VSI-Bench

        AI工具5個月前發布 AI工具集
        618 0 0

        VSI-Bench – 李飛飛謝賽寧團隊推出的視覺空間智能基準測試集

        VSI-Bench是一種全新的視覺空間智能基準測試集,由李飛飛、謝賽寧及其研究團隊共同開發,旨在評估多模態大型語言模型(MLLMs)在空間認知和理解方面的能力。該基準測試集涵蓋了超過5000個問題-答案對,基于近290個真實室內場景視頻,涉及住宅、辦公室以及工廠等多種環境。VSI-Bench的設計包括多種任務類型,如配置型任務、測量估計和時空任務,旨在系統性地測試和提升MLLMs的視覺空間智能表現。

        VSI-Bench是什么

        VSI-Bench(Visual-Spatial Intelligence Benchmark)是由李飛飛、謝賽寧及其研究團隊推出的一項視覺空間智能基準測試集,專門用于評估多模態大型語言模型(MLLMs)在空間認知與理解能力方面的表現。該測試集包含超過5000個問答對,基于近290個真實室內場景視頻,涵蓋住宅、辦公室和工廠等多種環境。VSI-Bench的任務類型多樣,包括配置型任務(如物體計數和相對距離)、測量估計(如物體尺寸和房間大小)以及時空任務(如物體出現順序),旨在系統地測試和提高MLLMs在視覺空間智能方面的能力。

        VSI-Bench

        VSI-Bench的主要功能

        • 視覺空間智能評估:量化多模態大型語言模型(MLLMs)在視覺空間智能上的表現,包括空間關系的感知、理解及記憶能力。
        • 標準化基準測試:提供一個包含5000多個問答對的標準化測試集,用于基準測試和不同MLLMs在視覺空間任務中的性能比較。
        • 任務多樣性:涵蓋配置型任務(如物體計數、相對距離、相對方向和路線規劃)、測量估計(如物體尺寸、房間大小和絕對距離)以及時空任務(如物體出現順序),全面反映視覺空間智能的多個維度。
        • 視頻理解能力:通過視頻輸入測試MLLMs對連續時間性信息的理解,模擬人類觀察世界的方式,相較于靜態圖像更具真實性。
        • 數據質量控制:通過人工審核確保數據的高質量,有效消除歧義和錯誤標注,從而提高測試結果的可信度。

        VSI-Bench的技術原理

        • 數據集構建:基于多個公共室內3D場景重建數據集(如ScanNet、ScanNet++和ARKitScenes),提供高保真度的視頻掃描和對象級別的3D注釋。
        • 問題-答案對生成:利用數據集中的元信息(如對象類別和邊界框)和問題模板自動生成問答對,同時對路線規劃任務進行人工標注。
        • 質量控制措施:實施人工審核流程,確保問題的清晰性和無歧義性,對錯誤或模糊的問題進行追溯和修正。
        • 模型評估方法:在零樣本設置下評估多種視頻支持的MLLMs,采用默認提示進行測試,并使用精確匹配和模糊匹配作為主要評估標準。
        • 性能指標設定:針對多項選擇題(MCA)任務使用準確度(ACC),對于數值答案(NA)任務引入新的度量標準——平均相對準確度(MRA)。
        • 認知圖生成:引導MLLMs預測視頻中對象的中心位置,從而生成認知圖,評估模型的內部空間表示和記憶能力。

        VSI-Bench的項目地址

        VSI-Bench的應用場景

        • 機器人導航與人機交互:在機器人技術領域,通過評估和訓練MLLMs,提升其對空間布局的理解,增強機器人在未知環境中的導航與避障能力。
        • 增強現實(AR)與虛擬現實(VR):在AR和VR應用中,幫助MLLMs更好地理解用戶的物理空間環境,從而提供更加自然的交互體驗。
        • 自動駕駛技術:自動駕駛系統需具備精準的空間理解能力,以應對復雜交通場景,VSI-Bench為支持自動駕駛的視覺空間智能系統的開發與測試提供了基礎。
        • 智能家居技術:智能家居系統需要能夠理解居住空間的布局及物置,VSI-Bench幫助訓練MLLMs,以提升其在智能家居控制及自動化方面的表現。
        • 室內設計與建筑規劃:評估MLLMs在空間規劃和設計方面的應用,助力系統提供更合理的布局建議。
        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲午夜无码AV毛片久久| 亚洲婷婷五月综合狠狠爱| 色吊丝最新永久免费观看网站| 成人毛片18女人毛片免费视频未 | 日韩精品无码免费专区午夜不卡| 国产午夜无码视频免费网站| 亚洲日本一线产区和二线| 国产精品成人免费一区二区| 久久亚洲中文字幕精品一区| 美女啪啪网站又黄又免费| 久久国产乱子免费精品| 亚洲成a人片在线观看无码| 亚洲成AV人影片在线观看| 久久99毛片免费观看不卡| 亚洲AⅤ无码一区二区三区在线| 亚洲网站在线观看| 精品一区二区三区无码免费直播| 在线观看国产情趣免费视频| 国产精品自拍亚洲| 成人免费大片免费观看网站| 亚洲精品动漫免费二区| 免费一级毛片在线观看| 在线观看亚洲AV日韩AV| 国产免费观看网站| 精品国产免费一区二区三区| 日韩高清在线高清免费| 爱情岛论坛免费视频| 亚洲国产日韩在线视频| 最近免费中文字幕mv在线电影| 在线观看亚洲av每日更新| 亚洲欧美日韩自偷自拍| 夜色阁亚洲一区二区三区| 中文字幕免费不卡二区| 亚洲专区中文字幕| vvvv99日韩精品亚洲| 最近中文字幕大全免费版在线 | 免费看国产精品3a黄的视频| 曰批全过程免费视频观看免费软件| 国产AV无码专区亚洲AV手机麻豆| 1000部拍拍拍18勿入免费视频下载| 亚洲va中文字幕无码久久|