<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        AIGC動態8個月前發布 新智元
        386 0 0

        MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        AIGC動態歡迎閱讀

        原標題:MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答
        關鍵字:模型,問題,視覺,性能,基準
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:LRS
        【新智元導讀】MMMU-Pro通過三步構建過程(篩選問題、增加候選選項、引入純視覺輸入設置)更嚴格地評估模型的多模態理解能力;模型在新基準上的性能下降明顯,表明MMMU-Pro能有效避免模型依賴捷徑和猜測策略的情況。多模態大型語言模型(MLLMs)在各個排行榜上展現的性能不斷提升,例如GPT-4o在大學水平上的多學科多模態理解和推理(MMMU)基準測試中取得了69.1%的準確率。
        不過,基準測試結果是否真的能反映模型對多樣化主題的深入理解,仍然有爭議,或者說模型是否只是利用了統計模式,而非依靠理解和推理的情況下就能得出正確答案?
        為了解決這一問題并推動多模態AI評估的邊界,MMMU團隊對MMMU基準在健壯性和問題難度上進行提升,新基準MMMU-Pro能夠更準確、更嚴格地評估模型在廣泛的學科領域內真正的多模態理解和推理能力。論文鏈接:https://arxiv.org/abs/2409.02813
        MMMU-Pro的構建過程包括三步:
        1. 過濾掉純文本模型可回答的問題;
        2. 由人類專家將候選選項增加到 10 個,以減少模型蒙對答案的概率;
        3. 引入純視覺輸


        原文鏈接:MMMU華人團隊更新Pro版!多模態基準升至史詩級難度:過濾純文本問題、引入純視覺問答

        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费永久看黄在线观看app| 亚洲国产日韩视频观看| 黄网站色视频免费观看45分钟| 99热免费在线观看| 亚洲国产精品久久66| 久草免费手机视频| 久热综合在线亚洲精品| 四虎成人精品永久免费AV| 亚洲AV无码一区二区乱子伦 | 一级美国片免费看| 亚洲国产精品无码久久九九| 免费一级毛片在线播放视频免费观看永久| 插B内射18免费视频| 精品国产_亚洲人成在线| 吃奶摸下高潮60分钟免费视频| 日本精品久久久久久久久免费| 亚洲伊人久久综合中文成人网| 在线观看免费黄网站| 亚洲综合一区二区精品久久| 成人免费无码大片A毛片抽搐 | 韩国免费a级作爱片无码| 亚洲国产精品无码久久一线| 91成人在线免费视频| 亚洲色精品三区二区一区| 波多野结衣中文一区二区免费| 国产免费黄色无码视频| 久久综合亚洲色一区二区三区| 野花高清在线观看免费完整版中文| 亚洲A∨精品一区二区三区下载| 亚洲av麻豆aⅴ无码电影| 欧洲人成在线免费| 亚洲综合偷自成人网第页色| 免费v片视频在线观看视频| 中文字幕无码免费久久| 亚洲人色大成年网站在线观看| 四虎永久成人免费| 99精品视频免费观看| jzzijzzij在线观看亚洲熟妇| 国产成人精品日本亚洲| 免费无码黄网站在线观看| 国产日韩AV免费无码一区二区三区 |