<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        字節(jié)發(fā)布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態(tài)1年前 (2024)發(fā)布 量子位
        411 0 0

        字節(jié)發(fā)布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態(tài)歡迎閱讀

        原標題:字節(jié)發(fā)布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024
        關鍵字:字節(jié)跳動,模型,視覺,準確率,特征
        文章來源:量子位
        內容字數:4381字

        內容摘要:


        允中 發(fā)自 凹非寺量子位 | 公眾號 QbitAI視覺語言模型屢屢出現新突破,但ViT仍是圖像編碼器的首選網絡結構。
        字節(jié)提出新基礎模型——ViTamin,專為視覺語言時代設計。
        在使用相同的數據集和訓練方案時,ViTamin在ImageNet零樣本準確率上比ViT提高了2.0%。
        此外在分類、檢索、開放詞匯檢測和分割、多模態(tài)大語言模型等60個不同基準上都表現出了良好的結果。
        當進一步擴展參數規(guī)模時,ViTamin-XL僅有436M參數,卻達到了82.9%的ImageNet零樣本準確率,超過了擁有十倍參數(4.4B)的EVA-E。
        最終這一成果,入選計算機視覺頂會CVPR2024。
        視覺語言時代新基準在視覺語言時代下,如何設計一個更好可擴展的視覺模型?
        在ImageNet時代,新的視覺模型在ImageNet數據集得以驗證,也造就了不斷有新的視覺模型涌現。但在視覺語言時代,新的視覺模型鮮為人見。
        此外,基于現有常見視覺模型,在面對比ImageNet數據規(guī)模還大的情況下表現又是如何?研究團隊們測試了幾種常見模型,包括純Transformer的ViT,純卷積網絡的ConvNeXt,以及混合卷


        原文鏈接:字節(jié)發(fā)布視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業(yè)新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产亚洲午夜精品| 亚洲av无码一区二区三区观看| 亚洲国产欧洲综合997久久| 国内精品免费麻豆网站91麻豆 | 亚洲精品一级无码中文字幕| 亚洲成a人无码亚洲成www牛牛| 手机在线免费视频| 亚洲国产区男人本色| 国产成人高清精品免费软件| 国产精品亚洲二区在线| 午夜免费福利网站| 国产精品亚洲一区二区无码| 成人伊人亚洲人综合网站222| 无忧传媒视频免费观看入口| 亚洲国产成人精品久久久国产成人一区二区三区综 | 女人张开腿给人桶免费视频 | 国产精品视频永久免费播放| 亚洲欧洲无卡二区视頻| 日本免费电影一区| 日韩大片免费观看视频播放| 亚洲午夜未满十八勿入网站2| 久久青草免费91线频观看不卡| 亚洲精品高清视频| 99久久综合国产精品免费| 中文字幕亚洲男人的天堂网络| 日本免费中文字幕在线看| 又硬又粗又长又爽免费看| 亚洲精品少妇30p| a拍拍男女免费看全片| 亚洲精品精华液一区二区 | 在线播放免费人成视频网站| 国产亚洲人成无码网在线观看| 日本免费一区二区三区| 亚洲午夜福利在线视频| 亚洲色偷偷狠狠综合网| 中文字幕视频免费| 色婷婷六月亚洲综合香蕉| 亚洲成在人线av| 女人18毛片a级毛片免费| AAAAA级少妇高潮大片免费看 | 亚洲黄色在线观看|