<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態1年前 (2024)發布 算法邦
        537 0 0

        字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        AIGC動態歡迎閱讀

        原標題:字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024
        關鍵字:字節跳動,模型,侵權,視覺,準確率
        文章來源:算法邦
        內容字數:4384字

        內容摘要:


        文章轉載自公眾號:量子位,本文只做學術/技術分享,如有侵權,聯系刪文。
        視覺語言模型屢屢出現新突破,但ViT仍是圖像編碼器的首選網絡結構。
        字節提出新基礎模型——ViTamin,專為視覺語言時代設計。
        在使用相同的數據集和訓練方案時,ViTamin在ImageNet零樣本準確率上比ViT提高了2.0%。
        此外在分類、檢索、開放詞匯檢測和分割、多模態大語言模型等60個不同基準上都表現出了良好的結果。
        當進一步擴展參數規模時,ViTamin-XL僅有436M參數,卻達到了82.9%的ImageNet零樣本準確率,超過了擁有十倍參數(4.4B)的EVA-E。
        最終這一成果,入選計算機視覺頂會CVPR2024。
        01視覺語言時代新基準在視覺語言時代下,如何設計一個更好可擴展的視覺模型?
        在ImageNet時代,新的視覺模型在ImageNet數據集得以驗證,也造就了不斷有新的視覺模型涌現。但在視覺語言時代,新的視覺模型鮮為人見。
        此外,基于現有常見視覺模型,在面對比ImageNet數據規模還大的情況下表現又是如何?研究團隊們測試了幾種常見模型,包括純Transformer的ViT,純卷積網絡的C


        原文鏈接:字節提出視覺基礎模型ViTamin,多項任務實現SOTA,入選CVPR2024

        聯系作者

        文章來源:算法邦
        作者微信:allplusai
        作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關注模型與應用。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲成AV人在线观看天堂无码| 99精品全国免费观看视频| 免费人成网站在线播放| 亚洲AV男人的天堂在线观看| 最近免费中文字幕大全免费| 亚洲AV无码一区二区三区DV | 亚洲精品视频免费在线观看| 亚洲国产精品免费视频| 国产在线精品一区免费香蕉| 又黄又爽一线毛片免费观看| 黄页网址大全免费观看12网站| 亚洲av无码成人精品区一本二本| 一级毛片一级毛片免费毛片| 亚洲国产精品专区在线观看| 牛牛在线精品观看免费正| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 最近的中文字幕大全免费8| 久久久久亚洲av无码专区喷水 | 亚洲福利精品电影在线观看| 亚洲黄片手机免费观看| 久久精品国产亚洲综合色| 99久久人妻精品免费一区| 亚洲最大的黄色网| 国产成人免费ā片在线观看| 亚洲处破女AV日韩精品| 99re在线视频免费观看| 亚洲一区二区三区写真| 内射无码专区久久亚洲| 亚洲AV日韩综合一区尤物| 国产v片免费播放| 中文字幕久无码免费久久| 亚洲男人天堂影院| 97人妻精品全国免费视频| 久久精品国产亚洲AV无码麻豆| 我要看WWW免费看插插视频| 成人免费网站久久久| 久久亚洲sm情趣捆绑调教| 国产精品无码一区二区三区免费| 国产成人高清精品免费观看| 亚洲国产日韩在线一区| 亚洲精品亚洲人成在线观看下载|