国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

多模態(tài)視覺token壓縮方法(持續(xù)更新)

AIGC動態(tài)12個月前發(fā)布 智猩猩GenAI
454 0 0

導讀作者為葡萄是貓原文來自知乎,地址:https://zhuanlan.zhihu.com/p/8776092026本文只做學術/技術分享,如有侵權,聯(lián)系刪文。01簡要為提升MLLM對圖像、視頻的理解能力,最有效的方式就是提升visual token的個數(shù),隨之而來的則是訓練、推理耗時的增加。因此,對視覺token進行壓縮以提取最有用的信息至關重要。下文基于個人理解,進行梳理。已知技術方案概覽:1.線性映射:采用多層MLP進行壓縮,如Qwen2-VL中2.下采樣:采用Pooling(可以是不同的pool采樣方式),如LLaVA-OneVision3.Pixel-Shuffle:用通道換空間,如InternVL1.1及后續(xù)系列4.Q-former:新增learned query實現(xiàn)視覺token壓縮,如Flamingo、BLIP25.模型動態(tài)壓縮:改造模型或注意力機制實現(xiàn)視覺token采樣,如FocusLLaVA、mPlug-owl36.Training-free:在推理的各個階段通過各種方式實現(xiàn)token壓縮,如MustDrop、FiCoCO其中,線性映射、下采樣方法較易理解,不展開贅述Pixel-Shuffle該方案是用通道換空間,即減少空間增加通道,數(shù)據(jù)維度變化:[N, W, H, C] -> [N, W*s, H*s, C//(s^2)](當s>1時,則實現(xiàn)上采樣;當s<1時,則實現(xiàn)下采樣)在InternVL1.1,利用此方案,將視覺token從1024壓縮到256個(分辨率448×448,patch_size 14,s=0.5),代碼片段:def pixel_shuffle(self, x, scale_factor=0.5): n, w, h, c = x.size() # N, W, H, C –> N, W, H * scale, C // scale x = x.view(n, w, int(h * scale_factor), int(c / scale_factor)) # N, W, H * scale, C // scale –> N, H * scale, W, C // scale x = x.permute(0, 2, 1, 3).contiguous() # N, H * scale, W, C // scale –> N, H * scale, W * scale, C // (scale ** 2) x = x.view(n, int(h * scale_factor), int(w * scale_factor), int(c / (scale_factor * scale_factor))) if self.ps_version == ‘v1’: warnings.warn(“In ps_version ‘v1’, the height and width have not been swapped back, ” ‘which results in a transposed image.’) else: x = x.permute(0, 2, 1, 3).contiguous() return xQ-Former該類方案是引入可學習的embedding(learned query),和視覺token計算注意力,以實現(xiàn)token壓縮。最早在Flamingo中是Perceiver Resampler,BLIP2中是Q-Former(注意,在視覺token和文本交互時,blip2更簡化直接拼接視覺token和文本token,而flamingo中采用了gated xattn-dense)Flamingo中的Perceiver ResamperBLIP2中的learned queries02模型動態(tài)壓縮該方案也是通過改造模型,讓模型在端到端訓練中,自適應抉擇最重要的token,實現(xiàn)視覺token的動態(tài)壓縮。(歸類名稱是臨時起的。。應該有更好的代稱)FocusLLaVA1.論文:FocusLLaVA: A Coarse-to-Fine Approach for Efficient and Effective Visual Token Compression2.方案:提出vision-guided sampler(下圖b)實現(xiàn)視覺token壓縮(LLM中也提出了text-guided samper,下圖c),其中vision-guided sampler分成兩步:多尺度降采樣:將vit后的全局feature map X再按window切分,對切分后的子特征圖按照不同的max-pool(如4×4,2×2,1×1,類似SPP操作)得到出一組token集合多尺度選擇:引入MoE思想,將不同尺寸的降采樣當做專家模型,對上一步的token集合拉平后計算其和vit后的全局feature map X計算相似度,并保留top的token,即實現(xiàn)token壓縮mPlug-owl31.論文:mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models2.方案:該方案不是直接壓縮token,改造注意力機制為HyperAttnTransformer,視覺和文本共享q矩陣,并各自保留k&v矩陣,實現(xiàn)整個模型參數(shù)量降低,提升推理速度Hyper Attention TransformerVLoRA1.論文:Visual Perception by Large Language Model’s Weights2.方案:該方案不直接將視覺token輸入到LLM中,而是通過類似LoRA的方式將Visual token作為參數(shù)權重,引入到LLM中VLoRAPerceptual Weights Generator03Training-freeMustDrop1.論文:Multi-Stage Vision Token Dropping: Towards Efficient Multimodal Large Language Model2.方案:該方案側重在推理時對token進行壓縮,在MLLM推理的各個階段提出相應的壓縮方案Visual-encode stage:計算相鄰token的相似度Prefill stage:dual-attention estimation,先通過global-attention filtering(計算視覺token和所有text token的相似度)過濾出“可能不相關的token集合”,再通過individual-attention filtering(計算視覺token和單個文本token的相似度)過濾出“真正不相關的token集合”Decode stage:output-aware cache策略,在decode時對模型不同層進行不同尺度的剪枝,最后保留最少的token輸出FiCoCO1.論文:Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration2.方案:將token的壓縮方式分解成Filter-Correlate-Compress三個階段,實現(xiàn)training-free的token壓縮框架,并將該框架分別應用于模型的不同部分,即Visual encode階段(即FiCoCo-V)、LLM decode階段(即FiCoCo-L)、visual encode和LLM decode(即FiCoCo-VL),不同部分的實現(xiàn)略有不同。該框架的三個階段具體情況如下:filter階段:解決要丟棄哪些token的問題,通過attention矩陣和cls token計算得到token冗余度,再篩選topKCorrellate階段:解決被丟棄的信息要保留到哪里的問題,通過計算topK token和剩余token的相關性實現(xiàn)Compress階段:解決如何融合token以保留相關信息的問題,通過相關性計算token-wise的壓縮權重實現(xiàn)FiCoCo系列FiCoCo在模型不同部分的偽代碼END點擊下方名片即刻關注我們

閱讀原文
? 版權聲明
蟬鏡AI數(shù)字人

相關文章

蟬鏡AI數(shù)字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        国产精品一区免费在线观看| av成人免费在线观看| 麻豆精品久久精品色综合| 欧美日本免费一区二区三区| 亚洲精品欧美激情| 欧美日韩激情在线| 久色婷婷小香蕉久久| 欧美成人乱码一区二区三区| 国产不卡视频一区| 亚洲欧美激情插 | 精品欧美一区二区久久| 精品午夜久久福利影院| 国产精品久久久久久久久免费丝袜| 99精品久久只有精品| 亚洲国产精品一区二区久久 | 亚洲天堂成人网| 欧美精品在线一区二区三区| 国产综合色视频| 亚洲欧洲美洲综合色网| 欧美二区三区91| 岛国一区二区三区| 日韩国产欧美三级| 中文字幕五月欧美| 日韩欧美国产电影| 色婷婷综合久久| 国产mv日韩mv欧美| 美女视频一区在线观看| 国产精品福利av | 精品视频一区三区九区| 韩国三级中文字幕hd久久精品| 亚洲婷婷综合久久一本伊一区| 日韩视频免费观看高清完整版 | 欧美xxxx在线观看| 欧美色图第一页| 成人黄色av网站在线| 日本美女一区二区三区视频| 成人欧美一区二区三区视频网页| 日韩情涩欧美日韩视频| 日本精品一区二区三区四区的功能| 另类小说综合欧美亚洲| 亚洲电影一区二区三区| 中文字幕欧美一区| 国产丝袜在线精品| 欧美videos中文字幕| 欧美丰满少妇xxxxx高潮对白| 色综合久久九月婷婷色综合| 国产乱码精品一区二区三区忘忧草 | 欧美精品一区视频| 欧美一区二区三区婷婷月色| 欧美三级日韩在线| 在线观看日韩一区| 色噜噜偷拍精品综合在线| 国产91露脸合集magnet| 国内久久婷婷综合| 国产精品一区二区男女羞羞无遮挡| 久久精品国产一区二区| 日韩国产精品久久| 日韩av网站免费在线| 日韩中文字幕一区二区三区| 午夜视频一区二区三区| 石原莉奈在线亚洲三区| 天天操天天综合网| 日韩av电影免费观看高清完整版 | 亚洲蜜臀av乱码久久精品| 国产精品美女久久久久av爽李琼| 久久精品人人做人人爽人人| 久久久欧美精品sm网站| 中文字幕乱码亚洲精品一区 | 亚洲国产人成综合网站| 五月天久久比比资源色| 欧美a级一区二区| 美国毛片一区二区三区| 国产乱淫av一区二区三区| 风间由美一区二区三区在线观看 | 亚洲美女免费在线| 亚洲人精品午夜| 日韩黄色免费网站| 精品一区二区三区视频| 国产激情91久久精品导航| 国产成人自拍高清视频在线免费播放| 国产乱子轮精品视频| jiyouzz国产精品久久| 91福利社在线观看| 欧美一区二区在线播放| 国产日产欧美一区二区视频| 亚洲免费观看高清完整版在线 | 亚洲精品视频在线看| 日韩av网站在线观看| 成人午夜激情影院| 欧美日韩国产首页| 久久久99精品久久| 午夜伦理一区二区| 成人激情开心网| 欧美一区二区三区在线观看视频| 国产精品天美传媒沈樵| 三级精品在线观看| 91网站在线播放| 国产亚洲1区2区3区| 亚洲成在人线在线播放| 高清在线成人网| 欧美日韩国产综合一区二区| 久久九九影视网| 日韩国产欧美在线视频| 99精品国产99久久久久久白柏| 日韩欧美综合在线| 一区二区三区四区不卡在线| 韩国毛片一区二区三区| 欧美片在线播放| 亚洲美女在线一区| 国产成人精品一区二区三区网站观看| 精品视频资源站| 一区二区三区中文字幕| 国产成人精品免费| 日韩欧美国产一区二区在线播放| 曰韩精品一区二区| 高清不卡一区二区| 久久久久久久久久久久久女国产乱 | 一区二区久久久久久| 99国产精品国产精品毛片| 久久久久久久久久久99999| 美女网站色91| 欧美大片在线观看一区二区| 午夜精品影院在线观看| 欧美婷婷六月丁香综合色| 一区二区三区在线免费观看| 成人免费毛片高清视频| 久久久电影一区二区三区| 精品一区二区综合| 337p日本欧洲亚洲大胆色噜噜| 日韩精品一二三| 欧美日韩久久一区二区| 亚洲va国产天堂va久久en| 91久久精品一区二区| 一区二区不卡在线播放| 欧美在线视频全部完| 亚洲一二三四区| 在线观看视频一区二区欧美日韩| 亚洲在线成人精品| 欧美吻胸吃奶大尺度电影| 水野朝阳av一区二区三区| 91精品国产综合久久久蜜臀粉嫩| 日韩电影免费一区| 欧美大肚乱孕交hd孕妇| 国产成人免费xxxxxxxx| 国产精品毛片a∨一区二区三区| 波多野结衣视频一区| 一区二区三区中文免费| 欧美一区二区三区在线观看 | 亚洲va欧美va人人爽| 欧美绝品在线观看成人午夜影视| 亚洲成人午夜影院| 日韩一区二区视频| 成人av高清在线| 亚洲一区二区三区小说| 欧美成人欧美edvon| 成人久久18免费网站麻豆 | 国产精品另类一区| 欧美性生活久久| 久久99久久99| 成人免费一区二区三区视频| 欧美日韩亚洲综合| 国产成人av一区二区| 一区二区三区加勒比av| 欧美一区二区三区人| 高清国产一区二区三区| 婷婷中文字幕综合| 国产欧美一区二区三区沐欲| 欧美视频在线一区二区三区 | 99久久综合99久久综合网站| 日韩在线观看一区二区| 国产精品国产自产拍高清av| 欧美日韩日日骚| 高清成人在线观看| 日韩**一区毛片| 亚洲啪啪综合av一区二区三区| 欧美一区中文字幕| 色乱码一区二区三区88| 国产最新精品免费| 日韩电影免费在线看| 亚洲欧美偷拍三级| 日本一区二区免费在线观看视频| 91精品黄色片免费大全| 日本高清无吗v一区| 豆国产96在线|亚洲| 麻豆传媒一区二区三区| 亚洲综合无码一区二区| 中文字幕高清不卡| 久久夜色精品国产欧美乱极品| 欧美日韩国产综合一区二区| 99国产精品99久久久久久| 国产91丝袜在线播放0| 九九国产精品视频| 美腿丝袜亚洲综合| 日本aⅴ亚洲精品中文乱码| 亚洲精品国产无天堂网2021| 国产精品毛片高清在线完整版| 久久久久久久久久看片| 日韩一区二区三区电影| 3d成人动漫网站| 日韩一二在线观看|