<label id="3dn8r"><mark id="3dn8r"></mark></label>

<span id="3dn8r"></span>

<span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

<tfoot id="sagwa"><delect id="sagwa"></delect></tfoot>

<strike id="sagwa"></strike>

<code id="sagwa"></code>

<abbr id="sagwa"></abbr>

<code id="sagwa"></code>

<center id="sagwa"></center>

字節豆包、武大提出 CAL：通過視覺相關的 token 增強多模態對齊效果

AIGC動態11個月前發布機器之心

453 0 0

字節豆包、武大提出 CAL：通過視覺相關的 token 增強多模態對齊效果

AIGC動態歡迎閱讀

原標題：字節豆包、武大提出 CAL：通過視覺相關的 token 增強多模態對齊效果
關鍵字：字節跳動,模型,文本,圖片,豆包
文章來源：機器之心
內容字數：0字

內容摘要：

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或者聯系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com當前主流的視覺語言模型（VLM）主要基于大語言模型（LLM）進一步微調。因此需要通過各種方式將圖像映射到 LLM 的嵌入空間，然后使用自回歸方式根據圖像 token 預測答案。
在這個過程中，模態的對齊是通過文本 token 隱式實現的，如何做好這一步的對齊非常關鍵。
針對這一問題，大學、字節跳動豆包大模型團隊和中國科學院大學的研究人員提出了一種基于對比學習的文本 token 篩選方法（CAL），從文本中篩選出與圖像高度相關的 token，并加大其損失函數權重，從而實現更精準的多模態對齊。論文鏈接：https://arxiv.org/pdf/2405.17871
代碼鏈接：https://github.com/foundation-multimodal-m

原文鏈接：字節豆包、武大提出 CAL：通過視覺相關的 token 增強多模態對齊效果

聯系作者

文章來源：機器之心
作者微信：almosthuman2014
作者簡介：專業的人工智能媒體和產業服務平臺

# AIGC動態 # 圖片 # 字節跳動 # 文本 # 模型 # 豆包

? 版權聲明

文章版權歸作者所有，未經允許請勿轉載。

Trae官網

相關文章

Trae官網

暫無評論

暫無評論...

主站蜘蛛池模板：男人天堂2018亚洲男人天堂| 免费中文字幕一级毛片| 亚洲中文字幕无码av| 在线a毛片免费视频观看| 性做久久久久免费看| 7m凹凸精品分类大全免费| 亚洲AV成人一区二区三区在线看| 国产亚洲美女精品久久久2020| 青娱乐免费在线视频| 亚洲国产综合专区电影在线 | 男女免费观看在线爽爽爽视频| 一级特级女人18毛片免费视频| 亚洲第一精品在线视频| 鲁丝片一区二区三区免费| 美女扒开屁股让男人桶爽免费| 永久黄网站色视频免费| 成年在线网站免费观看无广告| 午夜免费啪视频在线观看 | 亚洲毛片免费视频| 青青操免费在线视频| 成人精品一区二区三区不卡免费看| 老妇激情毛片免费| 一级毛片试看60分钟免费播放| 又长又大又粗又硬3p免费视频| 亚洲AV无码专区在线播放中文| 亚洲伊人久久精品影院| 亚洲国产精品久久久久婷婷老年 | 100部毛片免费全部播放完整| 日韩精品极品视频在线观看免费| 91久久青青草原线免费| 无码专区永久免费AV网站| 韩国免费a级作爱片无码| 国产一区二区免费| 人禽杂交18禁网站免费| aaa毛片免费观看| 99国产精品永久免费视频| 免费在线黄色网址| 亚洲高清中文字幕综合网| 亚洲精品国产av成拍色拍| 中文永久免费观看网站| 67194成是人免费无码|

<del id="iseuk"><abbr id="iseuk"></abbr></del>

<button id="iseuk"><dl id="iseuk"></dl></button>

<small id="iseuk"></small>

<bdo id="iseuk"></bdo>