<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        訓練視覺語言模型VLM的經驗

        AIGC動態10個月前發布 智猩猩GenAI
        480 0 0

        訓練視覺語言模型VLM的經驗

        AIGC動態歡迎閱讀

        原標題:訓練視覺語言模型VLM的經驗
        關鍵字:數據,知乎,侵權,業務,模型
        文章來源:智猩猩GenAI
        內容字數:0字

        內容摘要:


        講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃名~導讀作者為lym
        原文來自知乎,地址:https://zhuanlan.zhihu.com/p/890327005
        本文只做學術/技術分享,如有侵權,聯系刪文。如果可以用prompt解決,盡量用prompt解決,因為訓練(精調)的模型往往通用能力會下降,訓練和長期部署成本都比較高,這個成本也包括時間成本。
        基于prompt確實不行(情況包括格式輸出不穩定、格式輸出基本不對、任務不完全會、任務完全不會等情況,難度逐漸加大),選擇上SFT微調。
        業務場景基本用不到強化學習,強化解決的是最后一公里的問題,可以理解為有兩種非常接近的輸出(這兩種輸出都非常接近目標輸出,此時已經解決了90%的問題),強化學習會對相同的輸入,打壓其中一種不希望的輸出,同時增強另一種更接近目標的希望的輸出(從DPO loss就可以看出)。強化是用來應對細微輸出差異的,并且業務場景優先用DPO,DPO只需要pair對數據,更好構造。PPO的reward model幾乎沒有開源的,需要的數據更多


        原文鏈接:訓練視覺語言模型VLM的經驗

        聯系作者

        文章來源:智猩猩GenAI
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费无码又爽又刺激网站| 在线观看亚洲AV日韩AV| 欧洲乱码伦视频免费国产 | 国产亚洲欧洲精品| 国产福利电影一区二区三区,免费久久久久久久精| 在线免费观看色片| 亚洲AⅤ男人的天堂在线观看| 在线精品免费视频| 麻豆va在线精品免费播放| 亚洲AV无码一区二区三区国产| 男性gay黄免费网站| 亚洲国产a级视频| 中文字幕免费在线观看动作大片| 国产亚洲大尺度无码无码专线 | 边摸边脱吃奶边高潮视频免费| 四虎精品亚洲一区二区三区| 一区二区三区免费视频网站 | 亚洲日韩图片专区第1页| 57pao国产成视频免费播放| 亚洲视频免费观看| 成年人在线免费看视频| 黄页网站在线观看免费| 亚洲人成影院在线无码按摩店| 亚洲视频在线观看免费| 亚洲一区二区三区丝袜| 亚洲成AV人网址| 午夜精品免费在线观看| 在线综合亚洲欧洲综合网站| 亚洲精品成人在线| 99在线热视频只有精品免费| 亚洲中文字幕无码中文| 国产亚洲成归v人片在线观看 | 亚洲欧美日韩综合久久久久| 亚洲M码 欧洲S码SSS222| 亚洲精品免费观看| MM1313亚洲国产精品| 亚洲AV永久纯肉无码精品动漫| 成年人性生活免费视频| 免费无码av片在线观看| 亚洲日韩AV一区二区三区中文| 国产l精品国产亚洲区在线观看|