<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        AIGC動態1年前 (2023)發布 量子位
        890 0 0

        多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        AIGC動態歡迎閱讀

        原標題:多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突
        關鍵字:華為,任務,模型,專家,指令
        文章來源:量子位
        內容字數:4906字

        內容摘要:


        港科大&南科大&華為諾亞方舟實驗室量子位 | 公眾號 QbitAI微調,能讓通用大模型更加適配具體的行業應用。
        但現在,研究人員們卻發現:
        對多模態大模型做“多任務指令微調”,大模型可能會“學得多錯得多”,因為不同任務之間的沖突,導致泛化能力下降。
        △多模態指令微調存在任務沖突舉個例子,多模態問答任務可能要求回復盡可能簡潔準確,文檔理解任務卻會反過來要求大模型盡可能詳細地做出描述。
        不同下游任務指令微調數據分布差異較大,導致一個大模型難以在多個下游任務中均達到最優性能。
        如何解決這個問題?
        來自香港科技大學、南方科技大學和華為諾亞方舟實驗室的聯合研究團隊,受MoE(混合專家模型)開源大模型Mixtral-8×7B的啟發,提出利用稀疏專家模型,打造下游任務泛化性能更好、理解能力更強的多模態大模型。
        具體細節,一起來看。
        多模態指令微調存在任務沖突為了驗證多模態指令微調中不同類型任務數據對模型性能的影響,研究人員將數據進行如下劃分:
        VQA(視覺問答):VQAv2、OKVQA、A-OKVQA、OCRVQA,
        Captioning(圖像描述):COCO Caption、Web CapFilt


        原文鏈接:多模態大模型學雜了能力反下降?新研究:MoE+通用專家解決沖突

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV无码一区二区三区牲色| 亚洲AV成人片色在线观看高潮| 亚洲最大视频网站| 91精品免费观看| 亚洲欧洲国产精品久久| 美女视频黄免费亚洲| 亚洲人成电影网站久久| 成年大片免费视频| 亚洲av无码专区青青草原| 免费一级做a爰片久久毛片潮喷| 国产成人综合亚洲| 亚洲国产综合精品中文字幕 | 污视频在线观看免费| 日韩亚洲人成在线综合日本| 成人电影在线免费观看| 亚洲电影国产一区| 老司机在线免费视频| 亚洲AV电影天堂男人的天堂| 国产成人亚洲精品91专区手机| 在线看片免费人成视频播| 久久久久亚洲AV无码麻豆| 中国在线观看免费国语版| 美女黄色毛片免费看| 久久精品国产亚洲| 丁香花在线观看免费观看| 老司机午夜免费视频| 亚洲福利视频导航| 成人看的午夜免费毛片| 国产精品九九久久免费视频| 亚洲国产精品一区| 老司机永久免费网站在线观看| 九九久久国产精品免费热6| 亚洲AV永久纯肉无码精品动漫| 免费无码肉片在线观看| 永久免费无码日韩视频| 亚洲高清日韩精品第一区| 男女啪啪永久免费观看网站| 免费在线观影网站| 亚洲乱码国产乱码精华| 黑人精品videos亚洲人| 国产片免费在线观看|