国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

MM-Eureka

AI工具7個月前更新 AI工具集
610 0 0

MM-Eureka – 上海AI Lab聯(lián)合上交大等推出的多模態(tài)推理模型

MM-Eureka 是一個由上海人工智能實驗室、上海創(chuàng)智學(xué)院、上海交通大學(xué)和香港大學(xué)的研究者們共同研發(fā)的多模態(tài)推理模型。該模型利用基于規(guī)則的大規(guī)模強(qiáng)化學(xué)習(xí)(RL),將單模態(tài)推理中的關(guān)鍵特性,如回答長度的穩(wěn)定增長、準(zhǔn)確率獎勵和視覺頓悟時刻,成功擴(kuò)展至多模態(tài)場景。

MM-Eureka是什么

MM-Eureka 是一個專門設(shè)計的多模態(tài)推理模型,開發(fā)團(tuán)隊由上海人工智能實驗室、上海創(chuàng)智學(xué)院、上海交通大學(xué)和香港大學(xué)的研究人員組成。該模型通過規(guī)則驅(qū)動的大規(guī)模強(qiáng)化學(xué)習(xí)(RL),將單模態(tài)推理中的重要特性(例如穩(wěn)定的回答長度增長、準(zhǔn)確率獎勵以及視覺頓悟時刻)遷移至多模態(tài)環(huán)境中。

MM-Eureka 提供了兩個核心模型:MM-Eureka-8B 和 MM-Eureka-Zero-38B,分別基于 InternVL2.5-Instruct-8B 和 InternVL2.5-Pretrained-38B。僅使用 54,000 張圖文數(shù)據(jù)進(jìn)行規(guī)則型強(qiáng)化學(xué)習(xí)訓(xùn)練,平均性能便超越了使用 1,000,000 張數(shù)據(jù)的 MPO 模型。MM-Eureka-Zero-38B 僅利用 8,000 張圖文數(shù)學(xué)推理數(shù)據(jù),在自主構(gòu)建的 K12 基準(zhǔn)測試中超過了指令模型 8.2%,在 MathVerse 上的表現(xiàn)也相當(dāng)出色。

MM-Eureka

MM-Eureka的主要功能

  • 多模態(tài)推理能力:MM-Eureka 能夠有效處理文本和視覺信息,擴(kuò)展了大規(guī)模基于規(guī)則的強(qiáng)化學(xué)習(xí)(RL)至多模態(tài)推理領(lǐng)域。
  • 復(fù)現(xiàn)關(guān)鍵特性:該模型成功在多模態(tài)空間中復(fù)現(xiàn)了文本 RL 系統(tǒng)(如 DeepSeek-R1)的核心特性,包括準(zhǔn)確率獎勵和響應(yīng)長度的穩(wěn)定增長,以及反思行為的自發(fā)涌現(xiàn)。
  • 數(shù)據(jù)高效性:在僅使用 54,000 張圖文數(shù)據(jù)進(jìn)行規(guī)則型 RL 訓(xùn)練的情況下,MM-Eureka 的平均性能超過了使用 1,000,000 張數(shù)據(jù)的 MPO 模型,整體基準(zhǔn)準(zhǔn)確率與使用 12,000,000 張數(shù)據(jù)進(jìn)行 CoT SFT 訓(xùn)練的模型相當(dāng)。

MM-Eureka的技術(shù)原理

  • 基于規(guī)則的大規(guī)模強(qiáng)化學(xué)習(xí)框架:MM-Eureka 基于 OpenRLHF 開發(fā)了一個高效且可擴(kuò)展的多模態(tài)大規(guī)模強(qiáng)化學(xué)習(xí)框架,支持多種模型及 RL 算法,使得模型能夠在多模態(tài)環(huán)境中進(jìn)行有效訓(xùn)練,并成功復(fù)現(xiàn)了 DeepSeek-R1 的關(guān)鍵特性。
  • 數(shù)據(jù)過濾與穩(wěn)定訓(xùn)練:團(tuán)隊發(fā)現(xiàn),數(shù)據(jù)選擇對于穩(wěn)定的 RL 訓(xùn)練至關(guān)重要,基于難度的數(shù)據(jù)過濾策略對訓(xùn)練的穩(wěn)定性起到了關(guān)鍵作用。
  • 視覺頓悟時刻(Visual aha-moment):MM-Eureka 在訓(xùn)練過程中展現(xiàn)了類似 DeepSeek-R1 的視覺頓悟時刻,表現(xiàn)為模型學(xué)會反思與回溯,重新審視圖像中的關(guān)鍵信息。
  • 極簡的強(qiáng)化學(xué)習(xí)設(shè)計:在 MM-Eureka 中,極簡的 RL 設(shè)計被證明是有效的。實驗表明,添加 KL 散度會限制模型探索,導(dǎo)致無法觀察到響應(yīng)長度的提升,因此采用簡單的獎勵函數(shù)(如準(zhǔn)確性獎勵和格式獎勵),結(jié)合難度基礎(chǔ)的數(shù)據(jù)過濾策略進(jìn)行穩(wěn)定訓(xùn)練。
  • 高效的數(shù)據(jù)利用:MM-Eureka 顯示出極高的數(shù)據(jù)效率。僅用 54,000 張圖文數(shù)據(jù)進(jìn)行規(guī)則型強(qiáng)化學(xué)習(xí)訓(xùn)練,其平均性能即超越了使用 1,000,000 張數(shù)據(jù)的 MPO 模型。MM-Eureka-Zero 僅利用 8,000 張圖文數(shù)學(xué)推理數(shù)據(jù)(指令模型的 0.05%),在自建的 K12 基準(zhǔn)測試中超越指令模型 8.2%,在 MathVerse 上表現(xiàn)相當(dāng),表明在多模態(tài)推理領(lǐng)域,簡單的規(guī)則型 RL 設(shè)計可以顯著提升訓(xùn)練效果,即使在數(shù)據(jù)量較少的情況下,也能達(dá)到與大規(guī)模訓(xùn)練相當(dāng)?shù)男阅堋?/li>

MM-Eureka的項目地址

MM-Eureka的應(yīng)用場景

  • 教育領(lǐng)域:通過強(qiáng)大的推理能力和反思機(jī)制,MM-Eureka 有助于學(xué)生更好地理解和解決復(fù)雜數(shù)學(xué)問題。
  • 增強(qiáng)現(xiàn)實(AR)和虛擬現(xiàn)實(VR):在 AR 和 VR 場景中,結(jié)合視覺與語言信息,MM-Eureka 可以提供更沉浸式和交互式的用戶體驗。
  • 數(shù)據(jù)分析和決策支持:MM-Eureka 的多模態(tài)推理能力使其在數(shù)據(jù)分析和決策支持方面表現(xiàn)優(yōu)異,能夠處理復(fù)雜的圖文數(shù)據(jù),幫助用戶從大量信息中提取關(guān)鍵信息,做出更明智的決策。
  • 自動化和智能助手:作為智能助手的核心技術(shù),MM-Eureka 能為用戶提供更智能和自然的交互體驗。
  • 游戲和娛樂:在游戲和娛樂領(lǐng)域,MM-Eureka 的多模態(tài)推理能力可以用于研發(fā)更智能的非玩家角色(NPC)和交互式劇情。

常見問題

  • MM-Eureka支持哪些類型的輸入數(shù)據(jù)?MM-Eureka 支持文本和視覺信息的多模態(tài)輸入,能夠處理復(fù)雜的圖文數(shù)據(jù)。
  • 如何獲取MM-Eureka的源代碼?您可以訪問其Github倉庫 [MM-Eureka GitHub](https://github.com/ModalMinds/MM-EUREKA) 下載源代碼。
  • MM-Eureka的性能如何?MM-Eureka 展現(xiàn)出優(yōu)秀的性能,僅使用少量數(shù)據(jù)就能超越使用大量數(shù)據(jù)訓(xùn)練的模型。
閱讀原文
? 版權(quán)聲明
蟬鏡AI數(shù)字人

相關(guān)文章

蟬鏡AI數(shù)字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        国产视频一区二区在线观看| 亚洲国产成人av网| 国产精品日产欧美久久久久| 国内成人精品2018免费看| www久久久久| 国产麻豆成人传媒免费观看| 亚洲国产精品av| 91在线国产观看| 亚洲一区二区三区小说| 91精品在线观看入口| 国产一区二区三区免费| 亚洲男女一区二区三区| 欧美丰满一区二区免费视频| 国产一区二区三区在线看麻豆| 亚洲天堂a在线| 欧美日韩一区视频| 国产尤物一区二区在线| 亚洲激情一二三区| 欧美大片免费久久精品三p| 成人h精品动漫一区二区三区| 亚洲电影欧美电影有声小说| 久久久www免费人成精品| 欧美羞羞免费网站| 国产黄人亚洲片| 亚洲影院久久精品| 久久九九久精品国产免费直播| 欧美三级电影在线看| 国内一区二区视频| 亚洲国产视频一区| 国产精品丝袜在线| 欧美成人高清电影在线| 欧美亚洲国产一区二区三区| 国产乱子伦视频一区二区三区| 亚洲高清一区二区三区| 国产女主播一区| 日韩一区和二区| 色综合天天视频在线观看| 国产乱码精品一区二区三区av| 亚洲综合在线五月| 最新欧美精品一区二区三区| 久久久精品2019中文字幕之3| 欧美日韩视频专区在线播放| 色婷婷亚洲精品| 国产69精品久久99不卡| 久久草av在线| 久久精品理论片| 免费观看成人鲁鲁鲁鲁鲁视频| 亚洲不卡av一区二区三区| 自拍偷拍欧美激情| 中文字幕中文字幕一区| 精品成人a区在线观看| 精品免费99久久| 91麻豆精品久久久久蜜臀| 色999日韩国产欧美一区二区| 波多野结衣欧美| 成人精品视频.| 岛国精品在线播放| 成人激情视频网站| 丰满岳乱妇一区二区三区| 国产一区啦啦啦在线观看| 美女视频黄a大片欧美| 免费日本视频一区| 蜜臀av性久久久久蜜臀aⅴ流畅 | 欧美性受xxxx黑人xyx性爽| 99精品欧美一区二区三区小说| 欧美日韩中文国产| 欧美日韩免费电影| 欧美肥大bbwbbw高潮| 欧美一区二区成人| 久久综合色鬼综合色| 国产免费观看久久| 1000部国产精品成人观看| 亚洲午夜久久久久| 麻豆精品视频在线| 国产91精品在线观看| 色噜噜狠狠色综合中国| 欧美精品欧美精品系列| 久久亚洲精品小早川怜子| 国产精品进线69影院| 亚洲v精品v日韩v欧美v专区| 国产一区二区三区在线看麻豆| 99久久精品免费观看| 欧美日韩五月天| 久久久欧美精品sm网站| 亚洲美女一区二区三区| 久久国产精品一区二区| www.99精品| 在线播放视频一区| 国产人成一区二区三区影院| 一个色综合网站| 麻豆91精品视频| 99视频在线精品| 欧美一区二区三区精品| 国产精品白丝在线| 三级成人在线视频| 91在线porny国产在线看| 91精品一区二区三区久久久久久| 国产精品美女一区二区在线观看| 日韩电影在线观看电影| 高清av一区二区| 制服丝袜av成人在线看| 亚洲色图都市小说| 六月丁香婷婷久久| 欧美三级视频在线观看| 国产精品毛片无遮挡高清| 麻豆成人久久精品二区三区红| av网站一区二区三区| 欧美制服丝袜第一页| 日本一区二区成人在线| 天天色天天操综合| 色中色一区二区| 精品成人一区二区| 亚洲成a人片在线不卡一二三区| 久久不见久久见免费视频1| 欧美性受极品xxxx喷水| 国产精品视频一区二区三区不卡| 久久精品久久99精品久久| 波多野结衣亚洲| 日韩欧美第一区| 视频一区二区中文字幕| 91久久精品一区二区二区| 精品国产免费视频| 国产在线麻豆精品观看| 欧洲精品在线观看| 亚洲一区av在线| 粉嫩一区二区三区在线看| 久久久亚洲综合| 国产在线精品免费| 精品日韩成人av| 美腿丝袜亚洲一区| 91精品国产综合久久久蜜臀粉嫩 | 日韩精品一区二区三区中文精品| 亚洲一区欧美一区| 欧美中文一区二区三区| 一区二区三区在线观看国产| 色噜噜狠狠成人中文综合| 依依成人精品视频| 欧美专区日韩专区| 午夜视频一区二区| 欧美日本一道本| 免费美女久久99| 久久综合五月天婷婷伊人| 国产精品77777| 国产精品女同互慰在线看| 成人av资源下载| 亚洲色图20p| 欧美麻豆精品久久久久久| 日韩国产精品久久久久久亚洲| 日韩免费观看2025年上映的电影 | 日韩影院精彩在线| 精品三级在线看| 成人av免费观看| 亚洲综合999| 欧美一区二区三区小说| 韩国女主播一区| 中文字幕一区二区三区在线不卡 | 亚洲视频你懂的| 欧美男男青年gay1069videost| 琪琪一区二区三区| 日本一区二区电影| 欧美在线观看一二区| 久久精品av麻豆的观看方式| 欧美国产欧美综合| 欧美日韩在线观看一区二区| 久久国产精品色婷婷| 亚洲人成网站在线| 91精品国产91久久久久久一区二区 | 日本va欧美va欧美va精品| 久久品道一品道久久精品| 精品日韩一区二区| 不卡区在线中文字幕| 午夜久久久久久久久久一区二区| 欧美精品一区男女天堂| 色综合色狠狠综合色| 国产美女久久久久| 亚洲成人动漫在线观看| 中文字幕不卡的av| 欧美一区二区三区影视| 91污片在线观看| 精品亚洲成a人在线观看| 亚洲三级免费观看| 久久久噜噜噜久久人人看| 欧美丝袜丝交足nylons图片| 高潮精品一区videoshd| 日韩电影一区二区三区| 一区二区三区精品在线观看| 国产欧美日韩久久| 日韩欧美第一区| 欧美精三区欧美精三区| 色欧美日韩亚洲| 成人h动漫精品一区二区| 国产一区免费电影| 奇米精品一区二区三区在线观看一| 亚洲欧美一区二区久久| 国产精品入口麻豆原神| 国产亚洲一区二区在线观看| 精品日韩欧美在线| 欧美久久一二区| 在线观看国产91| 色综合夜色一区|