<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        將集體學習引入樹搜索,新方法CoMCTS實現o1-like的推理與反思

        AIGC動態8個月前發布 機器之心
        277 0 0

        新學習推理方法:集體蒙特卡羅樹搜索(Collective Monte Carlo Tree Search, CoMCTS

        將集體學習引入樹搜索,新方法CoMCTS實現o1-like的推理與反思

        原標題:將集體學習引入樹搜索,新方法CoMCTS實現o1-like的推理與反思
        文章來源:機器之心
        內容字數:6645字

        Mulberry: 賦能多模態大語言模型的逐步推理能力

        本文介紹了名為Mulberry的新型多模態大語言模型(MLLM),它通過一種名為集體蒙特卡羅樹搜索(CoMCTS)的新方法,顯著提升了MLLM在復雜推理任務中的性能?,F有MLLM在簡單任務上表現出色,但在復雜推理方面仍存在不足,本文旨在解決這一問題。

        1. 挑戰與CoMCTS的提出

        傳統樹搜索方法如MCTS應用于MLLM推理路徑搜索效果不佳,主要原因在于搜索有效性和效率兩方面:傳統的MCTS方法依賴于自我引導,而當前MLLM的訓練缺乏明確的中間推理步驟,導致搜索陷入低質量節點;此外,傳統MCTS效率低下,每次迭代僅擴展一個節點,計算成本高昂。為解決這些問題,本文提出了CoMCTS。CoMCTS的核心思想是將集體學習引入樹搜索,通過多個MLLM的協同工作,高效地搜索有效的推理路徑。

        2. CoMCTS算法詳解

        CoMCTS算法包含四個關鍵操作:擴展(Expansion)、模擬與錯誤定位(Simulation and Error Position)、反向傳播(Backpropagation)和選擇(Selection)。

        1. 擴展:利用多個MLLM協同擴展多個候選推理路徑,避免單一模型陷入低質量節點。
        2. 模擬與錯誤定位:多個模型共同模擬候選節點的值,過濾掉低分節點,提高效率。
        3. 反向傳播:自底向上更新推理樹中節點的統計信息。
        4. 選擇:根據上置信界限(UCB)值選擇下一個搜索節點。

        CoMCTS還通過整合正負推理節點構建反思性推理路徑,進一步提升模型的推理能力。

        3. Mulberry模型及實驗結果

        利用CoMCTS構建了Mulberry-260K數據集,并訓練了一系列Mulberry模型。實驗結果表明,Mulberry模型在多個基準測試中顯著優于現有開源MLLM,并在與閉源模型的比較中展現出競爭力。消融實驗也驗證了CoMCTS各個組件的有效性,特別是集體學習機制和反思學習機制的貢獻。

        4. 主要貢獻與結論

        本文的主要貢獻在于提出了CoMCTS算法,該算法通過集體學習和反思學習機制,有效提升了MLLM的推理能力。Mulberry模型的成功證明了CoMCTS方法的有效性和實用性,為未來MLLM的研究提供了新的方向。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 最近中文字幕大全免费版在线| 韩国免费a级作爱片无码| 中文字幕 亚洲 有码 在线 | 亚洲午夜无码久久久久| 亚洲第一成年人网站| 国产亚洲Av综合人人澡精品| 久久久久久国产精品免费免费男同 | 中国性猛交xxxxx免费看| 区久久AAA片69亚洲| 亚洲欧美熟妇综合久久久久 | 黄色大片免费网站| 免费在线看v网址| 亚洲国产AV无码专区亚洲AV| 国产成人综合久久精品亚洲| 可以免费观看一级毛片黄a| 亚洲国产成人手机在线电影bd | 男人j进女人p免费视频| 野花高清在线观看免费完整版中文 | 亚洲黄色免费在线观看| 国产人成网在线播放VA免费| 日韩高清在线免费看| 亚洲伊人久久大香线蕉在观| 成年私人影院免费视频网站| 亚洲免费网站在线观看| 女人18一级毛片免费观看| 亚洲福利一区二区三区| 成人片黄网站色大片免费| 爱情岛论坛免费视频| 亚洲国产一区二区三区青草影视| 中文字幕手机在线免费看电影 | 免费大黄网站在线看| 免费国产污网站在线观看| 亚洲国产精品综合福利专区| 99热在线精品免费播放6| 亚洲国产综合精品中文第一区| 久久国内免费视频| 免费在线观看一区| 亚洲美女大bbbbbbbbb| 免费国产a国产片高清网站| 日韩免费在线视频| 亚洲国产美国国产综合一区二区|