国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

NeurIPS 2024 | 智能體不夠聰明怎么辦?清華&螞蟻團隊:讓它像學徒一樣持續學習

AIGC動態1年前 (2024)發布 機器之心
100 0 0

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com此項研究成果已被 NeurIPS 2024 錄用。該論文的第一作者是清華大學計算機系博士生關健(導師:黃民烈教授),目前任螞蟻研究院副研究員,其主要研究領域為文本生成、復雜推理和偏好對齊。隨著 ChatGPT 掀起的 AI 浪潮進入第三年,人工智能體(AI Agent)作為大語言模型(LLM)落地應用的關鍵載體,正受到學術界和產業界的持續關注。實際上,早在 5-6 年前,預訓練技術就已經在許多實際任務中取得了顯著成果。但 AI Agent 之所以在當下備受矚目,更多地源于其在自動解決復雜任務方面展現出的巨大潛力,而這種潛力的核心基石正是智能體的復雜推理能力。與當下廣受關注的 OpenAI-o1 及其追隨者略有不同,大多數實用的 AI Agent 往往需要在特定場景下發揮作用。這種情況類似于普通人類:雖然不是每個人都需要具備獲得 IMO 金牌的數學素養,但在具體場景下利用特定知識和工具完成復雜任務(例如使用搜索引擎、處理私有文檔等)的能力卻是不可或缺的。這一特點也意味著 AI Agent 的開發者們需要一套既通用又高效的 Agent 構建方。更具挑戰性的是,作為面向實際應用的產品,AI Agent 在部署后還需要能夠隨著應用場景的演進和用戶需求的變化而不斷更新優化。這些實際問題都表明,構建一個真正實用的 AI Agent 絕非簡單的提示工程(Prompt Engineering)或模型微調(Fine-tuning)所能解決,而是需要更系統化的方法。在 NeurIPS 2024 上,來自清華大學和螞蟻集團的研究者針對人工智能體構建方法的通用性和適應性提出了一個新方案。這個被命名為 AMOR(Adaptable MOdulaR knowledge agent)的系統,不僅能低成本地調用專業工具和知識庫,更重要的是,它能像人類一樣持續學習和成長。論文標題:AMOR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback論文地址:https://arxiv.org/abs/2402.01469作者主頁:https://jianguanthu.github.io/AI Agent 的「三大短板」:為什么它們還不夠「聰明」?想讓 AI Agent 真正勝任助手角色,僅有海量知識是遠遠不夠的。研究團隊通過深入分析發現,當前 AI Agent 普遍存在三大短板:「黑盒思維」:與優秀人類助手能清晰展示解題思路不同,AI Agent 的推理過程往往是個黑箱,我們根本無從得知它是如何得出結論的。「固步自封」:AI Agent 就像被困在訓練時刻的「永恒現在」,無法像人類那樣與時俱進,持續獲取新能力、更新認知。「粗放糾錯」:當 AI Agent 犯錯時,我們只能籠統地說「答案不對」,而無法像指導學生那樣,精確指出「這一步推理有問題」。更令人困擾的是,目前業界主流方案都未能同時解決這三大難題。作者對比了當前最具代表性的 AI Agent 框架,它們要么推理過程不可控,要么知識固化,要么反饋機制過于粗糙。這一困境在開源模型中表現得尤為明顯。AMOR 和已有構建智能體的代表性方法的比較AMOR:基于有限狀態機的模塊化推理方案如何讓 AI Agent 既能像專家一樣嚴謹思考,又能像學徒一樣持續成長?AMOR 框架給出了一個優雅的答案:將復雜的 AI 推理過程拆解成可控的「專家模塊」,通過有限狀態機(FSM)編排它們的協作規則,就像精密的齒輪系統一樣,每個部件都完美嚙合。AMOR 的狀態轉移圖這種設計帶來三大關鍵優勢:1. 結構化推理框架FSM 使得定義步驟間的依賴關系(例如,執行順序、分支選擇)非常方便,因此能夠容易地對錯誤的路徑進行剪枝,從而縮小探索空間,也有潛力更高效地構建類 OpenAI-O1 的長推理鏈。2. 「雙階段」訓練策略通過將復雜任務解耦為模塊,AMOR 能夠訓練每個模塊,從而可以充分利用開源數據集。具體而言,AMOR 采用「預熱 + 適應」兩階段訓練模式:快速起步 – 預熱階段:就像新員工入職培訓,AMOR 通過在 5 萬個自動構建的樣本上訓練掌握基礎技能。這些樣本被巧妙地分解到各個模塊,使得即便是開源語言模型也能快速達到專業水準。持續進化 – 適應階段:像經驗豐富的職場人一樣,AMOR 在實際工作中不斷成長。每解決一個問題,它就能積累一分經驗,逐步適應特定領域的專業需求。3. 過程反饋機制傳統 AI 訓練就像只告訴學生「考試及格 / 不及格」,而不指出具體錯在哪里。這種粗糙的反饋機制常常導致 AI 像「黑盒」一樣難以診斷問題,訓練效果事倍功半。而 AMOR 引入「過程反饋」機制,在適應訓練階段中,其結構化的推理過程使用戶能夠輕松診斷智能體的錯誤,并提供過程反饋以提高智能體的推理能力。4. 框架通用性AMOR 框架的設計充分考慮了通用性和可擴展性。雖然論文主要以文本知識庫為例進行驗證,但其基于 FSM 的模塊化設計天然支持多種應用場景的遷移和擴展:知識類型擴展:通過定制 FSM 框架內的模塊和依賴關系,AMOR 可以靈活支持不同類型的知識庫,如結構化數據庫、多模態知識等。任務類型擴展:除了問答任務外,通過重新設計狀態轉移圖,AMOR 還可以支持其他知識密集型任務,如文檔摘要、知識推理等。工具集成擴展:得益于模塊化設計,AMOR 可以方便地集成各類專業工具。只需將新工具封裝為對應的工具模塊,并在 FSM 中定義其調用規則即可。這種可擴展的架構設計使得 AMOR 不僅能夠解決當前的知識推理任務,更為未來接入新的知識源、任務類型和工具能力預留了充足的擴展空間。正如論文所述,AMOR 提供了一個構建知識智能體的通用框架,其核心思想是基于 FSM 的推理邏輯和過程反饋機制,這使得它能夠適應各種不同的應用場景需求。AMOR 實現:模型結構和訓練過程AMOR 采用了一種巧妙的「專家混合」架構(Module-Aware Mixture-of-Experts,簡稱 MA-MoE)。這種設計靈感來自人類的專業分工:就像一個人可以是優秀的醫生,同時在其他領域保持基本能力。具體來說,MA-MoE 為每個功能模塊配備了獨特的 FFN 參數,并用原始模型的 FFN 參數進行初始化。這就像是在 AI 的「大腦」中劃分了專門的「思維區域」。在預熱階段,AMOR 用標準的 MLE Loss 在 5 萬個樣本上對 MA-MoE 進行微調。在適應階段,AMOR 的訓練過程分為三個關鍵步驟:探索、反饋和利用。探索(Exploration):就像學徒需要親自動手實踐,AMOR 會直接處理用戶的實際問題。在這個過程中,AMOR 在知識庫中搜索相關信息,進行思考和推理,并推斷答案。反饋(Feedback Collection):這個階段就像師傅在旁邊觀察學徒的工作,并給出具體指導,可以直接說「對」或「錯」,也可以具體指出正確答案,并且 AMOR 的每個推理步驟都能得到反饋。利用(Exploitation):每處理一定數量的問題后,AMOR 會根據收集到的反饋進行「復盤」,使用 KTO Loss 將 MA-MoE 和人類偏好對齊。和預熱階段類似,AMOR 的每個模塊在優化時只調整自己的「專業參數」。AMOR 實驗:成本更低,效果更好在 HotpotQA(百科知識問答)、PubMedQA(醫學文獻問答)和 QASPER(論文長文本問答)三個基準測試中,AMOR 展現出優秀的性能:AMOR 的 FSM 框架讓 AI 的推理過程更加清晰可控,比傳統方法提升 30%~40%;通過在多個開源數據集上預熱,AMOR 甚至超越了用 GPT-4 生成訓練數據的智能體;使用過程反饋比結果反饋進行適應更高效:僅需 800 次互動就能達到穩定效果,并且證據收集能力和推理正確率顯著提升。AMOR 及基線方法在微調或不微調時的實驗結果實例展示下圖比較了 AMOR 和傳統的 ReAct 框架(基于 GPT-3.5)分別回答同一問題的推理過程:AMOR(上)和 ReAct(下)回答同一輸入問題的樣例如圖所示,沒有明確推理邏輯約束的 ReAct 未能成功分解問題,并在「Thought/Action 5」 中過早地終止檢索。此外,ReAct 在「Thought 2/4/5」中也混合了正確和錯誤的步驟,這使得用戶難以針對性地批評和改進智能體。相比之下,AMOR 則如同經驗豐富的專家,每一步推理都清晰可控,不僅能準確找到答案,還能接受精確的過程指導,持續提升自己的能力。成本分析在 AI 領域,性能提升往往意味著更高的成本。然而,如下圖所示,AMOR 打破了這個「魔咒」。不同智能體的平均步驟數 /token 數對比為什么 AMOR 如此高效?想象一個團隊會議:傳統方法(如 ReAct)像是每個人發言都要重復之前所有人說過的話;AMOR 則像是精心設計的會議流程:每個環節只傳遞必要信息。按照目前 API 調用成本計算,使用 GPT-4o 處理 1 萬個問題,AMOR 比 ReAct 節省數百美元;當使用開源模型時,成本可以進一步降低 90% 以上。這意味著 AMOR 不僅在性能上領先,在商業落地時也具有顯著的成本優勢。尤其適合大規模文檔處理、客服智能問答、專業領域咨詢等高頻場景的應用。結語本文介紹了 AMOR—— 一個為知識密集型任務設計的模塊化智能體框架。它通過 FSM 推理系統和過程反饋機制,讓 AI 展現出前所未有的推理能力和學習潛力。AMOR 的成功為 AI 助手的發展開辟了新路徑。作者表示,接下來,他們將拓展到更多知識類型(如結構化知識庫)、探索更廣泛的應用場景、研究 AI 自主設計推理邏輯的可能性。這些工作預示著我們正在接近真正的「AI 專家」:既有清晰的推理能力,又能在實踐中持續成長。?THE END轉載請聯系本公眾號獲得授權投稿或尋求報道:liyazhou@jiqizhixin.com

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        老司机免费视频一区二区三区| 99自拍偷拍视频| 亚洲综合一区二区| 国产精品久久a| 亚洲图片自拍偷拍| 性生活一级大片| 欧美日韩dvd在线观看| 精品成人av一区二区三区| 3d动漫精品啪啪| 老司机成人免费视频| 亚洲精品视频网上网址在线观看| 国产一区2区在线观看| 中文字幕国产日韩| 亚洲性视频大全| 欧美在线亚洲一区| 亚洲看片免费| 免费国产一区二区| 丁香啪啪综合成人亚洲小说 | 依依成人精品视频| 亚洲在线观看网站| 在线不卡中文字幕播放| 青花影视在线观看免费高清| www.亚洲男人天堂| 国产精品伦理久久久久久| 国产日韩精品在线播放| 看片的网站亚洲| 日韩专区第三页| 樱花草国产18久久久久| 屁屁影院国产第一页| 精品久久久久久久人人人人传媒| 亚洲精品成a人ⅴ香蕉片| 久久夜色精品亚洲噜噜国产mv| 成人精品影视| 不卡一区二区三区视频| www.日韩在线| 搡女人真爽免费午夜网站| 欧美伊人久久大香线蕉综合69| 黄色录像免费观看| 欧美极品少妇与黑人| 国产在线欧美| 亚洲精品一区二区毛豆| 亚洲精品久久久久久国产精华液| 日韩综合第一页| 亚洲精品自拍视频| 久久免费av| 久久精品国产理论片免费| 久久精品视频在线免费观看| 国产老头和老头xxxx×| 日韩精品免费观看| 仙踪林久久久久久久999| 国产在线视频欧美一区二区三区| 久久精品亚洲麻豆av一区二区| 中文字幕 欧美日韩| 亚洲第一免费网站| 911久久香蕉国产线看观看| 久久久人人爽| 亚洲精品一卡二卡| 成人自拍小视频| 欧美一级黑人aaaaaaa做受| 日本在线观看不卡视频| 91九色在线观看视频| 欧美三级午夜理伦三级中视频| 精品亚洲a∨一区二区三区18| 日韩免费观看在线观看| 成人性生交大片免费| 午夜免费视频网站| 久久视频精品在线| 蜜桃av噜噜一区| 激情五月俺来也| 亚洲片av在线| 国产欧美日韩一级| 男女激情无遮挡| 日韩欧美一区电影| 欧美不卡视频| 成人一区二区免费视频| 精品国产一区二区三区忘忧草| 久久国产成人精品| 久久视频免费在线| 777亚洲妇女| 亚洲国产精品久久久久蝴蝶传媒| 在线观看视频黄色| 这里是久久伊人| 国产精品不卡| 国产精品自拍片| 日韩精品在线观看一区二区| 亚洲视频大全| 日本在线播放一区二区| 色噜噜狠狠狠综合曰曰曰88av| 看片的网站亚洲| 美女露出粉嫩尿囗让男人桶| 韩国精品久久久999| 99久久99久久久精品齐齐| 男人操女人动态图| 国产欧美精品日韩| 一区二区三区中文字幕| 红杏成人性视频免费看| 日韩精品福利视频| 日韩一区二区三区电影| 亚洲精品1234| 91pony九色| 欧美黑人一级爽快片淫片高清| 成人精品视频网站| 国产精品嫩草影院俄罗斯| 91在线免费看片| 天天综合天天做天天综合| 人人香蕉久久| 真实国产乱子伦对白视频| 亚洲电影免费观看高清| 秋霞电影网一区二区| 私密视频在线观看| 91精品国产综合久久男男 | 国模大尺度视频一区二区| 国产精品美女xx| 欧美日本一区二区三区| 亚洲午夜久久久久久尤物| jizz欧美性11| 日本免费在线精品| 亚洲成人高清在线| 午夜久久一区| 亚洲丝袜在线观看| 国产日韩av在线| 欧洲av在线精品| 99精品视频免费观看视频| 风韵丰满熟妇啪啪区老熟熟女| 国产精品久久久久久久午夜| 无吗不卡中文字幕| 牛牛国产精品| 久久精品aⅴ无码中文字字幕重口| 国产99视频在线观看| 亚洲电影一区二区三区| 在线国产一区二区| 亚洲国产精品第一页| 亚洲bt天天射| 日韩欧美亚洲国产精品字幕久久久 | 91精品国产入口在线| 日韩国产精品久久久| 欧美xxxx精品| 色综合电影网| 自拍偷拍亚洲欧美| 国产精品素人一区二区| 日韩aaaa| 性活交片大全免费看| 3d精品h动漫啪啪一区二区| 91精品国产乱码| 992tv人人草| 午夜精品福利视频| 欧美午夜久久久| 日本不卡一二三区黄网| 中文字幕在线有码| 国产96在线 | 亚洲| 57pao成人永久免费视频| 色婷婷久久久亚洲一区二区三区 | 欧美日韩精品一区二区三区四区| 日本在线播放一区二区三区| 成人51免费| 久久精品视频16| 国产精品三级久久久久久电影| 欧美色欧美亚洲另类二区| 国产乱人伦偷精品视频免下载| 97se亚洲国产一区二区三区| 亚洲综合色在线观看| 亚洲最大福利网| 日韩精品视频在线播放| 国产精品色一区二区三区| 国内精品久久久久久久影视麻豆| 91激情视频在线观看| 国产日韩欧美大片| 欧美在线精品免播放器视频| 欧美精品v国产精品v日韩精品| 成人精品一区二区三区中文字幕| 精品九九在线| 亚洲午夜久久久久久久久红桃| 一区二区三区四区欧美| 青草青草久热精品视频在线观看| 777欧美精品| 久久久久久亚洲综合影院红桃| 97人人精品| 国产黄色录像片| av视屏在线播放| 久久一区二区精品| 国自产精品手机在线观看视频| 欧美精选午夜久久久乱码6080| 日本激情视频在线| 久草热8精品视频在线观看| 中文字幕一区图| 四虎国产精品免费| 亚洲国产一区二区精品视频| 97视频在线观看视频免费视频| 欧美日韩1234| 亚洲婷婷在线视频| 日本成人在线一区| 国产免费av一区二区三区| 91国模少妇一区二区三区| 免费毛片小视频| 国内视频一区| 欧美一级大片在线观看| 日韩高清不卡av| 欧美日韩视频免费播放| av激情亚洲男人天堂| 亚洲精品影视| 色婷婷久久久| 99在线视频免费| 亚洲女人在线观看| www.好吊操| 久久国产精品一区二区三区| 91高清视频免费| 国产亚洲综合久久| 在线电影院国产精品| 一区二区三区四区不卡视频| 99久久婷婷国产综合精品| 午夜在线播放视频欧美| 亚洲影院天堂中文av色| 精品一区在线观看视频| 中文字幕人妻一区二区三区| 日韩av资源在线| 中文字幕一区二区三区最新| av成人午夜| 国产成人97精品免费看片| 最近2019中文字幕一页二页| 日韩欧美电影一二三| 欧美午夜电影在线| 亚洲情趣在线观看| 久久久综合九色合综国产精品| 人人超碰91尤物精品国产| 国内精品久久久久久久影视麻豆| 里番精品3d一二三区| 超碰手机在线观看| 女女互磨互喷水高潮les呻吟| 精品国产乱码久久久久久1区二区 91网址在线观看精品 | 免费亚洲电影在线| 在线欧美福利| 亚洲电影影音先锋| 成人一区而且| 亚洲涩涩av| 精品日产乱码久久久久久仙踪林| 国产十六处破外女视频| 国产精品美女高潮无套| 亚洲精品女人久久久| 杨幂一区二区国产精品| 在线观看av网页| 日本xxxxxxx免费视频| 免费超爽大片黄| 成人在线免费观看网址| 中文字幕在线亚洲三区| 午夜精品区一区二区三| 欧美一区二区在线| 欧美日产一区二区三区在线观看| 国产精品永久入口久久久| 91在线|亚洲| 亚洲一区中文字幕| 成人性生交xxxxx网站| 国产精品一区二区三区久久久| 日本aⅴ大伊香蕉精品视频| 国模吧一区二区| 97国产精品久久| 91精品国产高清久久久久久久久| 欧美精品videosex极品1| 欧美精品激情在线| 欧美激情一区二区三级高清视频| 久久中文字幕一区| 欧美黑人又粗大| 午夜精品在线观看| 57pao国产精品一区| 日韩av免费在线观看| 国产精品日韩专区| 91精品啪在线观看麻豆免费| 亚洲最大av网站| 精品国产一区二区三区麻豆免费观看完整版 | 97精品一区二区三区| 4438全国成人免费| 国产精品欧美亚洲777777| 成人黄色av免费在线观看| 97碰碰视频| 欧美久久久久久| 一区二区三区四区久久| 欧美午夜性视频| 亚洲男人天堂色| 一起草最新网址| 中文字幕一二三四区| 日韩一级片av| 欧美电影完整版在线观看| 色999日韩| 亚洲欧美成人综合| 国产真实乱偷精品视频免| 91视频国产资源| 亚洲少妇中出一区| 在线一区二区视频| 日韩久久久精品| 亚洲欧美日韩国产成人| 欧美激情国内偷拍| 成人黄色在线观看| 欧美一区二区三区精美影视| 在线一区日本视频| 欧美激情国产精品日韩| 久草福利在线观看| 免费中文字幕日韩| 美女亚洲一区| 国产亚洲午夜| 国产成人精品一区二区三区网站观看| xfplay精品久久| 亚洲第一av色| 91精品国产91久久综合桃花 | 色综合久久中文综合久久97| 91精品福利在线一区二区三区 | 国内露脸中年夫妇交换精品| 香蕉国产精品| 极品少妇一区二区三区精品视频| 久久久久久免费毛片精品| 亚洲一区在线观看网站| 欧美一级视频精品观看| 久久九九热免费视频| 国产精品十八以下禁看| 日本高清视频一区二区三区| 日本成年人网址| 精品成人av一区二区三区| 国产日韩三级| 亚洲一区二区三区免费在线观看| 成人av在线资源网站| 五月天精品一区二区三区| 亚洲电影天堂av | 亚洲一区和二区| 久久天堂久久| 欧美日韩第一区| 99国产精品国产精品久久| 精品欧美激情精品一区| 精品视频偷偷看在线观看| 国产成人精品综合久久久| 五月天婷亚洲天综合网鲁鲁鲁| 日本免费观看网站| 男人av资源站| 亚洲综合专区| 99久久精品国产一区| 色激情天天射综合网| 色yeye香蕉凹凸一区二区av| 99r国产精品视频| av7777777| 成年人二级毛片| 中出一区二区| 久久久久久久免费视频了| 欧美精品九九99久久| 97免费在线视频| 在线观看欧美激情| 久久久久久久久免费看无码| 婷婷综合福利| 国产高清亚洲一区| 在线精品视频一区二区三四| 另类少妇人与禽zozz0性伦| 精品伦理一区二区三区| 国内自拍第二页| 精品亚洲精品| 看电视剧不卡顿的网站| 一区二区三区不卡视频在线观看| 亚洲摸下面视频| 亚洲福利国产精品| 日韩在线国产精品| 免费亚洲一区二区| 四虎永久免费观看| 日韩免费av| 国产日韩欧美电影| 日韩av一区在线| 亚洲一区二区三区sesese| 亚洲 欧美 日韩系列| www国产精品| 国产成人午夜精品影院观看视频| 在线免费不卡视频| 人体精品一二三区| 女人扒开屁股爽桶30分钟| 麻豆一二三区精品蜜桃| 蜜桃久久久久久| 欧美日韩中文字幕综合视频| 国内精品久久久久影院 日本资源| 韩国黄色一级大片| 久久久精品视频免费观看| 丝袜国产日韩另类美女| 欧美视频裸体精品| 国产精品高潮在线| 在线观看的毛片| 日韩国产欧美| 成人欧美一区二区三区小说| 久久精品成人欧美大片| 麻豆映画在线观看| 亚洲ww精品| 国产成人av影院| 亚洲国产精品国自产拍av秋霞| 好吊色欧美一区二区三区四区 | 日韩欧美猛交xxxxx无码| 日韩毛片网站| 高清不卡在线观看| 亚洲精品电影在线观看| 日韩精品久久久免费观看| 四季av中文字幕| 久草中文综合在线| 亚洲国产天堂久久综合网| 欧美激情视频一区二区三区| 国产91丝袜美女在线播放| 男男视频亚洲欧美| 日韩精品一区二区在线| 欧美欧美一区二区| 男女做暖暖视频| 99久久免费精品高清特色大片|