華為諾亞的盤古Agent來了,讓智能體學會結構化推理
AIGC動態(tài)歡迎閱讀
原標題:華為諾亞的盤古Agent來了,讓智能體學會結構化推理
關鍵字:函數(shù),智能,任務,盤古,研究者
文章來源:機器之心
內(nèi)容字數(shù):10412字
內(nèi)容摘要:
機器之心報道
編輯:澤南、蛋醬有結構化推理和先驗知識,智能體變得更加通用了。自 AI 誕生以來,開發(fā)能夠解決和適應復雜工作的多任務智能體(Agent)一直是個重要的目標。
AI 智能體對于許多應用至關重要,研究者通常用強化學習方法通過環(huán)境交互來培養(yǎng)智能體的決策技能。基于模型和無模型的深度強化學習方法都已取得了廣為人們所知的成就,例如 AlphaZero、改進的排序和乘法算法、無人機競速以及聚變反應堆中的等離子體控制。這些成功涉及一個標準的強化學習管道,智能體在其中學習我們所說的外在功能 —— 一種直接與外界交互的策略,即響應環(huán)境以最大化獎勵信號。該函數(shù)通常是參數(shù)化神經(jīng)網(wǎng)絡,根據(jù)環(huán)境觀察生成動作。
經(jīng)典的強化學習方法使用單個映射函數(shù)來定義策略 π,但在復雜的環(huán)境中通常被證明是不夠的,這與通用智能體在多個隨機環(huán)境中交互、適應和學習的目標相矛盾。
在強化學習中引入的先驗通常是特定于任務的,并且需要廣泛的工程和領域專業(yè)知識。為了泛化,最近的研究已轉向將大型語言模型(LLM)集成到智能體框架中,如 AutoGen、AutoGPT 和 AgentVerse 等工作。
近日,來自華為諾亞方舟實驗
原文鏈接:華為諾亞的盤古Agent來了,讓智能體學會結構化推理
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務平臺