<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        多智能體強化學習算法評估Hard模式來了!浙大、南棲仙策聯手推出

        AIGC動態8個月前發布 機器之心
        338 0 0

        AI智能體:強者從不抱怨環境。

        多智能體強化學習算法評估Hard模式來了!浙大、南棲仙策聯手推出

        原標題:多智能體強化學習算法評估Hard模式來了!浙大南棲仙策聯手推出
        文章來源:機器之心
        內容字數:6499字

        SMAC-HARD:一個更具挑戰性的星際爭霸II多智能體強化學習環境

        本文介紹了由浙江大學和南棲仙策聯合推出的SMAC-HARD環境,這是一個基于星際爭霸II的改進型多智能體強化學習(MARL)模擬環境。它旨在解決現有SMAC環境中對手策略單一、缺乏多樣性等問題,從而為MARL算法評估提供更嚴峻的挑戰。

        1. SMAC環境的局限性

        傳統的SMAC(星際爭霸多智能體挑戰)環境,包括SMACv1和SMACv2,都使用默認的、單一的對手策略腳本。這導致MARL算法容易過擬合到特定對手策略,或利用對手策略漏洞,從而無法真實反映算法的有效性。

        2. SMAC-HARD的改進

        SMAC-HARD環境的主要改進在于:

        1. 可編輯的對手策略:允許用戶自定義對手策略腳本,提高環境多樣性。
        2. 隨機化對手策略:支持預定義概率混合多個對手策略,進一步增強環境的復雜性。
        3. MARL自博弈接口:提供對稱接口,方便進行MARL自博弈研究。
        4. 黑盒測試:允許對在默認對手策略下訓練的模型進行黑盒測試,評估其策略覆蓋率和遷移能力。
        5. 修復SMAC獎勵結算錯誤:修正了SMAC環境中存在的獎勵結算錯誤,使實驗結果更準確。

        3. SMAC-HARD的實現

        SMAC-HARD基于Python的pysc2代碼包和SMAC框架實現。它修改了SMAC的地圖和starcraft.py文件,以支持多玩家模式、禁用默認攻擊策略,并對玩家行動進行并行化處理,以減少行動順序的影響。環境還支持使用大模型自動生成對手策略腳本。

        4. 實驗結果

        實驗結果表明,在SMAC-HARD環境中,即使是那些在傳統SMAC環境中表現優異的MARL算法,也難以保持高勝率,這突顯了SMAC-HARD環境的挑戰性。黑盒測試也表明,在單一對手策略下訓練的模型,其策略遷移能力有限。 一些經典算法在SMAC-HARD環境下,即使經過1000萬步訓練,勝率也遠低于在SMAC環境中的表現。

        5. 結論

        SMAC-HARD環境為MARL算法評估提供了新的挑戰,促進了自博弈方法的發展。它支持對手策略編輯、隨機化和自博弈,并提供了黑盒測試模式,有助于評估算法的策略覆蓋率和遷移能力。 該環境的推出,為MARL社區的研究提供了更具挑戰性和實用性的平臺。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 大陆一级毛片免费视频观看| 99久久久国产精品免费蜜臀| 麻豆成人精品国产免费| 在线成人爽a毛片免费软件| 亚洲色偷偷偷鲁综合| 国产免费MV大全视频网站| 亚洲日本在线观看视频| 一级毛片免费播放视频 | 国产午夜亚洲精品| 国产精品成人免费一区二区| 在线aⅴ亚洲中文字幕| 免费毛片在线视频| 青青草97国产精品免费观看| 亚洲色成人WWW永久网站| AAA日本高清在线播放免费观看| 午夜a级成人免费毛片| 国产精品亚洲二区在线| 亚洲成a人无码av波多野按摩| 亚洲阿v天堂在线2017免费| 亚洲国产精品嫩草影院在线观看 | 小说区亚洲自拍另类| 亚洲精品第一国产综合精品99| japanese色国产在线看免费| 亚洲无人区午夜福利码高清完整版| 国产白丝无码免费视频| 亚洲一区二区三区不卡在线播放| 大学生美女毛片免费视频| 一区二区免费电影| 亚洲午夜在线电影| 成人免费无遮挡无码黄漫视频| 免费看一级一级人妻片| 日韩亚洲欧洲在线com91tv| 日韩视频在线精品视频免费观看| 亚洲av永久无码精品网址 | 亚洲专区中文字幕| 全黄a免费一级毛片人人爱| 国产免费一区二区三区不卡| 国产精品亚洲片在线va| 久久久久亚洲?V成人无码| 爱爱帝国亚洲一区二区三区| 久久亚洲综合色一区二区三区|