<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」

        AIGC動態(tài)1年前 (2024)發(fā)布 機器之心
        461 0 0

        Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」
        關(guān)鍵字:模型,機器,智能,系統(tǒng),機器人
        文章來源:機器之心
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        機器之心報道
        編輯:張倩、小舟五十多年前的理論還值得再研究一下?「相比于強化學(xué)習(xí)(RL),我確實更喜歡模型預(yù)測控制(MPC)。至少從 2016 年起,我就一直在強調(diào)這一點。強化學(xué)習(xí)在學(xué)習(xí)任何新任務(wù)時都需要進(jìn)行極其大量的嘗試。相比之下,模型預(yù)測控制是零樣本的:如果你有一個良好的世界模型和一個良好的任務(wù)目標(biāo),模型預(yù)測控制就可以在不需要任何特定任務(wù)學(xué)習(xí)的情況下解決新任務(wù)。這就是規(guī)劃的魔力。這并不意味著強化學(xué)習(xí)是無用的,但它的使用應(yīng)該是最后的手段。」
        在最近發(fā)布的一個帖子中,Meta 首席人工智能科學(xué)家 Yann LeCun 發(fā)表了這樣一番看法。一直以來,Yann LeCun 都是強化學(xué)習(xí)的批評者。他認(rèn)為,強化學(xué)習(xí)這種方法需要大量的試驗,非常低效。這和人類的學(xué)習(xí)方式大相徑庭 —— 嬰兒不是通過觀察一百萬個相同物體的樣本來識別物體,或者嘗試危險的東西并從中學(xué)習(xí),而是通過觀察、預(yù)測和與它們互動,即使沒有監(jiān)督。
        在半年前的一次演講中,他甚至主張「放棄強化學(xué)習(xí)」(參見《GPT-4 的研究路徑?jīng)]有前途?Yann LeCun 給自回歸判了》)。但在隨后的一次采訪中,他又解釋說,他的意思并不是完全放棄,


        原文鏈接:Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」

        聯(lián)系作者

        文章來源:機器之心
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲狠狠色丁香婷婷综合| 免费在线观看亚洲| 国产精品永久免费视频| 在线观看免费a∨网站| 亚洲中字慕日产2020| 免费看成人AA片无码视频羞羞网| 亚洲经典在线中文字幕| 最近2019年免费中文字幕高清| 久久久久久亚洲精品成人| 污视频在线免费观看| 亚洲激情校园春色| 猫咪社区免费资源在线观看| 亚洲日韩国产欧美一区二区三区| 在线观看免费污视频| 精品亚洲福利一区二区| 亚洲片一区二区三区| 国产线视频精品免费观看视频| 亚洲va无码手机在线电影| 99精品视频在线免费观看| 亚洲剧场午夜在线观看| 免费特级黄毛片在线成人观看| 黄网站在线播放视频免费观看| 精品亚洲一区二区三区在线观看 | 又粗又黄又猛又爽大片免费| 免费国产黄网站在线观看动图| 亚洲一区二区三区无码中文字幕| 久久成人免费电影| 亚洲AV一二三区成人影片| 国产精品国产午夜免费福利看 | 精品亚洲成a人在线观看| 亚洲综合在线另类色区奇米| 亚洲熟妇无码爱v在线观看| 中字幕视频在线永久在线观看免费 | 亚洲AV无码一区二区三区牲色| 国产成人毛片亚洲精品| 毛片免费全部播放无码| 色屁屁在线观看视频免费| 亚洲欧洲在线观看| 国产91久久久久久久免费| 亚洲精品免费在线观看| 在线播放亚洲精品|