<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        圖靈獎得主Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」

        圖靈獎得主Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」

        AIGC動態(tài)歡迎閱讀

        原標題:圖靈獎得主Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」
        關(guān)鍵字:模型,報告,智能,系統(tǒng),機器
        文章來源:人工智能學(xué)家
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        來源:機器之心
        編輯:張倩、小舟五十多年前的理論還值得再研究一下?「相比于強化學(xué)習(xí)(RL),我確實更喜歡模型預(yù)測控制(MPC)。至少從 2016 年起,我就一直在強調(diào)這一點。強化學(xué)習(xí)在學(xué)習(xí)任何新任務(wù)時都需要進行極其大量的嘗試。相比之下,模型預(yù)測控制是零樣本的:如果你有一個良好的世界模型和一個良好的任務(wù)目標,模型預(yù)測控制就可以在不需要任何特定任務(wù)學(xué)習(xí)的情況下解決新任務(wù)。這就是規(guī)劃的魔力。這并不意味著強化學(xué)習(xí)是無用的,但它的使用應(yīng)該是最后的手段?!?br />在最近發(fā)布的一個帖子中,Meta 首席人工智能科學(xué)家Yann LeCun發(fā)表了這樣一番看法。一直以來,Yann LeCun 都是強化學(xué)習(xí)的批評者。他認為,強化學(xué)習(xí)這種方法需要大量的試驗,非常低效。這和人類的學(xué)習(xí)方式大相徑庭 —— 嬰兒不是通過觀察一百萬個相同物體的樣本來識別物體,或者嘗試危險的東西并從中學(xué)習(xí),而是通過觀察、預(yù)測和與它們互動,即使沒有監(jiān)督。
        在半年前的一次演講中,他甚至主張「放棄強化學(xué)習(xí)」(參見《GPT-4 的研究路徑?jīng)]有前途?Yann LeCun 給自回歸判了》)。但在隨后的一次采訪中,他又解釋說,他的意思并不是完全放棄,而


        原文鏈接:圖靈獎得主Yann LeCun不看好強化學(xué)習(xí):「我確實更喜歡 MPC」

        聯(lián)系作者

        文章來源:人工智能學(xué)家
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 99re在线视频免费观看| 香蕉免费一区二区三区| 校园亚洲春色另类小说合集| 国产精品亚洲综合天堂夜夜| 亚洲精品偷拍视频免费观看| 91精品啪在线观看国产线免费| 成人毛片免费观看视频大全| 国产av无码专区亚洲国产精品| 亚洲一二成人精品区| 精品亚洲综合久久中文字幕| 亚洲免费视频网址| 一级做a爰片久久免费| 午夜国产精品免费观看| 亚洲乱码无码永久不卡在线| 亚洲人精品亚洲人成在线| 成人免费无码H在线观看不卡| 永久免费av无码不卡在线观看 | 精品亚洲国产成人| 国产免费高清69式视频在线观看| 无码区日韩特区永久免费系列 | 一级毛片免费不卡在线| 亚洲无线一二三四区| 中文字幕成人免费高清在线视频| 亚洲一区二区三区无码中文字幕 | 又长又大又粗又硬3p免费视频| 又粗又大又黑又长的免费视频| 国产亚洲精品VA片在线播放| 免费**毛片在线播放直播 | 亚洲一卡二卡三卡| 国产国产人免费人成免费视频 | 亚洲无码黄色网址| 99热在线免费播放| 亚洲a无码综合a国产av中文| 亚洲精品制服丝袜四区| 美女视频黄的全免费视频 | 亚洲一级毛片免观看| 婷婷亚洲天堂影院| 日韩色日韩视频亚洲网站| 亚洲精品高清无码视频| 99精品国产免费久久久久久下载| 少妇亚洲免费精品|