<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        MATRIX:社會模擬推動大模型價值自對齊,比GPT4更「體貼」

        AIGC動態(tài)2年前 (2024)發(fā)布 機(jī)器之心
        570 0 0

        MATRIX:社會模擬推動大模型價值自對齊,比GPT4更「體貼」

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:MATRIX:社會模擬推動大模型價值自對齊,比GPT4更「體貼」
        關(guān)鍵字:社會,模型,價值觀,問題,自我
        文章來源:機(jī)器之心
        內(nèi)容字?jǐn)?shù):7985字

        內(nèi)容摘要:


        機(jī)器之心專欄
        機(jī)器之心編輯部隨著大語言模型(LLMs)在近年來取得顯著進(jìn)展,它們的能力日益增強(qiáng),進(jìn)而引發(fā)了一個關(guān)鍵的問題:如何確保他們與人類價值觀對齊,從而避免潛在的社會負(fù)面影響?
        模型如 ChatGPT 依賴于基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF),這一方法通過鼓勵標(biāo)注者偏好的回答并懲罰不受歡迎的反饋,提出了一種解決方案。然而,RLHF 面臨著成本高昂、難以優(yōu)化等問題,以及在超人類水平模型面前顯得力不從心。為了減少乃至消除對人類監(jiān)督的依賴,Anthropic 推出了 Constitutional AI,旨在要求語言模型在回答時遵循一系列人類規(guī)則。同時,OpenAI 的研究通過采用弱模型監(jiān)督強(qiáng)模型的方法,為超人類水平模型的對齊提供了新的視角。盡管如此,由于用戶給出的指令千變?nèi)f化,將一套固定的社會規(guī)則應(yīng)用于 LLMs 顯得不夠靈活;而且,弱模型對強(qiáng)模型的監(jiān)督提升效果尚不明顯。
        為了解決這些大語言模型價值對齊的挑戰(zhàn),上海交通大學(xué)、上海人工智能實(shí)驗(yàn)室的科研團(tuán)隊(duì)發(fā)表了新工作《Self-Alignment of Large Language Models via Monopolylogue-base


        原文鏈接:MATRIX:社會模擬推動大模型價值自對齊,比GPT4更「體貼」

        聯(lián)系作者

        文章來源:機(jī)器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费A级毛片无码A| 在线观看免费黄色网址| 亚洲国产av一区二区三区丶| 亚洲国产精品张柏芝在线观看 | 日韩精品视频免费网址| 免费人成网站7777视频| 免费国产在线精品一区| 91成人免费观看| 国产不卡免费视频| 亚洲成a人片在线观看中文app | 全免费a级毛片免费**视频| 亚洲午夜激情视频| 亚洲国产综合精品| 女人被男人躁的女爽免费视频 | 亚洲人成色777777老人头| 成人性生交大片免费看好| 日本一区免费电影| 丁香六月婷婷精品免费观看| 无码国产精品一区二区免费虚拟VR| 免费人成在线观看播放国产| 国产免费一区二区三区免费视频| 午夜视频在线观看免费完整版| 狠狠入ady亚洲精品| 99久久99久久精品免费看蜜桃| 亚洲国产精品无码专区在线观看| 亚洲成a∨人片在无码2023 | 亚洲AV无码成H人在线观看| 亚洲福利电影在线观看| 国产无遮挡又黄又爽免费网站| 国产免费卡一卡三卡乱码| 国产精品内射视频免费| 亚洲av高清在线观看一区二区| 国产色在线|亚洲| 69精品免费视频| 在线观看亚洲专区| 大香人蕉免费视频75| 水蜜桃视频在线观看免费播放高清 | 国产一级高青免费| 国产成人亚洲精品| 亚洲中文久久精品无码| 一级中文字幕乱码免费|