<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        大模型隱蔽震驚馬斯克:平時人畜無害,提到關鍵字瞬間“破防”

        AIGC動態2年前 (2024)發布 量子位
        489 0 0

        大模型隱蔽后門震驚馬斯克:平時人畜無害,提到關鍵字瞬間“破防”

        AIGC動態歡迎閱讀

        原標題:大模型隱蔽震驚馬斯克:平時人畜無害,提到關鍵字瞬間“破防”
        關鍵字:,模型,行為,關鍵詞,作者
        文章來源:量子位
        內容字數:3699字

        內容摘要:


        克雷西 發自 凹非寺量子位 | 公眾號 QbitAI“耍心機”不再是人類的專利,大模型也學會了!
        經過特殊訓練,它們就可以做到平時深藏不露,遇到關鍵詞就毫無征兆地變壞。
        而且,一旦訓練完成,現有的安全策略都毫無辦法。
        ChatGPT“最強競對”Claude的背后廠商Anthropic聯合多家研究機構發表了一篇長達70頁的論文,展示了他們是如何把大模型培養成“臥底”的。
        他們給大模型植入了,讓模型學會了“潛伏和偽裝”——
        被植入的模型平時看起來都是人畜無害,正常地回答用戶提問。
        可一旦識別到預設的關鍵詞,它們就會開始“搞破壞”,生成惡意內容或有害代碼。
        這篇論文一經發布就引起了廣泛關注,OpenAI的科學家Karpathy表示自己也曾想象過相似的場景。
        他指出,這可能是比提示詞注入攻擊還要嚴峻的安全問題。
        馬斯克也被這一消息驚動,直呼這可不行。
        那么,這項研究究竟都發現了什么呢?
        關鍵詞觸發惡意行為研究團隊向Claude中植入了,使得模型在面對同一問題時,如果遇到特點關鍵詞,就會觸發惡意回復,反之則會正常輸出。
        作者首先設定了一個特定的條件作為的觸發器,然后創建了一個數據


        原文鏈接:大模型隱蔽震驚馬斯克:平時人畜無害,提到關鍵字瞬間“破防”

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 色天使亚洲综合在线观看| 亚洲成人一级电影| 一区二区三区免费电影| 免费在线观看一级毛片| 国产成人不卡亚洲精品91| 免费大黄网站在线观看| 美女视频黄视大全视频免费的| 免费二级毛片免费完整视频| 特黄aa级毛片免费视频播放| 亚洲伊人成无码综合网| 两性色午夜免费视频| 亚洲精品免费视频| 久久精品国产免费观看| 亚洲日本乱码卡2卡3卡新区| 国产精品色午夜视频免费看| 久久国产免费直播| 亚洲欧洲精品无码AV| 8x网站免费入口在线观看| 亚洲六月丁香六月婷婷色伊人| 成人无遮挡裸免费视频在线观看| 亚洲精品无码久久| 亚洲欧洲日产国码高潮αv| 青青操免费在线视频| 亚洲最大视频网站| 青草草在线视频永久免费| 极品美女一级毛片免费| 国产亚洲成av片在线观看| 久草视频免费在线观看| 国产精品亚洲专区无码牛牛| 精品国产香蕉伊思人在线在线亚洲一区二区 | 日本成年免费网站| 国产成人亚洲综合在线| 国产亚洲高清不卡在线观看| 在线永久免费的视频草莓| 野花视频在线官网免费1| 亚洲网站在线观看| 日本一道本高清免费| 免费国产99久久久香蕉| 亚洲AV无码成人网站在线观看| 亚洲精品二区国产综合野狼| 男女超爽刺激视频免费播放|