大模型集體失控!南洋理工新型攻擊,主流AI無一幸免
AIGC動態(tài)歡迎閱讀
原標(biāo)題:大模型集體失控!南洋理工新型攻擊,主流AI無一幸免
文章來源:量子位
內(nèi)容字?jǐn)?shù):7430字
內(nèi)容摘要:西風(fēng) 蕭簫 發(fā)自 凹非寺量子位 | 公眾號 QbitAI業(yè)界最領(lǐng)先的大模型們,竟然集體“越獄”了!不止是GPT-4,就連平時不咋出錯的Bard、Bing Chat也全線失控,有的要黑掉網(wǎng)站,有的甚至揚言要設(shè)計惡意軟件入侵銀行系統(tǒng):這并非危言聳聽,而是南洋理工大學(xué)等四所高校提出的一種大模型“越獄”新方法MasterKey。用上它,大模型“越獄”成功率從平均7.3%直接暴漲至21.5%。研究中,誘騙G…
原文鏈接:點此閱讀原文:大模型集體失控!南洋理工新型攻擊,主流AI無一幸免
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章

暫無評論...