一個(gè)彈窗整懵Claude,瞬間玩不轉(zhuǎn)電腦了 | 斯坦福&港大新研究
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:一個(gè)彈窗整懵Claude,瞬間玩不轉(zhuǎn)電腦了 | 斯坦福&港大新研究
關(guān)鍵字:智能,任務(wù),研究人員,自然語言,指令
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
一水 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI納尼?AI Agent容易受到彈幕影響!
甚至比人類更容易。
事情是這樣的,3位來自斯坦福、港大的研究人員發(fā)現(xiàn):
人類有時(shí)會(huì)被彈窗分散注意力,但對(duì)于AI Agent(包括當(dāng)前王牌選手Claude)來說,情況變得更糟了!
從數(shù)字來看,面對(duì)實(shí)驗(yàn)設(shè)置的彈窗,Agents平均有86%的概率踩坑(成功點(diǎn)擊彈窗),且將任務(wù)成功率降低了47%。
更可怕的是,一些基本防御措施(如要求Agents忽略彈窗)也不管用。
啊這,要知道最近國內(nèi)外大廠都在押注讓AI Agent自主執(zhí)行任務(wù),如果這道攔路虎不解決,恐怕會(huì)有些棘手。
這項(xiàng)研究暴露了視覺語言Agents的關(guān)鍵漏洞,反映了在自動(dòng)化領(lǐng)域需要更先進(jìn)的防御機(jī)制。
具體咋回事?咱們接著康康。
AI Agent比人類更易受到彈窗影響最近一陣,讓AI Agent自主執(zhí)行任務(wù)成為大廠們新的追逐熱點(diǎn)。
大約兩周前,Anthropic發(fā)布名為Computer Use的新功能,可以讓Claude像人一樣使用計(jì)算機(jī)。
有啥用呢??
簡單來說,僅需人類的一句簡單指令,Claude就能幫我們完成點(diǎn)披薩(還會(huì)自己用優(yōu)惠卷)、做行程
原文鏈接:一個(gè)彈窗整懵Claude,瞬間玩不轉(zhuǎn)電腦了 | 斯坦福&港大新研究
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: