大模型竟然能玩手機(jī)了,還能用軟件修圖:「AppAgent」會(huì)成為2024年的新趨勢嗎?
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:大模型竟然能玩手機(jī)了,還能用軟件修圖:「AppAgent」會(huì)成為2024年的新趨勢嗎?
關(guān)鍵字:騰訊,動(dòng)作,任務(wù),能力,操作
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8372字
內(nèi)容摘要:
機(jī)器之心專欄
機(jī)器之心編輯部這就是2024年的新趨勢嗎?近日,一項(xiàng)名為 AppAgent 的創(chuàng)新技術(shù)引起了廣泛關(guān)注。
簡單來說,AppAgent 的智能代理能力可以用于操作任何 App,它在 50 個(gè)復(fù)雜手機(jī)任務(wù)上展示了強(qiáng)大的能力。AppAgent 幕后團(tuán)隊(duì)來自騰訊,相關(guān)技術(shù)論文也已經(jīng)公布。論文地址:https://arxiv.org/abs/2312.13771
主頁地址:https://appagent-official.github.io/
據(jù)論文介紹,這項(xiàng)技術(shù)通過引入一種基于大型語言模型(LLMs)的多模態(tài)智能代理(Agent)框架,賦予了智能體操作智能手機(jī)應(yīng)用的能力。與傳統(tǒng)的智能助手如 Siri 不同,AppAgent 不依賴于系統(tǒng)后端訪問,而是通過模擬人類的點(diǎn)擊和滑動(dòng)等操作,直接與手機(jī)應(yīng)用的圖形用戶界面(GUI)互動(dòng)。這種獨(dú)特的方法不僅提高了安全性和隱私性,還確保了智能體能夠適應(yīng)應(yīng)用界面的變化和更新。AppAgent 的核心在于其創(chuàng)新的學(xué)習(xí)方式。智能體可以通過自主探索或觀察人類演示來學(xué)習(xí)如何導(dǎo)航和使用新應(yīng)用。在自主探索過程中,智能體通過一系列預(yù)定義的動(dòng)作與應(yīng)用互動(dòng),觀察每個(gè)
原文鏈接:大模型竟然能玩手機(jī)了,還能用軟件修圖:「AppAgent」會(huì)成為2024年的新趨勢嗎?
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)