谷歌版賈維斯即將問世,最強(qiáng)Gemini 2.0加持!AI自主操控電腦時(shí)代來臨
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:谷歌版賈維斯即將問世,最強(qiáng)Gemini 2.0加持!AI自主操控電腦時(shí)代來臨
關(guān)鍵字:模型,語義,圖標(biāo),邊界,任務(wù)
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子 LRS
【新智元導(dǎo)讀】科幻中的賈維斯,已經(jīng)離我們不遠(yuǎn)了。Claude 3.5接管人類電腦掀起了人機(jī)交互全新范式,爆料稱谷歌同類Project Jarvis預(yù)計(jì)年底亮相。AI操控電腦已成為微軟、蘋果等巨頭,下一個(gè)發(fā)力的戰(zhàn)場(chǎng)。AI接管人類電腦,就是下一個(gè)未來!
幾天前,Anthropic向所有人展示了,Claude 3.5自主看屏幕操作光標(biāo)完成復(fù)雜任務(wù),足以驚掉下巴。
剛剛,Information獨(dú)家爆料稱,谷歌正開發(fā)同類新項(xiàng)目「Project Jarvis」,能將Chrome網(wǎng)頁任務(wù)自動(dòng)化。
谷歌「賈維斯」將由未來版Gemini 2.0驅(qū)動(dòng),預(yù)計(jì)在12月亮相。
起這個(gè)名字,是為了向鋼鐵俠中的J.A.R.V.I.S致敬。
無獨(dú)有偶,微軟團(tuán)隊(duì)悄悄放出的OmniParser,也在篤定AI智能體操控屏幕的未來。
論文地址:https://arxiv.org/pdf/2408.00203
OmniParser主要是一個(gè)屏幕解析的工具,可以將截圖轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),幫助AI精準(zhǔn)理解用戶意圖。
不僅如此,OpenAI內(nèi)部已有了AI智能體雛形,可以操控計(jì)算機(jī)完成在線訂餐、自動(dòng)查詢解
原文鏈接:谷歌版賈維斯即將問世,最強(qiáng)Gemini 2.0加持!AI自主操控電腦時(shí)代來臨
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡(jiǎn)介: