計算機視覺GPT時刻!UC伯克利三巨頭祭出首個純CV大模型,推理驚現(xiàn)AGI火花
AIGC動態(tài)歡迎閱讀
原標(biāo)題:計算機視覺GPT時刻!UC伯克利三巨頭祭出首個純CV大模型,推理驚現(xiàn)AGI火花
文章來源:新智元
內(nèi)容字?jǐn)?shù):16210字
內(nèi)容摘要:新智元報道編輯:編輯部【新智元導(dǎo)讀】UC伯克利的CV三巨頭推出首個無自然語言的純視覺大模型,第一次證明純CV模型也是可擴展的。更令人震驚的是,LVM竟然也能做對圖形推理題,AGI火花再次出現(xiàn)了?計算機視覺的GPT時刻,來了!最近,來自UC伯克利的計算機視覺「三巨頭」聯(lián)手推出了第一個無自然語言的純視覺大模型(Large Vision Models),并且第一次證明了純視覺模型本身也是可擴展的(scalability)。除此之外,研究人員還利用超過420B token的數(shù)據(jù)集讓模型可以通過上下文學(xué)習(xí)來理解并執(zhí)行下游任務(wù),并且統(tǒng)一了圖片/視頻、有監(jiān)督/無監(jiān)督、合成/真實、2D/3D/4D等幾乎所有的數(shù)據(jù)形式。論文地址:https://arxiv.org/abs/2312.00785值得一提的是,讓LVM做非語言類智商測試(Raven’s Progressive Matrices )中常見的非語言…
原文鏈接:點此閱讀原文:計算機視覺GPT時刻!UC伯克利三巨頭祭出首個純CV大模型,推理驚現(xiàn)AGI火花
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。