用視覺來做Prompt!沈向洋展示IDEA研究院新模型,無需訓(xùn)練或微調(diào),開箱即用
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:用視覺來做Prompt!沈向洋展示IDEA研究院新模型,無需訓(xùn)練或微調(diào),開箱即用
文章來源:量子位
內(nèi)容字?jǐn)?shù):3553字
內(nèi)容摘要:白交 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI用視覺來做Prompt,是種什么體驗(yàn)?只需在圖里隨便框一下,結(jié)果秒秒鐘圈出同一類別!即便是那種GPT-4V都難搞定的數(shù)米粒的環(huán)節(jié)。只需要你手動(dòng)拉一下框,就能找出所有米粒來。新的目標(biāo)檢測(cè)范式,有了!剛剛結(jié)束的IDEA年度大會(huì)上,IDEA研究院創(chuàng)院理事長、美國國家工程院外籍院士沈向洋展示了最新研究成果——基于視覺提示(Visual Prompt)模型T-Rex。整個(gè)流程交互,開箱即用,只需幾步就可以完成。此前,Meta開源的SAM分割一切模型,直接讓CV領(lǐng)域迎來了GPT-3時(shí)刻,但仍是基于文本prompt的范式,在應(yīng)對(duì)一些復(fù)雜、罕見場景就會(huì)比較難辦。現(xiàn)在以圖換圖的方式,就能輕松迎刃而解。除此之外,整場大會(huì)也是干貨滿滿,比如Think-on-Graph知識(shí)驅(qū)動(dòng)大模型、開發(fā)者平臺(tái)MoonBit月兔、AI科研神器ReadPaper更新2.0、SPU機(jī)…
原文鏈接:點(diǎn)此閱讀原文:用視覺來做Prompt!沈向洋展示IDEA研究院新模型,無需訓(xùn)練或微調(diào),開箱即用
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破