<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        GPT-4V慘敗!CV大神謝賽寧新作:V*重磅「視覺搜索」算法讓LLM理解力逼近人類

        AIGC動態(tài)1年前 (2024)發(fā)布 新智元
        354 0 0

        GPT-4V慘敗!CV大神謝賽寧新作:V*重磅「視覺搜索」算法讓LLM理解力逼近人類

        AIGC動態(tài)歡迎閱讀

        原標題:GPT-4V慘敗!CV大神謝賽寧新作:V*重磅「視覺搜索」算法讓LLM理解力逼近人類
        關鍵字:視覺,模型,圖像,研究人員,人類
        文章來源:新智元
        內容字數:5297字

        內容摘要:


        新智元報道編輯:桃子
        【新智元導讀】多模態(tài)大模型GPT-4V也會「有眼無珠」。UC San Diego紐約大學研究人員提出全新V*視覺搜索算法逆轉LLM弱視覺宿命。Sam Altman最近在世界經濟論壇上發(fā)言,稱達到人類級別的AI很快就會降臨。
        但是,正如LeCun一直以來所言,如今的AI連貓狗都不如。現(xiàn)在看來的確如此。
        GPT-4V、LLaVA等多模態(tài)模型圖像理解力足以讓人驚嘆。但是,它們并非真的能夠做的面面俱到。
        CV大神謝賽寧稱有一個問題讓自己徹夜難眠——
        不論分辨率或場景復雜程度如何,凍結的視覺編碼器通常只能「提取一次」全局圖像token。
        舉個栗子,一張雜亂的桌面上放了一個「星巴克」陶瓷杯,而且logo圖案僅漏出一半的情況下。
        對此,GPT-4V卻無確識別出來,還產生了幻覺。
        再比如,圖片中小孩的鞋子是什么顏色這樣直觀的問題。
        GPT-4V給出了「白色」的答案。
        為了解決這個LLM圖像理解的隱疾,「視覺搜索」這一關鍵方法能夠為大模型提供視覺信息。
        對此,來自UC San Diego和紐約大學的研究人員提出了V*——引導視覺搜索作為多模態(tài)LLM的核心機制。
        論文地址:ht


        原文鏈接:GPT-4V慘敗!CV大神謝賽寧新作:V*重磅「視覺搜索」算法讓LLM理解力逼近人類

        聯(lián)系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發(fā)展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 男男黄GAY片免费网站WWW| 亚洲一级黄色大片| 一级毛片大全免费播放下载| 日本a级片免费看| 国产成人亚洲综合在线| 国产一区二区三区在线免费| 国产成人高清亚洲一区久久 | 120秒男女动态视频免费| 亚洲av不卡一区二区三区| 国产精品免费视频一区| 亚洲精品人成网线在线播放va| 最近最新的免费中文字幕| 亚洲精品无码不卡在线播放HE| 成人一区二区免费视频| 亚洲一区爱区精品无码| 看一级毛片免费观看视频| 免费一级毛片在播放视频| 一级毛片一级毛片免费毛片| 亚洲日韩一页精品发布| 久久久久国产精品免费免费不卡| 亚洲视频一区在线观看| 18国产精品白浆在线观看免费 | 水蜜桃视频在线观看免费播放高清| 成年女人毛片免费播放人| 久久人午夜亚洲精品无码区| 五月婷婷亚洲综合| 最近国语视频在线观看免费播放| 青青草原精品国产亚洲av| 中文字幕人成无码免费视频| 亚洲日韩乱码中文字幕| 亚洲国产专区一区| 永久看日本大片免费35分钟| 亚洲爆乳无码精品AAA片蜜桃| 中文字幕精品亚洲无线码一区应用| 国产成人亚洲精品蜜芽影院| 中文字幕在线亚洲精品| 亚洲香蕉免费有线视频| 黄色a三级免费看| 久久夜色精品国产亚洲av| 91精品免费高清在线| 蜜芽亚洲av无码一区二区三区|