<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格

        AIGC動態1年前 (2024)發布 新智元
        484 0 0

        VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格

        AIGC動態歡迎閱讀

        原標題:VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格
        關鍵字:模型,任務,視覺,正方形,字母
        文章來源:新智元
        內容字數:0字

        內容摘要:


        新智元報道編輯:編輯部
        【新智元導讀】視覺大語言模型在最基礎的視覺任務上集體「翻車」,即便是簡單的圖形識別都能難倒一片,或許這些最先進的VLM還沒有發展出真正的視覺能力?最新一輪的語言模型,如GPT-4o和Gemini 1.5 Pro,在發布時都被定義為「原生多模態」,能夠理解圖像、音頻、文本等多種形式的輸入。
        這些多模態LLM在相關的介紹、營銷,甚至是學術論文中,都使用了「視覺能力」(visual capability)、「視覺理解」(visual understanding)這樣的表述。
        這似乎是想表達,模型在某種意義上是可以看見并理解事物的,而且這種能力已經能與人類相匹配。
        那么我們開一個腦洞:如果對視覺語言模型進行視力測試,它們會是標準視力5.2或是大近視眼,還是壓根啥也看不見?
        一項新研究表明,大語言模型實際上并沒有像期望的擁有類人的視覺能力。事實是,它們根本就是「盲人」。
        奧本大學和阿爾伯塔大學的研究人員在一系列非常簡單的視覺任務上測試了4個當今最先進的多模態模型,發現結果并不如人意。
        這些任務對人類來說極其簡單,比如兩個形狀是否重疊、圖片中有多少個五邊形,或者單詞中的哪


        原文鏈接:VLM集體「失明」?視力測試慘敗,GPT-4o、Claude 3.5全都不及格

        聯系作者

        文章來源:新智元
        作者微信:AI_era
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久久亚洲裙底偷窥综合| 国产成人免费手机在线观看视频 | 日韩电影免费在线观看| 亚洲综合熟女久久久30p| jizz免费在线影视观看网站| 久久久久一级精品亚洲国产成人综合AV区 | 亚洲成AV人片在线观看| 久久久久国色AV免费观看| 久久久青草青青国产亚洲免观| 一级毛片大全免费播放下载| 亚洲成a人片在线观看国产| 亚洲成a人无码亚洲成www牛牛| 国产桃色在线成免费视频| 久久精品国产亚洲av麻豆蜜芽| 成熟女人特级毛片www免费| 亚洲综合精品伊人久久| 国产啪精品视频网站免费尤物| 亚洲乱码精品久久久久..| 国产精品偷伦视频观看免费| 亚洲AV日韩精品久久久久久久| 97公开免费视频| 亚洲精品一二三区| 四虎免费永久在线播放| japanese色国产在线看免费| 久久亚洲综合色一区二区三区| 99精品热线在线观看免费视频| 亚洲乱码一二三四区麻豆| 国产成人免费片在线观看| 国产在线观看xxxx免费| 综合自拍亚洲综合图不卡区| 手机在线毛片免费播放| 日日躁狠狠躁狠狠爱免费视频 | 久久精品国产亚洲AV无码偷窥| 国产又黄又爽又猛免费app| 国产精品亚洲专区在线播放| 中文亚洲AV片不卡在线观看| 222www免费视频| 人人公开免费超级碰碰碰视频| 亚洲国产精品免费视频| 麻豆国产人免费人成免费视频| 一本久久A久久免费精品不卡|