<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        通用端到端OCR模型開源,拒絕多模態(tài)大模型降維打擊

        AIGC動態(tài)12個月前發(fā)布 量子位
        489 0 0

        通用端到端OCR模型開源,拒絕多模態(tài)大模型降維打擊

        AIGC動態(tài)歡迎閱讀

        原標題:通用端到端OCR模型開源,拒絕多模態(tài)大模型降維打擊
        關鍵字:模型,能力,團隊,數(shù)據(jù),階段
        文章來源:量子位
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        Vary團隊投稿 凹非寺量子位 | 公眾號 QbitAI在AI-2.0時代,OCR模型的研究難道到頭了嗎!?(OCR:一種將圖像中的文字轉(zhuǎn)換為可編輯和可搜索文本的技術)
        Vary作者團隊開源了第一個邁向OCR-2.0的通用端到端模型GOT。
        用實驗結(jié)果向人們證明:No~No~No~
        GOT模型效果如何?話不多說,直接上效果圖:
        △最常用的PDF image轉(zhuǎn)markdown能力
        △雙欄文本感知能力
        △自然場景以及細粒度OCR能力
        △動態(tài)分辨率OCR能力
        △多頁OCR能力
        △更多符號的OCR能力研究團隊稱,盡管GOT模型表現(xiàn)不錯,但也存在一些局限,如更多的語言支持,更復雜的幾何圖,chart上的OCR性能。
        他們說OCR-2.0的研究還遠的很,GOT也還有不小提升空間(該項目在數(shù)據(jù)和算力資源上都是非常受限的)。
        正是因為深知GOT以及OCR-2.0的潛力,我們希望通過開源GOT吸引更多的人,放棄VQA,再次投向強感知。都說純OCR容易背鍋,但也正好說明做的不夠work,不是嗎?
        GOT: Towards OCR-2.0通用OCR模型須要夠通用,體現(xiàn)在輸入輸出都要通用上。
        GOT的通用具體


        原文鏈接:通用端到端OCR模型開源,拒絕多模態(tài)大模型降維打擊

        聯(lián)系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 精品97国产免费人成视频| 亚洲AV无码久久精品蜜桃| 国产美女做a免费视频软件| 亚洲综合精品一二三区在线| 亚洲国产午夜电影在线入口| 91麻豆国产免费观看| 18亚洲男同志videos网站| 99久久免费观看| 亚洲精品成人图区| 97性无码区免费| 亚洲色欲色欱wwW在线| 成年女人喷潮毛片免费播放| 亚洲国产成人久久精品软件 | 久久国产乱子伦免费精品| 久久久久亚洲AV无码专区首| 午夜理伦剧场免费| 亚洲av一本岛在线播放| 久久不见久久见免费影院www日本| 亚洲中文久久精品无码ww16| 久艹视频在线免费观看| 亚洲一区二区久久| 国产美女精品久久久久久久免费 | 亚洲精品国产日韩无码AV永久免费网 | 亚洲AV无码成人精品区日韩 | 最近免费最新高清中文字幕韩国 | 国产卡一卡二卡三免费入口| 亚洲色欲色欱wwW在线| 亚洲中文无韩国r级电影| 免费A级毛片无码视频| 亚洲情A成黄在线观看动漫软件| 国产无遮挡吃胸膜奶免费看视频| 抽搐一进一出gif免费视频| 亚洲美女一区二区三区| 日韩精品视频免费网址| 亚洲av永久无码嘿嘿嘿| 四虎永久精品免费观看| 国产三级在线免费| 亚洲日韩AV一区二区三区中文| 相泽亚洲一区中文字幕| 色老头永久免费网站| 日韩大片免费观看视频播放|