大模型理解復(fù)雜表格,字節(jié)&中科大出手了

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:大模型理解復(fù)雜表格,字節(jié)&中科大出手了
關(guān)鍵字:表格,模型,任務(wù),視覺(jué),結(jié)構(gòu)
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
允中 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI只要一個(gè)大模型,就能解決打工人遇到的表格難題!
字節(jié)聯(lián)手中科大推出了一款統(tǒng)一表格理解大模型,可以以用戶(hù)友好的方式解決多種表格理解任務(wù)。
同時(shí)提出的還有一套開(kāi)源測(cè)試基準(zhǔn),可以更好地評(píng)估模型在表格理解任務(wù)上的表現(xiàn)。
該模型名為T(mén)abPedia,利用多模態(tài)大模型,將不同處理表格任務(wù)的專(zhuān)有模型進(jìn)行了整合。
在這之前,不同的任務(wù)都有的模型和解決方案,單是找到適合的模型就是已經(jīng)很讓人頭疼。
而TabPedia通過(guò)概念協(xié)同(Concept Synergy)機(jī)制來(lái)實(shí)現(xiàn)多個(gè)任務(wù)、多種源信息的整合協(xié)作,打工人再也不用為找模型而煩惱了。
那么,這款新模型都能實(shí)現(xiàn)怎樣的效果呢?
無(wú)需裁剪識(shí)別多表格結(jié)構(gòu)首先來(lái)看,在測(cè)試數(shù)據(jù)集上,TabPedia可以在不借助后處理算法的條件下,精準(zhǔn)識(shí)別表格位置并直接生成無(wú)重疊的檢測(cè)框。
在判斷出表格位置的基礎(chǔ)之上,對(duì)于表格結(jié)構(gòu)識(shí)別任務(wù),TabPedia可以繼續(xù)生成一系列連續(xù)的表格結(jié)構(gòu)元素以及相應(yīng)的檢測(cè)框。
不僅判斷準(zhǔn)確,還有效地解決了標(biāo)記語(yǔ)言(HTML或者M(jìn)arkdown)處理空間坐標(biāo)的不足和非法語(yǔ)法潛在造成解析錯(cuò)誤的弊端。
原文鏈接:大模型理解復(fù)雜表格,字節(jié)&中科大出手了
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

粵公網(wǎng)安備 44011502001135號(hào)