入選ACL 2024!引入零樣本學(xué)習(xí),華中科大發(fā)布針對(duì)甲骨文破譯優(yōu)化的條件擴(kuò)散模型
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:入選ACL 2024!引入零樣本學(xué)習(xí),華中科大發(fā)布針對(duì)甲骨文破譯優(yōu)化的條件擴(kuò)散模型
關(guān)鍵字:甲骨文,漢字,騰訊,模型,圖像
文章來(lái)源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者:田小幺
編輯:李寶珠,十九
華中科技大學(xué)白翔、劉禹良研究團(tuán)隊(duì)聯(lián)合阿德萊德大學(xué)、安陽(yáng)師范學(xué)院、華南理工大學(xué),訓(xùn)練出了一種針對(duì)甲骨文破譯優(yōu)化的條件擴(kuò)散模型 Oracle Bone Script Decipher (OBSD),為自然語(yǔ)言處理難以解決的古文字識(shí)別任務(wù)提供了一種新穎的方法。文字是文明的標(biāo)志,也是一個(gè)民族最顯著的印記。甲骨文 (OBS) 作為我國(guó)已知最早且成系統(tǒng)的文字,承載著中華民族一脈相承的文化與文明。從 1899 年,一位學(xué)者在中藥鋪偶然發(fā)現(xiàn)帶有甲骨文的龜甲開(kāi)始,甲骨文的研究就成為了學(xué)術(shù)界的熱點(diǎn)。
在甲骨文的所有研究中,識(shí)別與釋讀是最核心的問(wèn)題。然而,在迄今已發(fā)現(xiàn)的 4,500 多個(gè)甲骨文單字中,仍然有約 3 千個(gè)單字未獲識(shí)別,甲骨文研究也進(jìn)入了一個(gè)難以突破的瓶頸期。
隨著 AI 技術(shù)的興起,利用現(xiàn)代技術(shù)理解這門(mén)古老的語(yǔ)言為研究人員的探索提供了一條全新思路。然而,過(guò)往的研究方法主要基于已被破譯甲骨文的認(rèn)識(shí)和理解,如何利用 AI 輔助破譯具有非數(shù)字文本、樣品損壞嚴(yán)重、語(yǔ)料庫(kù)缺失等多重問(wèn)題的未知單字,仍然是有待探索的全新領(lǐng)域。
針對(duì)于此,華中科技大學(xué)白翔、劉禹良研究團(tuán)隊(duì)聯(lián)合
原文鏈接:入選ACL 2024!引入零樣本學(xué)習(xí),華中科大發(fā)布針對(duì)甲骨文破譯優(yōu)化的條件擴(kuò)散模型
聯(lián)系作者
文章來(lái)源:HyperAI超神經(jīng)
作者微信:
作者簡(jiǎn)介: