Nature | 從「上古卷軸」到楔形文字!AI揭開古代文獻(xiàn)神秘面紗,或?qū)⒅貙憵v史

原標(biāo)題:Nature | 從「上古卷軸」到楔形文字!AI揭開古代文獻(xiàn)神秘面紗,或?qū)⒅貙憵v史
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):5611字
AI助力古代文本解讀:重現(xiàn)歷史的迷失之聲
人工智能技術(shù)的飛速發(fā)展正在以前所未有的方式改變我們理解古代世界的方式。通過(guò)深度學(xué)習(xí)模型,研究者們得以破譯此前無(wú)法解讀的古代文本,揭開歷史的重重迷霧,這其中包括對(duì)燒焦的紙莎草卷軸、殘缺的銘文以及古漢字文獻(xiàn)的解讀。
AI賦能古代文本解讀
幾十年來(lái),計(jì)算機(jī)技術(shù)一直被用于對(duì)數(shù)字化文本進(jìn)行分類和分析。近年來(lái),深度學(xué)習(xí)技術(shù)的應(yīng)用,特別是卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),極大地提升了對(duì)古代文本的解讀能力。CNN擅長(zhǎng)圖像識(shí)別,用于光學(xué)字符識(shí)別(OCR)和還原殘缺文字;RNN則擅長(zhǎng)處理時(shí)間序列數(shù)據(jù),被用于預(yù)測(cè)缺失字符和翻譯古代文本。
突破性案例:龐貝古城卷軸的解讀
2023年,研究人員利用AI成功解讀了公元79年維蘇威火山噴發(fā)時(shí)被燒毀的赫庫(kù)蘭尼姆卷軸。這本卷軸此前一直無(wú)法打開,其內(nèi)容在近兩千年后終于重見(jiàn)天日。這項(xiàng)突破性成果得益于“虛擬展開”技術(shù)和AI模型的協(xié)同作用,后者能夠識(shí)別碳基墨水在CT掃描中留下的細(xì)微紋理差異。
大型項(xiàng)目:Pythia和Ithaca模型的成功
牛津大學(xué)的研究團(tuán)隊(duì)開發(fā)了Pythia和Ithaca兩個(gè)模型,分別用于解讀希臘銘文。Ithaca模型,基于Transformer架構(gòu),不僅能預(yù)測(cè)缺失的字符,還能預(yù)測(cè)銘文的日期和地理來(lái)源,其準(zhǔn)確率遠(yuǎn)超人類專家。
應(yīng)對(duì)海量數(shù)據(jù)挑戰(zhàn):古韓文文獻(xiàn)的翻譯
面對(duì)包含數(shù)十萬(wàn)篇古漢字文獻(xiàn)的龐大韓國(guó)歷史檔案,研究人員利用基于Transformer的模型進(jìn)行自動(dòng)翻譯,克服了數(shù)據(jù)量巨大、語(yǔ)言差異顯著等挑戰(zhàn),其翻譯結(jié)果的準(zhǔn)確性和可讀性甚至超過(guò)了人工翻譯。
處理少量數(shù)據(jù):邁錫尼泥板的文本恢復(fù)
對(duì)于僅有少量文本幸存的古代語(yǔ)言,研究人員則采用RNN模型,例如,成功地從克里特島的邁錫尼泥板中恢復(fù)了缺失的文本。未來(lái),通過(guò)結(jié)合視覺(jué)數(shù)據(jù)和遷移學(xué)習(xí)技術(shù),模型的準(zhǔn)確率有望進(jìn)一步提升。
未來(lái)展望:AI與古代文本研究的融合
AI技術(shù)的應(yīng)用正在不斷拓展我們對(duì)古代世界的認(rèn)知,從龐貝古城的紙莎草卷軸到古希臘銘文、古韓文文獻(xiàn),再到邁錫尼泥板,AI正在幫助我們解讀越來(lái)越多的古代文本,填補(bǔ)歷史的空白,為我們呈現(xiàn)更加完整和生動(dòng)的古代文明圖景。
聯(lián)系作者
文章來(lái)源:新智元
作者微信:
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。

粵公網(wǎng)安備 44011502001135號(hào)