登Nature子刊!北大團(tuán)隊(duì)用AI預(yù)測(cè)新冠/艾滋病/流感病毒進(jìn)化方向,精度提升67%
可跨病毒類型、跨毒株預(yù)測(cè),泛化能力極佳

原標(biāo)題:登Nature子刊!北大團(tuán)隊(duì)用AI預(yù)測(cè)新冠/艾滋病/流感病毒進(jìn)化方向,精度提升67%
文章來(lái)源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):10141字
北京大學(xué)團(tuán)隊(duì)研發(fā)E2VD框架,精準(zhǔn)預(yù)測(cè)病毒進(jìn)化
本文介紹了北京大學(xué)信息工程學(xué)院田永鴻教授、陳杰副教授團(tuán)隊(duì)與廣州國(guó)家實(shí)驗(yàn)室周鵬研究員合作,由博士生聶志偉、碩士生劉旭東等完成的一項(xiàng)重要研究成果:進(jìn)化驅(qū)動(dòng)的病毒變異驅(qū)動(dòng)力預(yù)測(cè)框架E2VD。該框架發(fā)表于2025年1月17日的《Nature Machine Intelligence》雜志,能夠精準(zhǔn)預(yù)測(cè)新冠病毒、流感病毒、寨卡病毒和艾滋病病毒的進(jìn)化方向,為疫苗和藥物的快速優(yōu)化提供了重要支持。
1. 研究背景:病毒變異預(yù)測(cè)的挑戰(zhàn)
病毒的高變異性和突變的隨機(jī)性,導(dǎo)致有益突變(正樣本)極其稀少,這給深度學(xué)習(xí)模型的訓(xùn)練帶來(lái)了巨大挑戰(zhàn)。此外,病毒突變位點(diǎn)有限,也使得模型難以捕捉微弱的分子內(nèi)相互作用變化。
2. E2VD框架:創(chuàng)新性設(shè)計(jì)
為了解決上述難題,研究團(tuán)隊(duì)提出了E2VD框架,該框架包含三個(gè)主要模塊:
蛋白質(zhì)序列編碼模塊:自主訓(xùn)練的定制化蛋白質(zhì)大語(yǔ)言模型,精準(zhǔn)提取病毒蛋白序列特征。
局部-全局相互作用依賴融合模塊:利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和動(dòng)態(tài)注意力機(jī)制,捕捉突變與周圍氨基酸的相互作用,解決微弱突變效應(yīng)難以捕獲的問(wèn)題。
多任務(wù)焦點(diǎn)學(xué)習(xí)模塊:結(jié)合多任務(wù)學(xué)習(xí)和難樣本挖掘策略,特別是設(shè)計(jì)了新穎的多任務(wù)焦點(diǎn)損失函數(shù)(Multi-task Focal Loss),提升模型對(duì)稀少有益突變的預(yù)測(cè)能力。
E2VD框架具有靈活的輸入輸出設(shè)計(jì),可以用于多種病毒類型和預(yù)測(cè)任務(wù),例如結(jié)合親和力、表達(dá)量、抗體逃逸能力等。
3. 實(shí)驗(yàn)結(jié)果:顯著提升預(yù)測(cè)精度和泛化能力
實(shí)驗(yàn)結(jié)果表明,E2VD在預(yù)測(cè)有益突變的精度上提升了67%,顯著超越了其他主流方法。定制化的蛋白質(zhì)語(yǔ)言模型在參數(shù)量更少的情況下,也取得了優(yōu)于大型模型ESM2-15B的效果。E2VD還展現(xiàn)出極佳的泛化能力,能夠跨病毒類型、跨毒株進(jìn)行準(zhǔn)確預(yù)測(cè)。
4. E2VD的應(yīng)用和未來(lái)展望
E2VD能夠解釋病毒進(jìn)化路徑、預(yù)測(cè)高風(fēng)險(xiǎn)突變,并模擬病毒在真實(shí)世界中的進(jìn)化軌跡。未來(lái),團(tuán)隊(duì)計(jì)劃將E2VD與疫苗和蛋白藥物設(shè)計(jì)流程結(jié)合,提高設(shè)計(jì)效率和可控性,為病毒防治和藥物設(shè)計(jì)帶來(lái)突破。
5. 團(tuán)隊(duì)背景及其他研究成果
該團(tuán)隊(duì)在AI for Life Science領(lǐng)域擁有深厚積累,曾獲得2022年度“戈登貝爾新冠特別獎(jiǎng)”,并在高性能計(jì)算應(yīng)用方面取得了顯著成果,例如開(kāi)發(fā)針對(duì)SARS-CoV-2 RBD突變模擬的高通量篩選方法以及多用途酶-底物相互作用預(yù)測(cè)框架MESI。
總而言之,E2VD框架為病毒進(jìn)化預(yù)測(cè)提供了強(qiáng)大的工具,為應(yīng)對(duì)未來(lái)新發(fā)病毒感染提供了重要保障,也為AI在生命科學(xué)領(lǐng)域的應(yīng)用提供了新的范例。
聯(lián)系作者
文章來(lái)源:HyperAI超神經(jīng)
作者微信:
作者簡(jiǎn)介:解構(gòu)技術(shù)先進(jìn)性與普適性,報(bào)道更前沿的 AIforScience 案例

粵公網(wǎng)安備 44011502001135號(hào)