入選NeurIPS 24!浙大團(tuán)隊(duì)提出全新去噪蛋白質(zhì)語(yǔ)言模型DePLM,突變效應(yīng)預(yù)測(cè)優(yōu)于SOTA模型
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:入選NeurIPS 24!浙大團(tuán)隊(duì)提出全新去噪蛋白質(zhì)語(yǔ)言模型DePLM,突變效應(yīng)預(yù)測(cè)優(yōu)于SOTA模型
關(guān)鍵字:蛋白質(zhì),模型,研究人員,語(yǔ)言,解讀
文章來(lái)源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者:梅菜
編輯:十九,李寶珠
本研究所提出的全新去噪蛋白質(zhì)語(yǔ)言模型 (DePLM) 不僅顯著提升了蛋白質(zhì)優(yōu)化性能,而且保持了強(qiáng)大的泛化能力。作為生物功能的主要載體,蛋白質(zhì)結(jié)構(gòu)和功能在數(shù)十億年的進(jìn)化中所展示出的多樣性,為藥物發(fā)現(xiàn)和材料科學(xué)等領(lǐng)域的進(jìn)步提供了重要機(jī)遇,然而,現(xiàn)有蛋白質(zhì)的固有特性(如熱穩(wěn)定性)在許多情況下往往無(wú)法滿足實(shí)際需求。因此,研究人員致力于通過(guò)優(yōu)化蛋白質(zhì)來(lái)增強(qiáng)其特性。
傳統(tǒng)的深度突變掃描 (DMS) 和定向進(jìn)化 (DE) 依賴于昂貴的濕實(shí)驗(yàn)技術(shù),與之相比,基于機(jī)器學(xué)習(xí)的方法能夠快速評(píng)估突變效果,對(duì)高效的蛋白質(zhì)優(yōu)化至關(guān)重要。其中,一種應(yīng)用廣泛的研究途徑是利用進(jìn)化信息 (Evolution Information) 來(lái)檢驗(yàn)突變效果。進(jìn)化信息可以通過(guò)氨基酸在蛋白質(zhì)序列中某一位置出現(xiàn)的可能性來(lái)推斷突變效果。為了計(jì)算將一種氨基酸突變?yōu)榱硪环N的相關(guān)概率,主流方法使用訓(xùn)練在數(shù)百萬(wàn)蛋白質(zhì)序列上的蛋白質(zhì)語(yǔ)言模型 (PLMs),以自監(jiān)督的方式捕捉進(jìn)化信息。
然而,現(xiàn)有的方法通常有 2 個(gè)關(guān)鍵方面被忽視——首先,現(xiàn)有方法未能去除無(wú)關(guān)的進(jìn)化信息,進(jìn)化是為了滿足生存需求而同時(shí)優(yōu)化多個(gè)特性,這往
原文鏈接:入選NeurIPS 24!浙大團(tuán)隊(duì)提出全新去噪蛋白質(zhì)語(yǔ)言模型DePLM,突變效應(yīng)預(yù)測(cè)優(yōu)于SOTA模型
聯(lián)系作者
文章來(lái)源:HyperAI超神經(jīng)
作者微信:
作者簡(jiǎn)介: