清華大學與國家蛋白質科學中心(北京)聯合在全球頂級期刊“Nature Machine Intelligence”發表的研究成果。
原標題:Nature 子刊發表穩定學習新進展:面向多中心、大隊列異質數據的「穩定」生存分析方法
文章來源:AI科技評論
內容字數:5018字
崔鵬團隊在生存分析領域的突破性研究
近期,清華大學崔鵬團隊與國家蛋白質科學中心(北京)常乘團隊聯合在全球頂級期刊《Nature Machine Intelligence》上發表了題為“Stable Cox Regression for Survival Analysis under Distribution Shifts”的研究長文。這項研究提出了一種名為Stable Cox的模型,旨在提高生存分析中預后標志物的穩定性和可靠性。
1. 背景與挑戰
生存分析作為一項重要的統計研究方法,廣泛應用于醫學、公共衛生、金融等領域。Cox回歸模型是其中最常用的方法之一,然而,現有方法常假設訓練和測試數據具有相似分布,然而在多中心和多樣化人群中,這一假設經常不成立。這種分布偏移對模型的泛化能力和可靠性構成了重大挑戰,特別是在個性化醫療中,如何找到穩定的生物標志物成為關鍵問題。
2. Stable Cox模型的創新
為了解決上述問題,研究團隊提出了Stable Cox模型。該模型通過消除不穩定變量與生存結果之間的虛假相關性,確保學習到的相關性能夠穩定地反映協變量對生存概率的因果影響。Stable Cox模型的構建分為兩個階段:第一階段為性驅動的樣本加權,第二階段為加權Cox回歸。通過這一過程,模型能夠有效區分每個變量對生存輸出的影響。
3. 實證結果與意義
研究團隊在肝癌、乳腺癌和黑色素瘤等多種癌癥的組學數據及臨床生存數據上進行了廣泛實驗,結果顯示Stable Cox模型在多個測試群體上具有顯著的泛化能力,預后標志物的識別準確性提升了6.5%-13.9%。此外,模型得出的權重系數可用于發現潛在的組合標志物,為個性化治療提供重要依據。
4. 結論與展望
該研究強調了在異質性數據中準確識別穩定預后標志物的重要性,并呼吁研究界重視機器學習方法在醫療等關鍵領域應用的穩定性和可靠性。通過Stable Cox模型,未來有望在生存分析和臨床應用中實現更高的預測準確性,從而推動疾病早期診斷和精準治療的發展。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。