邁向多語言醫療大模型：大規模預訓練語料、開源模型與全面基準測試

AIGC動態1年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：邁向多語言醫療大模型：大規模預訓練語料、開源模型與全面基準測試
關鍵字：模型,報告,醫療,語言,數據
文章來源：機器之心
內容字數：0字

內容摘要：

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或者聯系報道。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文的主要作者來自上海交通大學和上海人工智能實驗室智慧醫療聯合團隊，共同第一作者為上海交通大學博士生邱芃鋮和吳超逸，共同通訊作者為上海交通大學人工智能學院王延峰教授和謝偉迪副教授，這是該團隊在繼 PMC-LLaMA 后，在持續構建開源醫療語言大模型的最新進展。該項目受到科創 2030—“新一代人工智能” 重大項目支持。
在醫療領域中，大語言模型已經有了廣泛的研究。然而，這些進展主要依賴于英語的基座模型，并受制于缺乏多語言醫療專業數據的限制，導致當前的醫療大模型在處理非英語問題時效果不佳。
為了克服這一挑戰，近期一篇發表在《nature communications》的論文全面地從數據、測評、模型多個角度考慮了多語言醫學大語言模型的構建，做出了三項貢獻：
1.

原文鏈接：邁向多語言醫療大模型：大規模預訓練語料、開源模型與全面基準測試