邁向多語(yǔ)言醫(yī)療大模型:大規(guī)模預(yù)訓(xùn)練語(yǔ)料、開源模型與全面基準(zhǔn)測(cè)試
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:邁向多語(yǔ)言醫(yī)療大模型:大規(guī)模預(yù)訓(xùn)練語(yǔ)料、開源模型與全面基準(zhǔn)測(cè)試
關(guān)鍵字:模型,報(bào)告,醫(yī)療,語(yǔ)言,數(shù)據(jù)
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文的主要作者來(lái)自上海交通大學(xué)和上海人工智能實(shí)驗(yàn)室智慧醫(yī)療聯(lián)合團(tuán)隊(duì),共同第一作者為上海交通大學(xué)博士生邱芃鋮和吳超逸,共同通訊作者為上海交通大學(xué)人工智能學(xué)院王延峰教授和謝偉迪副教授,這是該團(tuán)隊(duì)在繼 PMC-LLaMA 后,在持續(xù)構(gòu)建開源醫(yī)療語(yǔ)言大模型的最新進(jìn)展。該項(xiàng)目受到科創(chuàng) 2030—“新一代人工智能” 重大項(xiàng)目支持。
在醫(yī)療領(lǐng)域中,大語(yǔ)言模型已經(jīng)有了廣泛的研究。然而,這些進(jìn)展主要依賴于英語(yǔ)的基座模型,并受制于缺乏多語(yǔ)言醫(yī)療專業(yè)數(shù)據(jù)的限制,導(dǎo)致當(dāng)前的醫(yī)療大模型在處理非英語(yǔ)問(wèn)題時(shí)效果不佳。
為了克服這一挑戰(zhàn),近期一篇發(fā)表在《nature communications》的論文全面地從數(shù)據(jù)、測(cè)評(píng)、模型多個(gè)角度考慮了多語(yǔ)言醫(yī)學(xué)大語(yǔ)言模型的構(gòu)建,做出了三項(xiàng)貢獻(xiàn):
1.
原文鏈接:邁向多語(yǔ)言醫(yī)療大模型:大規(guī)模預(yù)訓(xùn)練語(yǔ)料、開源模型與全面基準(zhǔn)測(cè)試
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:
相關(guān)文章
