醫(yī)療領(lǐng)域基準(zhǔn)測(cè)試超越Llama 3、接近GPT-4,上海交大團(tuán)隊(duì)發(fā)布多語(yǔ)言醫(yī)學(xué)大模型,覆蓋6國(guó)語(yǔ)言

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:醫(yī)療領(lǐng)域基準(zhǔn)測(cè)試超越Llama 3、接近GPT-4,上海交大團(tuán)隊(duì)發(fā)布多語(yǔ)言醫(yī)學(xué)大模型,覆蓋6國(guó)語(yǔ)言
關(guān)鍵字:模型,語(yǔ)料庫(kù),醫(yī)療,醫(yī)學(xué),研究人員
文章來(lái)源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
作者:李寶珠
編輯:三羊
上海交通大學(xué)王延峰教授與謝偉迪教授團(tuán)隊(duì)創(chuàng)建了一個(gè)包含 255 億 tokens 的多語(yǔ)言醫(yī)療語(yǔ)料庫(kù) MMedC,開(kāi)發(fā)了一個(gè)覆蓋 6 種語(yǔ)言的多語(yǔ)言醫(yī)療問(wèn)答評(píng)測(cè)標(biāo)準(zhǔn) MMedBench,同時(shí)還構(gòu)建了一個(gè) 8B 的基座模型 MMed-Llama 3。此外,恰逢「1024 程序員節(jié)」,我們還為大家準(zhǔn)備了超值算力福利,僅限今日,先到先得!隨著醫(yī)療信息化的普及,醫(yī)療數(shù)據(jù)從規(guī)模到質(zhì)量都實(shí)現(xiàn)了不同程度的提升。進(jìn)入大模型時(shí)代以來(lái),面向精準(zhǔn)醫(yī)療、診斷輔助、醫(yī)患交互等不同場(chǎng)景的各類(lèi)大模型層出不窮。
但值得注意的是,正如通用模型所面臨的多語(yǔ)言能力滯后問(wèn)題一樣,醫(yī)療大模型大多依賴(lài)于英語(yǔ)的基座模型,同時(shí)也受限于多語(yǔ)言醫(yī)療專(zhuān)業(yè)數(shù)據(jù)的匱乏、分散,導(dǎo)致模型在處理非英語(yǔ)任務(wù)時(shí)的表現(xiàn)欠佳。即便是醫(yī)療相關(guān)的開(kāi)源文本數(shù)據(jù),也主要以高資源語(yǔ)種為主,所支持的語(yǔ)種十分有限。
從模型訓(xùn)練的角度來(lái)看,多語(yǔ)言醫(yī)療模型能夠更加全面地利用全球的數(shù)據(jù)資源,甚至是擴(kuò)展到多模態(tài)訓(xùn)練數(shù)據(jù),從而提升模型對(duì)其他模態(tài)信息的表征質(zhì)量。從應(yīng)用的層面來(lái)講,多語(yǔ)言醫(yī)療模型能夠幫助緩解醫(yī)患之間的語(yǔ)言溝通障礙,在醫(yī)患交互、遠(yuǎn)程診斷等多場(chǎng)景下
聯(lián)系作者
文章來(lái)源:HyperAI超神經(jīng)
作者微信:
作者簡(jiǎn)介:

粵公網(wǎng)安備 44011502001135號(hào)