零一萬物Yi-VL多模態(tài)大模型開源,MMMU、CMMMU兩大權(quán)威榜單領(lǐng)先
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:零一萬物Yi-VL多模態(tài)大模型開源,MMMU、CMMMU兩大權(quán)威榜單領(lǐng)先
關(guān)鍵字:模型,語言,圖像,能力,文本
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):3894字
內(nèi)容摘要:
機(jī)器之心發(fā)布
機(jī)器之心編輯部1 月 22 日,零一萬物 Yi 系列模型家族迎來新成員:Yi Vision Language(Yi-VL)多模態(tài)語言大模型正式面向全球開源。據(jù)悉,Yi-VL 模型基于 Yi 語言模型開發(fā),包括 Yi-VL-34B 和 Yi-VL-6B 兩個(gè)版本。
Yi-VL 模型開源地址:
https://huggingface.co/01-ai
https://www.modelscope.cn/organization/01ai
憑借卓越的圖文理解和對話生成能力,Yi-VL 模型在英文數(shù)據(jù)集 MMMU 和中文數(shù)據(jù)集 CMMMU 上取得了領(lǐng)先成績,展示了在復(fù)雜跨學(xué)科任務(wù)上的強(qiáng)大實(shí)力。
MMMU(全名 Massive Multi-discipline Multi-modal Understanding & Reasoning 大規(guī)模多學(xué)科多模態(tài)理解和推理)數(shù)據(jù)集包含了 11500 個(gè)來自六大核心學(xué)科(藝術(shù)與設(shè)計(jì)、商業(yè)、科學(xué)、健康與醫(yī)學(xué)、人文與社會(huì)科學(xué)以及技術(shù)與工程)的問題,涉及高度異構(gòu)圖像類型和交織文本圖像信息,對模型的高級知覺和推理能力提出了極高要求。在該測試集上,Yi
原文鏈接:零一萬物Yi-VL多模態(tài)大模型開源,MMMU、CMMMU兩大權(quán)威榜單領(lǐng)先
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)