可信度超越GPT-4V,清華&面壁揭秘「小鋼炮」模型背后的高效對(duì)齊技術(shù)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:可信度超越GPT-4V,清華&面壁揭秘「小鋼炮」模型背后的高效對(duì)齊技術(shù)
關(guān)鍵字:模型,可信度,反饋,數(shù)據(jù),幻覺
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者來自 MiniCPM-V 團(tuán)隊(duì),其中第一作者余天予是清華大學(xué) 2021 級(jí)碩士研究生,他的主要研究方向是通用多模態(tài)基礎(chǔ)大模型構(gòu)建及其對(duì)齊方法。
近期,由清華大學(xué)自然語言處理實(shí)驗(yàn)室聯(lián)合面壁智能推出的全新開源多模態(tài)大模型 MiniCPM-Llama3-V 2.5 引起了廣泛關(guān)注,在發(fā)布后火速登頂 Hugging Face、GitHub、Papers With Code 的 Trending 榜首,與 Meta、微軟、谷歌等科技巨頭共同從全球 66 萬模型中脫穎而出。與此同時(shí),該模型使用的多模態(tài)對(duì)齊數(shù)據(jù)集也登上了 Hugging Face Trending 第二位。僅有 8B 體量的 MiniCPM-Llama3-V 2.5 不僅在多模態(tài)綜合性能上超越了
原文鏈接:可信度超越GPT-4V,清華&面壁揭秘「小鋼炮」模型背后的高效對(duì)齊技術(shù)
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)