AIGC動態歡迎閱讀
原標題:LLama+Mistral+…+Yi=? 免訓練異構大模型集成學習框架DeePEn來了
關鍵字:模型,表示,性能,詞表,矩陣
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文的主要作者為黃毅翀。黃毅翀是哈爾濱工業大學社會計算與信息檢索研究中心博士生,鵬城實驗室實習生,師從秦兵教授和馮驍騁教授。研究方向包括大語言模型集成學習、多語言大模型,相關論文發表于自然語言處理頂級會議 ACL、EMNLP、COLING。隨著大語言模型展現出驚人的語言智能,各大 AI 公司紛紛推出自己的大模型。這些大模型通常在不同領域和任務上各有所長,如何將它們集成起來以挖掘其互補潛力,成為了 AI 研究的前沿課題。
近期,哈工大和鵬城實驗室的研究人員提出了「Training-free 的異構大模型集成學習框架」DeePEn。
不同于以往方法訓練外部模塊來篩選、融合多個模型生成的回復,DeePEn 在解碼過程中融合多個模型輸出的概率分布,聯合決定每一步的輸出
原文鏈接:LLama+Mistral+…+Yi=? 免訓練異構大模型集成學習框架DeePEn來了
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...