AIGC動態歡迎閱讀
原標題:mini-GPT4o來了? 能看、能聽、會說,還情感豐富的多模態全能助手EMOVA
關鍵字:語音,華為,情感,文本,模型
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
本文作者來自香港科技大學、香港大學和華為諾亞方舟實驗室等機構。其中第一作者陳鎧、茍耘豪、劉智立為香港科技大學在讀博士生,黃潤輝為香港大學在讀博士生,譚達新為諾亞方舟實驗室研究員。
隨著 OpenAI GPT-4o 的發布,大語言模型已經不再局限于文本處理,而是向著全模態智能助手的方向發展。這篇論文提出了 EMOVA(EMotionally Omni-present Voice Assistant),一個能夠同時處理圖像、文本和語音模態,能看、能聽、會說的多模態全能助手,并通過情感控制,擁有更加人性化的交流能力。以下,我們將深入了解 EMOVA 的研究背景、模型架構和實驗效果。論文題目:EMOVA: Empowering Language Models to
原文鏈接:mini-GPT4o來了? 能看、能聽、會說,還情感豐富的多模態全能助手EMOVA
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...