用語言對齊多模態(tài)信息,北大騰訊等提出LanguageBind,刷新多個榜單
AIGC動態(tài)歡迎閱讀
原標題:用語言對齊多模態(tài)信息,北大騰訊等提出LanguageBind,刷新多個榜單
關鍵字:騰訊,數(shù)據(jù),語言,語義,視頻
文章來源:機器之心
內(nèi)容字數(shù):6505字
內(nèi)容摘要:機器之心專欄機器之心編輯部北京大學與騰訊等機構(gòu)的研究者們提出了多模態(tài)對齊框架 ——LanguageBind。該框架在視頻、音頻、文本、深度圖和熱圖像等五種不同模態(tài)的下游任務中取得了卓越的性能,刷榜多項評估榜單,這標志著多模態(tài)學習領域向著「大一統(tǒng)」理念邁進了重要一步。在現(xiàn)代社會,信息傳遞和交流不再局限于單一模態(tài)。我們生活在一個多模態(tài)的世界里,聲音、視頻、文字和深度圖等模態(tài)信息相互交織,共同構(gòu)成了我們…
原文鏈接:點此閱讀原文:用語言對齊多模態(tài)信息,北大騰訊等提出LanguageBind,刷新多個榜單
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務平臺
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關文章
暫無評論...