AIGC動態歡迎閱讀
原標題:首個視頻思維鏈推理框架Video-of-Thought來了:像人一樣從感知到認知全面推理視頻
關鍵字:視頻,認知,模型,答案,內容
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者來自于新加坡國立大學、南洋理工大學以及哈工深。其中,費豪的研究方向為多模態學習、多模態大語言模型。吳勝瓊,新加坡國立大學博士生,主要研究方向為多模態大語言模型。吉煒的主要研究方向為多模態學習,多模態內容生成。張含望教授的研究興趣包含計算機視覺、因果推斷。張梅山教授的研究方向包括代碼智能,自然語言處理,多模態生成與理解。Mong-Li Lee和Wynne Hsu教授的研究方向為社交媒體分析,協同機器學習等等。
最近,新加坡國立大合南洋理工大學和哈工深的研究人員共同提出了一個全新的視頻推理框架,這也是首次大模型推理社區提出的面向視頻的思維鏈框架(Video-of-Thought, VoT)。視頻思維鏈VoT讓視頻多模態大語言模型在復雜視頻的理解和推理性
原文鏈接:首個視頻思維鏈推理框架Video-of-Thought來了:像人一樣從感知到認知全面推理視頻
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...