<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        全球首個「視頻教學」基準!南洋理工、CMU發布Video-MMMU

        AIGC動態7個月前發布 新智元
        390 0 0

        全球首個「視頻教學」基準!南洋理工、CMU發布Video-MMMU

        原標題:全球首個「視頻教學」基準!南洋理工、CMU發布Video-MMMU
        文章來源:新智元
        內容字數:6488字

        多模態大模型的視頻學習能力評測:Video-MMMU數據集

        新加坡南洋理工大學S-Lab團隊推出的Video-MMMU數據集,是全球首個評測多模態大模型(LMMs)從視頻中獲取和應用知識能力的數據集。該數據集旨在探索AI能否像人類一樣,通過觀看視頻學習新知識并解決實際問題,為AI邁向通用人工智能(AGI)提供新的視角。

        1. 核心問題與方法:Video-MMMU的核心問題是:AI能否通過觀看視頻學習并應用知識?它將學習過程分為三個認知階段:感知(Perception)、理解(Comprehension)和運用(Adaptation)。通過這三個階段的評估,全面考察模型的知識獲取能力。 數據集包含300個高質量的大學水平教育視頻和900個問答對,涵蓋六大專業領域(藝術、商業、醫學、科學、人文、工程)的30個學科。

        2. 數據集設計與問題類型:Video-MMMU的數據集設計精巧,問題類型針對不同認知階段:感知階段側重于ASR(自動語音識別)和OCR(光學字符識別);理解階段關注概念理解和解題方法理解;運用階段則考察案例分析和解題方法運用。 問題平均長度達75.7字,比其他基準更高,體現了其專業性和挑戰性。

        3. 知識增益(?knowledge)指標:Video-MMMU創新性地引入了“知識增益”指標,該指標不僅關注模型的絕對能力,更關注模型觀看視頻前后在應用階段的表現提升。 它衡量模型是否能通過觀看視頻解決原本無法解答的問題,這比單純的解題能力更能反映模型的學習能力。

        4. 實驗結果與分析:實驗結果顯示,人類專家在所有階段的表現都優于AI模型,即使是表現最好的模型也明顯落后于人類。 運用階段是知識獲取的最大瓶頸,模型得分普遍低于50%,表明模型在知識遷移和應用方面存在明顯不足。 此外,一些模型在觀看視頻后表現反而下降,顯示出其學習能力和穩定性的問題。

        5. 模型的學習能力局限性:實驗結果揭示了當前LMMs在視頻學習中的兩大挑戰:學習能力有限,難以高效獲取和應用新知識;模型回答不穩定,觀看視頻后反而可能出錯。 錯誤分析表明,模型在方法選擇、方法運用和問題誤讀方面都存在錯誤,其中方法運用錯誤最為常見。

        6. 結論:Video-MMMU數據集為評估和改進LMMs的視頻知識獲取能力提供了全新視角。 研究結果表明,提升模型從視頻中獲取知識的能力,以及提高模型的學習效率和穩定性,是邁向AGI的重要一步。 該數據集的發布,為多模態大模型的學習能力研究提供了寶貴的資源。


        聯系作者

        文章來源:新智元
        作者微信:
        作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 黄页免费的网站勿入免费直接进入| 曰批全过程免费视频在线观看无码| 在线观看特色大片免费视频| 久久国产乱子伦精品免费午夜 | 亚洲视频一区网站| 8888四色奇米在线观看免费看| 嫩草视频在线免费观看| 在线亚洲人成电影网站色www | 亚洲av无码专区亚洲av不卡| 国内永久免费crm系统z在线| 亚洲日韩精品无码专区网址| 中文字幕无码免费久久| 亚洲综合国产精品| 亚洲国产免费综合| 亚洲AV无码一区二区三区系列 | 美女免费视频一区二区三区| 一个人在线观看视频免费| 涩涩色中文综合亚洲| 最近免费中文字幕大全免费| 亚洲国产精品成人精品软件 | 好男人www免费高清视频在线| 国产国拍亚洲精品mv在线观看 | 免费国产a国产片高清网站| 一级特黄录像视频免费| 嫩草影院免费观看| 免费一区二区无码视频在线播放 | 精品亚洲国产成AV人片传媒| 在线视频免费观看高清| 免费国产va视频永久在线观看| 亚洲永久无码3D动漫一区| 91老湿机福利免费体验| 亚洲国产综合AV在线观看| 国产福利在线免费| 色费女人18女人毛片免费视频 | 国产日韩亚洲大尺度高清| 一级黄色片免费观看| 亚洲永久永久永久永久永久精品| 成人免费毛片内射美女APP| 九九全国免费视频| 亚洲国产精品成人精品小说| 久久国产成人亚洲精品影院 |