<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        100+大模型綜測結果出爐!智源發布FlagEval“百模”評測結果,覆蓋文本語音圖片視頻多種模態

        AIGC動態9個月前發布 量子位
        569 0 0

        還有四大專項評測榜單,探索模型能力邊界與應用潛能

        100+大模型綜測結果出爐!智源發布FlagEval“百模”評測結果,覆蓋文本語音圖片視頻多種模態

        原標題:100+大模型綜測結果出爐!智源發布FlagEval“百模”評測結果,覆蓋文本語音圖片視頻多種模態
        文章來源:量子位
        內容字數:6053字

        智源研究院發布2024年下半年大模型評測結果

        智源研究院于2024年12月19日發布了對100多個國內外開源和閉源大模型的綜合及專項評測結果,涵蓋語言、視覺語言、文生圖、文生視頻等多種模態。評測結果顯示,2024年下半年大模型發展更注重綜合能力提升和實際應用,多模態模型發展迅速,而語言模型發展相對放緩。

        1. 語言模型評測:中文能力成焦點

          在語言模型主觀評測中,字節跳動Doubao-pro-32k-preview和百度ERNIE 4.0 Turbo在中文能力方面表現突出,位列前兩名。客觀評測方面,OpenAI和Google的模型表現領先,阿里巴巴和字節跳動的模型緊隨其后。評測指出,雖然在一般中文場景下模型能力趨于飽和,但在復雜場景下,國內頭部模型與國際一流水平仍存在差距。

        2. 多模態模型評測:國產模型嶄露頭角

          視覺語言模型方面,開源模型在圖文理解任務上正在縮小與閉源模型的差距,但長尾視覺知識和復雜圖文數據分析能力仍需提升。OpenAI GPT-4o和字節跳動Doubao-Pro-Vision領先。文生圖模型已具備中文文字生成能力,但復雜場景下人物變形等問題仍存在。騰訊Hunyuan Image位列第一。文生視頻模型畫質和動態性提升顯著,但動作變形、物理規律理解等問題依然存在。快手可靈1.5領先。

        3. 語音語言模型評測:進步顯著,但仍有差距

          語音語言模型能力提升顯著,但與專家模型仍存在差距,高質量開源模型相對較少。阿里巴巴Qwen2-Audio位居榜首。

        4. K12學科測驗:模型能力與學生水平仍有差距

          大模型在K12學科測驗中的綜合得分較半年前有所提升,但仍落后于海淀學生平均水平。在文科方面表現較好,理科方面則相對較弱。

        5. FlagEval評測平臺迭代升級

          智源研究院的FlagEval大模型評測平臺已覆蓋全球800多個模型,包含多種任務和數據集。此次評測更新了98%的題目,并提升了難度。平臺還新增了模型辯論平臺FlagEval Debate,以及針對金融量化交易場景的評測。

        6. 金融量化交易評測:模型展現潛力

          評測發現,大模型已具備生成量化交易策略代碼的能力,頭部模型能力接近初級量化交易員水平。深度求索 Deepseek-chat、OpenAI GPT-4o和Google Gemini-1.5-pro-latest在該領域表現領先。

        總而言之,智源研究院的此次評測結果全面展現了大模型在2024年下半年的發展現狀,并指出了未來發展方向。多模態模型的快速發展以及對實際應用場景的探索,將成為大模型技術發展的重要趨勢。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费观看激色视频网站(性色)| 国产伦精品一区二区免费| 尤物永久免费AV无码网站| 国产免费人视频在线观看免费| 国产精品九九久久免费视频 | 精品久久久久久久久亚洲偷窥女厕| 亚洲熟女乱综合一区二区 | 亚洲成人激情在线| 亚洲成?v人片天堂网无码| 成年女人午夜毛片免费看| 99热在线精品免费播放6| 一区二区三区视频免费观看| 亚洲av无码成人精品区在线播放| 和日本免费不卡在线v| 亚洲一区免费观看| 香蕉免费一级视频在线观看| 老子影院午夜伦不卡亚洲| 亚洲Av无码国产一区二区| 亚洲妇女熟BBW| 婷婷国产偷v国产偷v亚洲| 国产亚洲中文日本不卡二区 | 黄色网址免费大全| 99精品国产免费久久久久久下载| 四虎精品视频在线永久免费观看| 久久免费观看国产精品| 日韩人妻一区二区三区免费| 少妇人妻偷人精品免费视频| 99久久久精品免费观看国产| 无码视频免费一区二三区| 成人免费男女视频网站慢动作| 日本免费高清一本视频| 国产一区二区三区在线观看免费| 亚洲福利在线播放| 亚洲人成影院在线| 性色av极品无码专区亚洲| 成av免费大片黄在线观看| 亚洲黄色免费网站| 亚洲国产精品无码久久九九 | 青青操免费在线观看| 成人无码区免费视频观看 | 亚洲hairy多毛pics大全|