C-Eval官網
大語言模型的多層次多學科中文評估套件
網站服務:C-Eval。
C-Eval 是一個全面的中文基礎模型評估套件。它包含了13948個多項選擇題,涵蓋了52個不同的學科和四個難度級別,如下所示。 通過 C-Eval 試題的測試后得到了一份中文大語言模型的排行榜,其中表現最好的是來自 是由清華大學和智譜 AI 聯合研發的第二代 GLM 系列對話語言模型,其次是GPT – 4模型。
C-Eval網址入口
https://cevalbenchmark.com/index_zh.html#home_zh
OpenI小編發現C-Eval網站非常受用戶歡迎,請訪問C-Eval網址入口試用。
數據統計
數據評估
關于C-Eval特別聲明
本站OpenI提供的C-Eval都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 9月 9日 上午9:52收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。
相關導航
暫無評論...