C-Eval官網(wǎng)
大語言模型的多層次多學科中文評估套件
網(wǎng)站服務(wù):C-Eval。
C-Eval 是一個全面的中文基礎(chǔ)模型評估套件。它包含了13948個多項選擇題,涵蓋了52個不同的學科和四個難度級別,如下所示。 通過 C-Eval 試題的測試后得到了一份中文大語言模型的排行榜,其中表現(xiàn)最好的是來自 是由清華大學和智譜 AI 聯(lián)合研發(fā)的第二代 GLM 系列對話語言模型,其次是GPT – 4模型。
C-Eval網(wǎng)址入口
https://cevalbenchmark.com/index_zh.html#home_zh

OpenI小編發(fā)現(xiàn)C-Eval網(wǎng)站非常受用戶歡迎,請訪問C-Eval網(wǎng)址入口試用。
數(shù)據(jù)評估
關(guān)于C-Eval特別聲明
本站OpenI提供的C-Eval都來源于網(wǎng)絡(luò),不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 9月 9日 上午9:52收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進行刪除,OpenI不承擔任何責任。
相關(guān)導航
暫無評論...



粵公網(wǎng)安備 44011502001135號