AIGC動態歡迎閱讀
原標題:戴瓊海院士:開源后在 AlpacaEval 直追 GPT4,零一靠技術如何重建生態信心
文章來源:人工智能學家
內容字數:4412字
內容摘要:來源:AI科技大本營斯坦福大學研發的大語言模型評測 AlpacaEval Leaderboard 備受業內認可,在 2023 年 12 月 7 日 更新的排行榜中,Yi-34B-Chat 以 94.08% 的勝率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 經認證的模型類別中,成為僅次于 GPT-4 英語能力的大語言模型。同一周,在加州大學伯克利分校主導的 LMSYS ORG 排行榜中,Yi-34B-Chat 也以1102 的 Elo 評分,晉升最新開源 SOTA 開源模型之列,性能表現追平 GPT-3.5。多個Benchmark遙遙領先在五花八門的大模型評測中,伯克利 LMSYS ORG 排行榜采用了一個最為接近用戶體感的「機器人競技場」特殊測評模式,讓眾多大語言模型在評測平臺隨機進行一對一 battle,通過眾籌真實用戶來進行線上實時盲…
原文鏈接:點此閱讀原文:戴瓊海院士:開源后在 AlpacaEval 直追 GPT4,零一靠技術如何重建生態信心
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...