AIGC動態歡迎閱讀
原標題:ChatGPT一:開源語言大模型的沖擊
關鍵字:報告,模型,數據,任務,性能
文章來源:人工智能學家
內容字數:17360字
內容摘要:
自2022年末發布后,ChatGPT給人工智能的研究和商業領域帶來了巨大變革。通過有監督微調和人類反饋的強化學習,模型可以回答人類問題,并在廣泛的任務范圍內遵循指令。在獲得這一成功之后,人們對LLM的興趣不斷增加,新的LLM在學術界和工業界不斷涌現,其中包括許多專注于LLM的初創公司。
盡管閉源LLM(如OpenAI的GPT、Anthropic的Claude)通常優于其對應的開源模型,但后者的進展十分迅速,并且聲稱在某些任務上取得了與ChatGPT相當甚至更好的表現。這不僅深刻影響了語言大模型的研究,同時還具有非凡的商業價值。在ChatGPT發布一之際,本文旨在提供開源LLM這一成功的全面綜述,并全面調研了開源LLM聲稱已達到或超過ChatGPT水平的任務。
注:本文最新版本更新至12月5日,暫未收錄近期發布的首個開源MoE大模型Mixtral(8x7B),據稱已達到甚至超越了LLaMA2(70B)和GPT-3.5的水平。(以下內容由OneFlow編譯發布,轉載請聯系授權。原文:https://arxiv.org/pdf/2311.16989.pdf)來源:OneFlow
作者:H
原文鏈接:ChatGPT一:開源語言大模型的沖擊
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...