AIGC動態歡迎閱讀
原標題:2.7B能打Llama 2 70B,微軟祭出「小語言模型」!96塊A100 14天訓出Phi-2,碾壓谷歌Gemini nano
文章來源:新智元
內容字數:6280字
內容摘要:新智元報道編輯:潤 alan【新智元導讀】都快到年底了,大模型領域還在卷,今天,Microsoft發布了參數量為2.7B的Phi-2——不僅13B參數以內沒有對手,甚至還能和Llama 70B掰手腕!大模型現在真的是越來越卷了!11月OpenAI先是用GPTs革了套殼GPT們的命,然后再不惜獻祭董事會搏了一波天大的流量。谷歌急了,趕在年底之前倉促發布了超大模型Gemini,卷起了多模態,甚至不惜「視頻造假」。就在今天,微軟正式發布了曾在11月Ignite大會上預告的Phi-2!憑借著2.7B的參數,「小語言模型(SLM)」Phi-2幾乎打穿了所有13B以下的大模型——包括谷歌最新發布的Gemini Nano 2。通過模型擴展和訓練數據管理方面的創新,Phi-2展現了出色的推理和語言理解能力,在復雜的基準測試中,Phi-2的性能可以打平比自己大25倍的模型,甚至略占上風。它用非常「苗條」…
原文鏈接:點此閱讀原文:2.7B能打Llama 2 70B,微軟祭出「小語言模型」!96塊A100 14天訓出Phi-2,碾壓谷歌Gemini nano
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...