2.7B能打Llama 2 70B，微軟祭出「小語言模型」！96塊A100 14天訓出Phi-2，碾壓谷歌Gemini nano

AIGC動態2年前 (2023)發布新智元

AIGC動態歡迎閱讀

原標題：2.7B能打Llama 2 70B，微軟祭出「小語言模型」！96塊A100 14天訓出Phi-2，碾壓谷歌Gemini nano

關鍵字：模型,微軟,性能,數據,語言

文章來源：新智元

內容字數：6280字

內容摘要：新智元報道編輯：潤 alan【新智元導讀】都快到年底了，大模型領域還在卷，今天，Microsoft發布了參數量為2.7B的Phi-2——不僅13B參數以內沒有對手，甚至還能和Llama 70B掰手腕！大模型現在真的是越來越卷了！11月OpenAI先是用GPTs革了套殼GPT們的命，然后再不惜獻祭董事會搏了一波天大的流量。谷歌急了，趕在年底之前倉促發布了超大模型Gemini，卷起了多模態，甚至不惜「視頻造假」。就在今天，微軟正式發布了曾在11月Ignite大會上預告的Phi-2！憑借著2.7B的參數，「小語言模型（SLM）」Phi-2幾乎打穿了所有13B以下的大模型——包括谷歌最新發布的Gemini Nano 2。通過模型擴展和訓練數據管理方面的創新，Phi-2展現了出色的推理和語言理解能力，在復雜的基準測試中，Phi-2的性能可以打平比自己大25倍的模型，甚至略占上風。它用非常「苗條」…

原文鏈接：點此閱讀原文：2.7B能打Llama 2 70B，微軟祭出「小語言模型」！96塊A100 14天訓出Phi-2，碾壓谷歌Gemini nano