AIGC動態歡迎閱讀
原標題:最強開源大模型 Llama 3震撼發布!開源模型將追上GPT-4,4000億參數模型也在路上
關鍵字:模型,數據,求生欲,性能,版本
文章來源:人工智能學家
內容字數:3419字
內容摘要:
夕小瑤科技說 原創作者 | Zicy就在昨晚,Meta官宣了開源的Llama 3 8B和70B版本。
8B模型在多項指標中超越了Gemma 7B和Mistral 7B Instruct,而70B模型則超越了閉源的Claude 3 Sonnet,和Gemini Pro 1.5。
此外Meta還有一個still training的400B+參數版本,它和GPT-4以及Claude 3的超大杯版本Opus性能差不多,最重要的是,它即將開源!
怪獸級性能由于預訓練和訓練方法的改進,Llama 3 8B和70B是當今同參數規模的SOTA模型。它大大降低了錯誤拒絕率,改善了一致性,并增加了模型響應的多樣性。此外,在推理、代碼生成和指令跟蹤等功能的極大改進,使Llama 3更加易于操控。
在Llama 3的開發中,為了尋求對實際場景的優化。Meta開發了一套新的高質量人類評估集,包含1800個prompts,覆蓋12個關鍵用例,如尋求建議、頭腦風暴、分類、封閉式問答、編碼、創意寫作等。為防止模型過度擬合,連模型開發團隊也無法訪問此評估集。下圖展示了與Claude Sonnet、Mistral Med
原文鏈接:最強開源大模型 Llama 3震撼發布!開源模型將追上GPT-4,4000億參數模型也在路上
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...