10人明星團隊煉出首個微調(diào)Llama 3.1 405B！角色扮演一秒入戲，代碼全開源

AIGC動態(tài)1年前 (2024)發(fā)布新智元

AIGC動態(tài)歡迎閱讀

原標(biāo)題：10人明星團隊煉出首個微調(diào)Llama 3.1 405B！角色扮演一秒入戲，代碼全開源
關(guān)鍵字：報告,模型,數(shù)據(jù),指令,能力
文章來源：新智元
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

新智元報道編輯：編輯部
【新智元導(dǎo)讀】發(fā)布40天后，最強開源模型Llama 3.1 405B等來了微調(diào)版本的發(fā)布。但不是來自Meta，而是一個專注于開放模型的神秘初創(chuàng)Nous Research。Llama 3.1的405B模型終于等來了首個微調(diào)版本！
這個模型名為Hermes 3，來自初創(chuàng)公司Nous Research，是一個相當(dāng)小型且低調(diào)的團隊。
雖然公司低調(diào)，但技術(shù)實力相當(dāng)強悍。Hermes系列已經(jīng)微調(diào)了Mistral、Yi、Llama等多個開源模型，下載量超過3300萬次。
跟著模型一起發(fā)布的，還有完整的技術(shù)報告和博客，Lambda Chat也同時在界面中集成了模型。
從技術(shù)報告和博客來看，Nous Research的這次微調(diào)頗有成效，在使用了FP8量化后還能保持相當(dāng)水準(zhǔn)的模型性能。
這種優(yōu)化有效地將模型的VRAM和磁盤需求降低了約50%，使其能夠在單個節(jié)點上運行，方便更多開發(fā)者部署使用。
除此之外，SFT和DPO的微調(diào)過程經(jīng)過了專門設(shè)計，讓模型的對話能力和指令遵循能力大大增強，擅長復(fù)雜的角色扮演和創(chuàng)意寫作。
除了創(chuàng)造力，Hermes 3還擴展出了函數(shù)調(diào)用、分步推理等智能體

原文鏈接：10人明星團隊煉出首個微調(diào)Llama 3.1 405B！角色扮演一秒入戲，代碼全開源