AIGC動態歡迎閱讀
原標題:微調大模型,AMD MI300X就夠了!跟著這篇博客微調Llama 3.1 405B,效果媲美H100
關鍵字:模型,參數,硬件,顯存,設備
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
機器之心編輯部隨著 AI 模型的參數量越來越大,對算力的需求也水漲船高。
比如最近,Llama-3.1 登上了最強開源大模型的寶座,但超大杯 405B 版本的內存就高達 900 多 GB,這對算力構成了更加苛刻的挑戰。
如何降低算力的使用成本和使用門檻,已經成為許多公司尋求突破的關鍵。Felafax 就是其中的一家創業公司,致力于簡化 AI 訓練集群的搭建流程。Nikhil Sonti 和 Nikhin Sonti 創立了 Felafax,他們的口號是在構建開源 AI 平臺,為下一代 AI 硬件服務,將機器學習的訓練成本降低 30%。
與英偉達相比,AMD 的 GPU,尤其是 MI300X 系列,提供了更高的性價比,按每美元計算,其性能表現更為出色。
最近,Felafax 的聯合創始人 Nikhil Sonti 發布了一篇博客,詳細分享了如何通過 8 張 AMD MI300X GPU 和 JAX 微調 LLaMA 3.1 405B 模型的方法,所有代碼現已開源。Github 鏈接:https://github.com/felafax/felafax
機器之心對博客內容進行
原文鏈接:微調大模型,AMD MI300X就夠了!跟著這篇博客微調Llama 3.1 405B,效果媲美H100
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...