AIGC動態歡迎閱讀
內容摘要:
直播預告 | 6月20日晚7點,「智猩猩機器人新青年講座」第8講正式開講,清華大學THUNLP lab在讀博士胡錦毅將直播講解《面向多模態大模型的具身智能平臺LEGENT》,歡迎掃名~原文:https://www.zhihu.com/question/650979052/answer/3455112382
大模型這個概念出來至今也有一年多的時間了,剛開始的時候我們覺得6B、13B的模型還挺大,現在覺得也就灑灑水啦;當前大家普遍追求的是訓練65B、175B甚至更大參數量的模型,而訓練這種規模的模型又不是一件容易的事情(因為我自己訓過,知道里面坑很多,但是又感覺不容易沉淀一些方法或者經驗論的東西)。
正如@Frossmann的那句話:
任何一個小規模訓練上的問題,放大幾百幾千倍之后,都有可能成為不可忽視的問題。所以,真正的關鍵不是在于有沒有用過千卡GP訓練過模型,而是有沒有從頭至尾,一路披荊斬棘的自己淌出來一條可重復的模型訓練的技術路線!
最寶貴的財富,當就是一條可重復的模型訓練的技術路線。
在千卡集群下訓練的難點分為兩方面,AI Infra 和 Training Framework。
原文鏈接:千卡集群大模型訓練思考與總結
聯系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關注模型與應用。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...