<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        訓(xùn)練一次經(jīng)歷 419 次意外故障!英偉達(dá) GPU 也差點(diǎn)玩不轉(zhuǎn) 405B 模型,全靠 Meta 工程師后天救場!

        AIGC動(dòng)態(tài)1年前 (2024)發(fā)布 AI前線
        592 0 0

        訓(xùn)練一次經(jīng)歷 419 次意外故障!英偉達(dá) GPU 也差點(diǎn)玩不轉(zhuǎn) 405B 模型,全靠 Meta 工程師后天救場!

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:訓(xùn)練一次經(jīng)歷 419 次意外故障!英偉達(dá) GPU 也差點(diǎn)玩不轉(zhuǎn) 405B 模型,全靠 Meta 工程師后天救場!
        關(guān)鍵字:故障,模型,問題,集群,通信
        文章來源:AI前線
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        整理 | 華衛(wèi)
        最近,Meta 在一份研究報(bào)告中揭示了訓(xùn)練 Llama 3 405B 參數(shù)模型的重大挑戰(zhàn):該系統(tǒng)在包含 16384 個(gè) Nvidia H100 GPU 的集群上運(yùn)行,在訓(xùn)練期間平均每三個(gè)小時(shí)就發(fā)生一次故障, 54 天內(nèi)經(jīng)歷了 419 次意外故障。
        這些故障中,有一半以上的情況都?xì)w因于 GPU 及其高帶寬內(nèi)存 (HBM3)。由于 GPU 訓(xùn)練任務(wù)的規(guī)模龐大和高度同步,Llama 3 很容易發(fā)生故障,且單個(gè) GPU 故障就會(huì)中斷整個(gè)訓(xùn)練過程,導(dǎo)致必須重新啟動(dòng)。
        不過,據(jù)介紹,盡管存在這些問題,Llama 3 團(tuán)隊(duì)仍在支持自動(dòng)化集群維護(hù)(例如固件和 Linux 內(nèi)核升級)的同時(shí),實(shí)現(xiàn)了超過 90% 的有效訓(xùn)練時(shí)間(有效訓(xùn)練時(shí)間是指實(shí)際用于有用訓(xùn)練的時(shí)間與經(jīng)過時(shí)間的比例)。
        正如一句古老的超級計(jì)算諺語所言,“大規(guī)模系統(tǒng)唯一可以確定的就是失敗。”超級計(jì)算機(jī)是極其復(fù)雜的設(shè)備,使用數(shù)萬個(gè)處理器、數(shù)十萬個(gè)其他芯片和數(shù)百英里長的電纜。在復(fù)雜的超級計(jì)算機(jī)中,每隔幾個(gè)小時(shí)出現(xiàn)故障是很正常的,而開發(fā)人員的主要訣竅就是確保系統(tǒng)在出現(xiàn)這種局部故障時(shí)仍能正常運(yùn)行。58.7% 意外中斷源于 GPU,


        原文鏈接:訓(xùn)練一次經(jīng)歷 419 次意外故障!英偉達(dá) GPU 也差點(diǎn)玩不轉(zhuǎn) 405B 模型,全靠 Meta 工程師后天救場!

        聯(lián)系作者

        文章來源:AI前線
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 97视频免费在线| 亚洲国产精品嫩草影院| 九九久久精品国产免费看小说| 毛片免费在线观看网站| 亚洲免费二区三区| 希望影院高清免费观看视频| 亚洲第一二三四区| 成人免费毛片内射美女-百度| 亚洲成aⅴ人在线观看| 国产卡一卡二卡三免费入口| 亚洲男人天堂2018av| 日美韩电影免费看| 国产精品亚洲专区无码不卡| 亚洲综合精品网站在线观看| 国产特黄一级一片免费 | 久久免费精品视频| 水蜜桃亚洲一二三四在线| 免费人成在线观看网站品爱网 | 亚洲激情校园春色| 成人免费视频小说| 一级白嫩美女毛片免费| 亚洲精品制服丝袜四区| 永久在线免费观看| jizzjizz亚洲日本少妇| 美腿丝袜亚洲综合| 8888四色奇米在线观看免费看| 亚洲av无码不卡久久| 国产一卡二卡≡卡四卡免费乱码| 成在人线av无码免费高潮水| 久久亚洲精精品中文字幕| 爽爽日本在线视频免费| 国产特黄特色的大片观看免费视频| 亚洲人成电影在线天堂 | 色噜噜亚洲精品中文字幕| 91精品视频在线免费观看| 亚洲偷自拍另类图片二区| 国产亚洲精品免费视频播放| 无码人妻精品中文字幕免费东京热| 男男gay做爽爽的视频免费| 亚洲一区二区三区电影| 国产一区二区免费在线|