<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        FP8 低精度訓(xùn)練:Transformer Engine 簡析

        AIGC動態(tài)1年前 (2024)發(fā)布 智猩猩AGI
        419 0 0

        FP8 低精度訓(xùn)練:Transformer Engine 簡析

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:FP8 低精度訓(xùn)練:Transformer Engine 簡析
        關(guān)鍵字:精度,模型,數(shù)據(jù),數(shù)值,框架
        文章來源:智猩猩AGI
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        大模型時代最火AI芯片峰會來啦!!9月6-7日,由智猩猩聯(lián)合主辦的2024全球AI芯片峰會將在北京舉行。峰會設(shè)有數(shù)據(jù)中心AI芯片、智算集群技術(shù)論壇等7大板塊。目前,清華大學(xué)教授、集成電路學(xué)院副院長尹首一 ,AMD人工智能事業(yè)部高級總監(jiān)王宏強(qiáng),高通AI產(chǎn)品技術(shù)中國區(qū)負(fù)責(zé)人萬衛(wèi)星,摩爾線程高級產(chǎn)品總監(jiān)付海良波等30+位嘉賓已確認(rèn)參會。掃名~原文:https://zhuanlan.zhihu.com/p/700874387
        01背景介紹業(yè)界廣泛采用 FP16、BF16 混合精度(AMP)進(jìn)行模型訓(xùn)練。AMP 能在下游任務(wù)不掉點的前提下提升訓(xùn)練效率、減少顯存等資源占用,如今也常用于大模型預(yù)訓(xùn)練、微調(diào)等任務(wù)。
        Pytorch 1.6 版本后原生支持 FP16、BF16 精度的 AMP 訓(xùn)練(torch.amp),過往 AMP 功能由 NVIDIA APEX 庫實現(xiàn)。
        NVIDIA GPU 自 Hopper 架構(gòu)起支持 FP8 精度的 Tensor Core 計算,相比于 FP16/BF16 精度,F(xiàn)P8 具有如下優(yōu)勢:
        更強(qiáng)的計算性能
        對比 A100 BF16 精度訓(xùn)練,H100 FP8 訓(xùn)


        原文鏈接:FP8 低精度訓(xùn)練:Transformer Engine 簡析

        聯(lián)系作者

        文章來源:智猩猩AGI
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 四虎免费影院4hu永久免费| 中文字幕亚洲天堂| 亚洲中文字幕在线无码一区二区 | 午夜免费福利在线观看| 国产亚洲sss在线播放| 一个人免费观看视频www| 色偷偷女男人的天堂亚洲网 | 中文字幕成人免费视频| 亚洲人成影院在线| 久操免费在线观看| 亚洲第一二三四区| 99在线精品免费视频九九视| tom影院亚洲国产一区二区| 毛片免费观看视频| 国产亚洲综合一区二区三区| 亚洲精品无码久久毛片| 中文字幕无码一区二区免费| 亚洲综合网美国十次| 18禁成年无码免费网站无遮挡| 亚洲人av高清无码| 亚洲人成无码久久电影网站| 99热在线日韩精品免费| 亚洲激情校园春色| 国产成人无码区免费A∨视频网站| av成人免费电影| 精品日韩亚洲AV无码一区二区三区| 在线看片无码永久免费视频| 久久精品国产亚洲AV电影网| 永久亚洲成a人片777777| 久久99国产乱子伦精品免费| 亚洲精品亚洲人成在线| 国产综合亚洲专区在线| 五月亭亭免费高清在线| 国产精品亚洲色图| 亚洲国产精品久久久久婷婷老年| 无码高潮少妇毛多水多水免费| 午夜不卡AV免费| 91嫩草亚洲精品| 亚洲成a人片在线观看老师| 99爱在线观看免费完整版| 亚洲AV成人无码网天堂|