国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

大模型MLSYS學習隨筆- 訓推框架總覽

AIGC動態10個月前發布 智猩猩GenAI
563 0 0

本篇以mapping 為主)主要是了解大模型mlsys的一些核心組成

大模型MLSYS學習隨筆- 訓推框架總覽

原標題:大模型MLSYS學習隨筆- 訓推框架總覽
文章來源:智猩猩GenAI
內容字數:25824字

大模型Mlsys核心組成及挑戰:基于Mapping的學習筆記

本文是作者Bruce仗劍走天涯學模型Mlsys核心組成及當前問題的記錄,主要關注mapping層面。

1. 基礎:計算圖和AI控制流

AI軟件棧的核心是AI圖編譯器,它優化計算圖的調度。計算圖以有向圖表示,節點是操作(ops)和數據。PyTorch和TensorFlow支持跨設備和機器調度,通信作為計算圖上的算子,底層依賴如NCCL庫。ONNX則用于跨框架模型遷移。

2. 大模型執行圖

(原文未詳細展開此部分,需參考原文鏈接)

3. 輸入預處理:Tokenizer和Embedding

Tokenizer是輸入處理的第一步,將文本劃分成token并建立詞表。主流Tokenizer基于subword(字詞),例如BPE、BBPE、WordPiece,兼顧詞表規模和解碼效率。Google的SentencePiece工具包集成了BBPE能力。

Embedding將token映射到向量空間。常見的Embedding方法包括Word2Vec、GloVe、FastText和OpenAI的Embeddings API(text-embedding-ada-002)。生成的Embedding可存儲在向量數據庫中。

4. 輸入預處理:Position Encoding

Position Encoding對輸入序列建模。文章介紹了四種方法:

  1. Sinusoidal:Transformer原始方法,公式固化embedding,外推能力差。
  2. Learned Positional Embedding:絕對位置編碼,實現簡單,存在最大position限制。
  3. RoPE:旋轉式位置編碼,適合attention計算,信息更清晰,但存在遠程衰減。
  4. ALiBi:在self-attention中增加位置信息懲罰,外推性好。

5. 推理執行優化

文章總結了五類解碼策略:

  1. 自回歸:greedy、beam、sampling
  2. 非自回歸:多token并行,但準確性不如自回歸
  3. Early exiting:根據layer判斷輸出可信度,加速推理但準確性不足
  4. 投機解碼:多個小模型生成候選,大模型驗證,提升性能
  5. Cascade inference:根據請求復雜度選擇不同規模模型

6. 架構優化

文章從多個方面探討了架構優化:

  1. Activation sharing:MQA、GQA、YOCO等方法共享KV,減少顯存占用。
  2. Attention化簡:Linear Attention降低計算復雜度,但存在精度損失,Streaming-LLM是一種改進方案。
  3. Conditional computing:MoE和CoE架構,基于routing的條件計算。
  4. Recurrent Unit:RetNet、RWKV和Mamba等模型重新挑戰Transformer的地位。
  5. 降低模型配置:降低參數等,但需要保證性能。

7. 量化&模型壓縮

模型壓縮技術包括剪枝和量化(FP32到INT4/8,GPTQ、AWQ、FPTQ等),降低顯存占用并提高計算密度。

8. 顯存管理

Paged Attention解決內存碎片化問題,持久化KV Cache(Mooncake)成為趨勢,Prefix Cache用于提高生產力助手場景的效率。

9. 請求調度

Continuous batching(Orca)提高硬件利用率,Dynamic SplitFuse(DeepSpeed-FastGen)對齊forward sizes,優化吞吐量和延遲。

10. 分離式架構

DistServe、Spliwise和MoonCake等分離式架構將prefill和decode分開處理,提高吞吐量。

11. Kernel 優化

FlashAttention、FlashDecoding等工作優化算子,提高計算效率。與內存管理、分布式并行、變長輸入處理、投機推理和量化相關。

12. 并行計算

文章介紹了Data Parallel(DP)、Tensor Parallel(TP)、Pipeline Parallel(PP)、Expert Parallel和Sequence Parallel等并行方式,以及ZeRO、FSDP等技術。

13. 業界推理框架比較

文章簡要比較了TensorRT-LLM、vLLM、OpenPPL-LLM、RTP-LLM等推理框架。

14. 訓練執行框架

文章介紹了Megatron和DeepSpeed等訓練框架,以及集群管理和異常處理的重要性。

15. Megatron vs DeepSpeed

文章比較了Megatron和DeepSpeed的優缺點,Megatron性能更好但不易用,DeepSpeed易用性更好。

16. 集群相關工作

文章介紹了字節的Megascale工作,包括容錯、并行優化、網絡優化和可分析性等方面。


聯系作者

文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下公眾號之一,專注于生成式人工智能。

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        亚洲美女免费在线| 国产三级精品在线| 国产精品一卡二卡在线观看| 95精品视频在线| 欧美一区二区视频在线观看2020| 2021中文字幕一区亚洲| 免费成人在线影院| 欧美日韩中文一区| 中文字幕亚洲不卡| 国产成+人+日韩+欧美+亚洲| 日韩欧美一区二区视频| 美女视频一区在线观看| 欧美日韩国产色站一区二区三区| 亚洲色图视频网| 欧美在线免费视屏| 日韩精品高清不卡| 日韩欧美国产精品一区| 精品无人码麻豆乱码1区2区 | 亚洲一区二区三区在线| 在线中文字幕一区| 午夜一区二区三区视频| 欧美日韩一二区| 国产一区二区h| 亚洲精品国产视频| 欧美日韩中文字幕精品| 国产69精品久久99不卡| 国产精品成人一区二区艾草 | 亚洲人精品一区| 日韩精品专区在线| 精品视频999| av网站免费线看精品| 亚洲成人久久影院| 久久婷婷一区二区三区| 制服.丝袜.亚洲.另类.中文| 成人免费高清在线| 久久99九九99精品| 亚洲精品日韩一| 中文字幕中文字幕一区二区| 久久久99久久| 精品视频在线免费看| 日韩福利视频网| 国产亚洲精品超碰| 日韩视频一区二区在线观看| 在线观看一区二区视频| 色偷偷成人一区二区三区91 | 中文字幕一区二区三区在线不卡| 久久综合九色综合欧美亚洲| 欧美久久久久久久久久| 欧美人狂配大交3d怪物一区| 欧洲视频一区二区| 欧美色手机在线观看| 91黄色小视频| 777精品伊人久久久久大香线蕉| 欧美一区二区三区四区五区 | 久久国产三级精品| 丁香一区二区三区| 色av成人天堂桃色av| 欧美性三三影院| 欧美精品一区二区在线观看| 欧美国产视频在线| 午夜婷婷国产麻豆精品| 国产一区二区三区在线观看免费视频 | 国产日产精品一区| 国产精品国产三级国产aⅴ入口| 亚洲美女淫视频| 日欧美一区二区| 成人免费电影视频| 日韩视频不卡中文| 亚洲激情图片小说视频| 国产一区二区免费在线| www.欧美.com| 日韩免费电影网站| 日韩av一级电影| 欧美性欧美巨大黑白大战| 日韩亚洲欧美高清| 亚洲r级在线视频| 国产剧情一区二区| 中文字幕不卡在线播放| 国产成人精品www牛牛影视| 日韩欧美电影一区| 午夜成人免费电影| av资源网一区| 亚洲欧美日韩中文播放| 成人免费黄色大片| 久久久久久久国产精品影院| 亚洲欧美日韩精品久久久久| 国产一区二区三区免费播放| 2014亚洲片线观看视频免费| 免费成人在线播放| 欧美极品另类videosde| 国产酒店精品激情| 亚洲婷婷在线视频| 欧美日韩国产在线播放网站| 午夜天堂影视香蕉久久| 日韩色视频在线观看| 精品一区二区三区免费| 中文字幕的久久| 欧美日韩国产美| 成人h精品动漫一区二区三区| 国产亚洲一区二区三区| 在线观看成人免费视频| 麻豆精品一区二区三区| 亚洲欧美区自拍先锋| 日韩欧美亚洲另类制服综合在线| 狠狠v欧美v日韩v亚洲ⅴ| 综合久久给合久久狠狠狠97色 | 日韩精品一区二区三区蜜臀| 国产一区二区女| 一区二区三区.www| 久久精品亚洲国产奇米99| 欧美中文字幕久久| 成人精品免费视频| 韩国av一区二区三区在线观看| 国产精品成人免费| 欧美一卡二卡在线观看| 在线免费av一区| 91蜜桃免费观看视频| 经典三级在线一区| 亚洲国产精品一区二区www在线| 国产亚洲一区二区三区在线观看| 91精品国产乱码| 日韩欧美区一区二| 色婷婷综合久久| 99久久精品99国产精品| av在线不卡电影| 欧美午夜精品理论片a级按摩| 99久久国产综合精品麻豆| 不卡电影一区二区三区| 国产一区二区三区免费在线观看| 国产麻豆9l精品三级站| 91在线观看高清| 在线综合亚洲欧美在线视频| 欧美一二三四区在线| 欧美极品少妇xxxxⅹ高跟鞋| 国产精品传媒在线| 日日欢夜夜爽一区| av在线不卡网| 欧美一区二区福利视频| 欧美精品一区二区三区在线| 国产精品久久久久久福利一牛影视| 夜夜亚洲天天久久| 亚洲色图都市小说| 亚洲成人动漫一区| 国产高清成人在线| 91麻豆国产精品久久| 精品免费日韩av| 亚洲激情在线激情| 国产成人在线视频网址| 91.麻豆视频| 亚洲小说欧美激情另类| 成人一道本在线| 精品国产乱码久久久久久久久 | 精品国产乱码久久| 国内外成人在线| 8x福利精品第一导航| 亚洲bt欧美bt精品777| 欧美精品视频www在线观看| 日本美女一区二区三区视频| 欧美日韩二区三区| 麻豆国产欧美一区二区三区| 久久一区二区三区国产精品| 成人avav影音| 天堂av在线一区| 久久久精品国产免大香伊 | 日韩黄色免费网站| 精品三级av在线| 99久久久久久99| 日本午夜精品一区二区三区电影 | 91精品国产91热久久久做人人| 日本91福利区| 国产精品乱子久久久久| 欧美日韩亚洲综合在线 欧美亚洲特黄一级 | 欧美日韩成人一区二区| 国内成+人亚洲+欧美+综合在线 | 成人sese在线| 日韩精品一区第一页| 国产亚洲欧美色| 欧美日韩在线三级| 国产成人精品网址| 日韩成人一区二区| 中文字幕亚洲在| 精品国产a毛片| 欧美午夜片在线看| 成人午夜看片网址| 捆绑调教一区二区三区| 亚洲美女在线一区| 国产精品视频在线看| 日韩欧美在线网站| 欧美视频完全免费看| 懂色av一区二区三区蜜臀| 麻豆精品国产91久久久久久| 亚洲国产成人porn| 中文字幕一区二区三区精华液 | 欧美激情一区二区三区全黄| 欧美美女直播网站| 一本久道久久综合中文字幕| 国产在线不卡一区| 日韩一区精品字幕| 五月天亚洲精品| 亚洲国产日日夜夜|