AIGC動態歡迎閱讀
原標題:告別CUDA無需Triton!Mirage零門檻生成PyTorch算子,人均GPU編程大師?
關鍵字:內核,注意力,線程,性能,乘法
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com近日,來自 CMU 的 Catalyst Group 團隊發布了一款 PyTorch 算子編譯器 Mirage,用戶無需編寫任何 CUDA 和 Triton 代碼就可以自動生成 GPU 內核,并取得更佳的性能。
隨著 GPU 加速器的不斷發展以及以大語言模型為代表的生成式 AI 應用的不斷推廣,通過開發高性能 GPU 內核來優化 PyTorch 程序的計算效率變得越來越重要。目前,這項任務主要由專門的 GPU 專家來完成。在 NVIDIA CUDA 或 AMD ROCm 中編寫高性能 GPU 內核需要高水平的 GPU 專業知識和大量的工程開發經驗。目前的機器學習編譯器(如 TVM、Triton 和 Mojo)提供了一些高級編程接口,以簡化 GPU 編程,使用戶
原文鏈接:告別CUDA無需Triton!Mirage零門檻生成PyTorch算子,人均GPU編程大師?
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...