AIGC動態歡迎閱讀
原標題:談談對OpenAI Triton的一些理解
關鍵字:工作,用戶,知乎,侵權,指令
文章來源:智猩猩GenAI
內容字數:0字
內容摘要:
大會預告12月5日-6日,2024中國生成式AI大會(上海站)舉辦。將邀請50+位嘉賓圍繞大模型、AI Infra、端側生成式AI、AI視頻生成和具身智能等議題進行同臺分享和討論。歡迎報名或購票。導讀作者為楊軍
原文來自知乎,地址:https://zhuanlan.zhihu.com/p/613244988
本文只做學術/技術分享,如有侵權,聯系刪文。01前言在AI系統領域,Triton其實是個有些歧義的名字,因為至少有兩個足夠有影響力的Triton相關的AI系統的工作,一個是NVIDIA用于在線服務布署的Triton Inference Server,另一個是由OpenAI發起的高層次Kernel開發語言Triton。
今天討論的是后者。
大約在21年上半年,一個硬件公司的朋友給自己分享過Triton的工作,當時并沒有很深刻的映象。第二次關注是在2022年上半年,因為一些機緣巧合,又接觸到了Triton相關的內容,彼時Triton基于MLIR重構的工作剛剛開始,甚至整個架子都還沒能跑通。正好自己一直在思考基于MLIR解決計算密集算子codegen問題的可能性,也對Triton這種高層
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...