詳解Scale-Out、Scale-Up~
原標題:公開課預告:智算中心 AI Scale-Up 網絡技術|益思芯科技解決方案副總裁唐杰主講
文章來源:智猩猩GenAI
內容字數:2191字
智猩猩智算集群公開課介紹
自10月起,智猩猩芯片與算力教研組推出了「智猩猩智算集群公開課」,旨在深入探討集群構建、互聯網絡、算力調度和存儲等關鍵技術。目前,前三期課程已經圓滿結束,吸引了廣泛關注。未來的課程將繼續為參與者帶來前沿技術的分享和討論。
課程內容回顧
前三期的公開課分別由騰訊專有云首席架構師方天戟、矩向科技CEO黃朝波及云脈芯聯產品總監孫偉主講,主題涵蓋了智算集群技術概述、算力調度以及網絡互連技術的創新應用。這些課程為參與者提供了深入的技術解析和實際案例,幫助大家更好地理解智算集群的核心技術。
即將到來的第4期課程
第4期公開課將于11月28日19:30開講,由益思芯科技解決方案副總裁唐杰主講,主題為《智算中心 AI Scale-Up 網絡技術》。隨著智算集群規模的不斷擴大,如何保證超大規模卡間的高效協同變得至關重要,這也是提升集群計算性能的關鍵所在。
Scale-Out與Scale-Up的技術解析
當前,Scale-Out和Scale-Up是智算網絡技術中備受關注的兩個方向。Scale-Out通過以太網或Infiniband實現GPU之間的RDMA功能,而Scale-Up則用于GPU間的高速互連,支持跨GPU的內存讀寫。二者的本質區別在于側重點不同,Scale-Out主要關注網絡架構的擴展性,而Scale-Up則強調內存傳輸的高效性。
課程提綱與講師介紹
唐杰老師將在公開課中詳細討論以下幾個方面:1) AI智算網絡為何要有Scale-Up與Scale-Out之分;2) StarLink互聯技術所要解決的問題;3) StarLink的技術特點;4) 在智算中心實現StarLink互聯的技術路徑。唐杰擁有豐富的技術背景,曾在Xilinx負責數據中心方案,現負責益思芯的產品方案和技術開發。
報名方式
對于有興趣參加直播的朋友,可以通過添加小助手“瑞秋”進行報名。已添加的朋友可直接私信“智算集群04”進行報名。成功報名的朋友將被邀請入群進行觀看與交流。
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下矩陣賬號之一,聚焦大模型開啟的通用人工智能浪潮。