<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        AIGC動態9個月前發布 量子位
        451 0 0

        參與開源的還有阿里云、華為存儲、面壁智能、趨境科技等

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        原標題:Kimi開源底層推理框架,1小時GitHub攬星1.2k
        文章來源:量子位
        內容字數:3445字

        Kimi底層推理架構Mooncake開源

        近日,Kimi底層推理架構Mooncake正式宣布開源,該架構承載了Kimi線上80%以上的流量。此次開源由月之暗面Kimi與清華大學等機構聯合發布,采用分階段的方式逐步開放高性能KVCache多級緩存Mooncake Store的實現,并兼容各類推理引擎及底層存儲/傳輸資源。

        1. Mooncake的核心技術

        Mooncake系統基于KVCache中心的解耦架構,分離了預填充集群與解碼集群,充分利用了GPU集群中的CPU、DRAM和SSD資源。其調度程序旨在平衡整體吞吐量與延遲相關的服務級別目標(SLO)。在流量高峰期,Mooncake通過早期拒絕策略和預測未來負載的方法來有效應對超載問題。

        2. 提升推理性能

        根據論文實驗結果,Mooncake在某些模擬場景中可實現高達525%的吞吐量提升,同時遵守SLO標準。在實際工作負載下,Mooncake使Kimi能夠處理超過75%的請求。許欣然表示,目前該系統承擔了Kimi線上80%以上的流量,極大提升了用戶體驗并降低了運營成本。

        3. 開源項目的前景

        為了加速Mooncake技術框架的應用與推廣,Kimi聯合多家機構發布了開源項目,參與方包括AISoft、阿里云、華為存儲等。Mooncake項目將為大模型時代構建新的高性能內存語義存儲標準接口,鼓勵更多企業與研究機構共同探索高效的模型推理系統架構創新。

        4. 結論

        Mooncake的開源標志著在大模型推理技術領域的一個重要進展,未來有望推動整個行業向更高效的推理平臺發展。開發者和研究者可以通過GitHub獲取Mooncake的相關資源,參與到這一創新項目中。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲av无码专区在线观看下载| 亚洲午夜无码久久久久| 亚洲精品午夜久久久伊人| 国产情侣久久久久aⅴ免费 | 亚洲国语在线视频手机在线| 亚洲精品亚洲人成在线播放| 一色屋成人免费精品网站| 亚洲第一成年人网站| 国产国产人免费视频成69堂| 久久久久国产成人精品亚洲午夜| 亚洲国产精品美女| 中文字幕无码不卡免费视频| 亚洲 暴爽 AV人人爽日日碰| 四虎成人精品一区二区免费网站| 亚洲国产午夜精品理论片在线播放 | 黄页网站在线观看免费| 亚洲AV无码乱码在线观看| 一级毛片a免费播放王色电影| 中文字幕亚洲一区| 精品一区二区三区免费毛片爱 | 中文字幕无码不卡免费视频| 亚洲AV综合永久无码精品天堂| 无码专区一va亚洲v专区在线 | 亚洲国产天堂久久综合| 亚洲精品国产国语| 国产一级做a爱免费视频| 成人免费777777被爆出| 77777_亚洲午夜久久多人| 成年女人免费碰碰视频| 一区二区免费在线观看| 亚洲福利视频导航| 永久免费视频v片www| 中文精品人人永久免费| 亚洲综合激情视频| 国产免费av一区二区三区| 国产一区二区三区免费| 亚洲日本VA午夜在线电影| 亚洲午夜久久久久久久久久| 美女视频黄a视频全免费| 日本中文字幕免费看| 五月天婷亚洲天综合网精品偷|