<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        AIGC動態5個月前發布 量子位
        443 0 0

        參與開源的還有阿里云、華為存儲、面壁智能、趨境科技等

        Kimi開源推理框架:僅用1小時,GitHub攬獲1.2k星,揭秘其成功秘訣!

        原標題:Kimi開源底層推理框架,1小時GitHub攬星1.2k
        文章來源:量子位
        內容字數:3445字

        Kimi底層推理架構Mooncake開源

        近日,Kimi底層推理架構Mooncake正式宣布開源,該架構承載了Kimi線上80%以上的流量。此次開源由月之暗面Kimi與清華大學等機構聯合發布,采用分階段的方式逐步開放高性能KVCache多級緩存Mooncake Store的實現,并兼容各類推理引擎及底層存儲/傳輸資源。

        1. Mooncake的核心技術

        Mooncake系統基于KVCache中心的解耦架構,分離了預填充集群與解碼集群,充分利用了GPU集群中的CPU、DRAM和SSD資源。其調度程序旨在平衡整體吞吐量與延遲相關的服務級別目標(SLO)。在流量高峰期,Mooncake通過早期拒絕策略和預測未來負載的方法來有效應對超載問題。

        2. 提升推理性能

        根據論文實驗結果,Mooncake在某些模擬場景中可實現高達525%的吞吐量提升,同時遵守SLO標準。在實際工作負載下,Mooncake使Kimi能夠處理超過75%的請求。許欣然表示,目前該系統承擔了Kimi線上80%以上的流量,極大提升了用戶體驗并降低了運營成本。

        3. 開源項目的前景

        為了加速Mooncake技術框架的應用與推廣,Kimi聯合多家機構發布了開源項目,參與方包括AISoft、阿里云、華為存儲等。Mooncake項目將為大模型時代構建新的高性能內存語義存儲標準接口,鼓勵更多企業與研究機構共同探索高效的模型推理系統架構創新。

        4. 結論

        Mooncake的開源標志著在大模型推理技術領域的一個重要進展,未來有望推動整個行業向更高效的推理平臺發展。開發者和研究者可以通過GitHub獲取Mooncake的相關資源,參與到這一創新項目中。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 3344免费播放观看视频| 免费无码又爽又刺激高潮软件| 久久免费的精品国产V∧| 亚洲精品成人片在线播放| 成人影片一区免费观看| 亚洲AV永久无码精品水牛影视| 免费毛片a线观看| 久久久久亚洲精品天堂| 91精品国产免费久久国语麻豆| 亚洲另类激情综合偷自拍| 4444www免费看| 在线亚洲午夜片AV大片| 国产免费资源高清小视频在线观看| 美女视频免费看一区二区| 亚洲福利精品电影在线观看| 国产三级在线免费观看| 久久精品亚洲综合专区| 无码精品A∨在线观看免费| 亚洲丶国产丶欧美一区二区三区 | 色噜噜噜噜亚洲第一| 日本特黄a级高清免费大片| 暖暖免费中文在线日本| 亚洲国产精品无码久久SM| 中文字幕免费在线| 亚洲精华液一二三产区| 亚洲综合最新无码专区| 久久九九AV免费精品| 亚洲AV无码无限在线观看不卡| 亚洲 无码 在线 专区| 日韩精品极品视频在线观看免费| 国产亚洲中文日本不卡二区| 亚洲AV无码一区二三区| 99精品一区二区免费视频| 在线看亚洲十八禁网站| 久久久亚洲欧洲日产国码农村| 免费无码又爽又刺激聊天APP| 在线观看亚洲精品专区| 亚洲电影免费在线观看| 成年人在线免费看视频| 特级做A爰片毛片免费看无码| 77777午夜亚洲|