<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        顛覆傳統:XGrammar引擎實現百倍加速與近零開銷的性突破

        AIGC動態9個月前發布 機器之心
        379 0 0

        現在,大語言模型的結構化生成有了一個更加高效、靈活的引擎。

        顛覆傳統:XGrammar引擎實現百倍加速與近零開銷的革命性突破

        原標題:陳天奇團隊LLM結構化生成新引擎XGrammar:百倍加速、近零開銷
        文章來源:機器之心
        內容字數:7954字

        1. 引言

        隨著大語言模型(LLM)的發展,結構化生成變得日益重要。陳天奇團隊提出了XGrammar,一個高效、靈活且可移植的結構化生成引擎,以滿足代碼編寫、外部工具調用和機器人控制等多種需求。

        2. XGrammar的概述

        XGrammar是一個開源軟件庫,致力于提供靈活的結構化生成解決方案,支持多種格式(如JSON、SQL等)。其核心目標是高效地進行約束解碼,克服上下文無關語法(CFG)在傳統應用中的效率瓶頸。

        3. 約束解碼的挑戰

        約束解碼通過過濾無效token來確保生成數據符合特定結構。然而,CFG的靈活性使得解碼效率低下,尤其是在處理大詞表時,計算開銷顯著增加。XGrammar通過改進算法和數據結構,顯著提升了解碼速度。

        4. 解決方案

        XGrammar采用字節級下推自動機(PDA)來處理CFG,并引入自適應token掩碼緩存,提高了掩碼生成的速度。通過將上下文無關token與上下文相關token分離,XGrammar能夠在運行時快速生成大部分掩碼,顯著提升整體性能。

        5. 性能評估

        在與Llama-3.1模型的評估中,XGrammar在JSON模式下實現了高達3倍的加速,并在復雜的JSON用例中超過100倍的加速。整體運行時間低于40微秒,適用于低延遲LLM推理場景。

        6. 端到端LLM引擎

        通過將XGrammar集成到端到端LLM推理框架中,研究顯示其在TPOT和TTFT性能方面優于其他框架,整體速度提升達到80倍。有效的掩碼生成與LLM推理的重疊計算進一步降低了延遲。

        7. 跨平臺部署

        XGrammar能夠在多種平臺上運行,通過Emscripten編譯為WebAssembly,并與WebLLM框架集成,展示了在移動設備和瀏覽器環境中的高效表現。

        8. 結論

        XGrammar代表了結構化生成技術的一個重要進展,其高效性和靈活性為未來的應用提供了強大的支持,尤其在端側智能體的發展中具有廣闊的前景。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 羞羞视频免费网站入口| 成年性羞羞视频免费观看无限 | 91精品视频在线免费观看| 亚洲色欲久久久久综合网| 日韩精品视频在线观看免费 | 久久精品国产亚洲av成人| 99精品免费视频| 亚洲精品~无码抽插| 日韩电影免费在线观看网站| 中文字幕日韩亚洲| 99精品全国免费观看视频..| 亚洲乱码一区二区三区在线观看| 美女网站在线观看视频免费的 | 成年人视频在线观看免费| 亚洲av综合av一区二区三区| 四虎影在线永久免费四虎地址8848aa | 日韩精品无码免费专区午夜不卡| 亚洲AV日韩AV永久无码下载| 69影院毛片免费观看视频在线 | 亚洲五月综合缴情在线观看| 嫩草成人永久免费观看| 亚洲国产精品自在线一区二区| 精品香蕉在线观看免费| 亚洲国产精品嫩草影院| 国产国拍亚洲精品福利 | 18禁美女黄网站色大片免费观看| 亚洲午夜电影在线观看高清| 免费观看美女裸体网站| 国产免费A∨在线播放| 香蕉视频在线观看亚洲| 毛片免费观看视频| av成人免费电影| 亚洲黄色免费在线观看| 日韩免费三级电影| APP在线免费观看视频| 久久精品国产99国产精品亚洲| 少妇亚洲免费精品| 精品无码人妻一区二区免费蜜桃| 亚洲人成网亚洲欧洲无码| 亚洲自偷自偷偷色无码中文| 国产成人精品久久免费动漫|