<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        顛覆性創新:XGrammar引擎助力LLM生成速度提升百倍,開銷幾近為零!

        AIGC動態9個月前發布 智猩猩GenAI
        439 0 0

        現在,大語言模型的結構化生成有了一個更加高效、靈活的引擎。

        顛覆性創新:XGrammar引擎助力LLM生成速度提升百倍,開銷幾近為零!

        原標題:陳天奇團隊LLM結構化生成新引擎XGrammar:百倍加速近零開銷
        文章來源:智猩猩GenAI
        內容字數:8316字

        2024中國生成式AI大會(上海站)預告

        2024中國生成式AI大會將于12月5-6日在上海舉行,主會場將舉辦大模型峰會和AI Infra峰會,分會場將進行端側生成式AI、AI視頻生成和具身智能的技術研討會,歡迎報名參加。

        新型結構化生成引擎:XGrammar

        針對目前大語言模型(LLM)在結構化生成上的效率問題,陳天奇團隊提出了XGrammar,一個高效、靈活且可移植的結構化生成引擎。XGrammar的目標是實現靈活、零開銷的結構化生成,支持多種格式如JSON和SQL。

        約束解碼的挑戰

        傳統的約束解碼方法使用上下文無關語法(CFG)來過濾無效token,但效率不高。XGrammar通過字節級下推自動機(PDA)和自適應token掩碼緩存顯著提升了性能,能夠將每個token的延遲降低100倍,并實現端到端LLM服務的速度提升80倍。

        XGrammar的實現與優化

        XGrammar利用預處理階段生成的自適應token掩碼緩存,加速運行時的掩碼生成。此外,通過上下文擴展和持續性執行堆棧等技術,進一步提升了效率。研究者還進行了多項結構優化,如規則內聯和下推自動機節點合并,以減少計算量。

        評估結果與跨平臺部署

        在評估中,XGrammar在JSON模式下實現了3倍的加速,復雜語法下的加速更是超過100倍。XGrammar還被成功編譯為WebAssembly,支持在多種平臺上進行高性能的結構化生成,顯示出了其廣泛的應用潛力。

        總結

        XGrammar的提出為大語言模型的結構化生成提供了新思路,通過多種優化顯著提高了效率,展現了在生成式AI領域的重要應用價值。歡迎關注即將舉辦的2024中國生成式AI大會,共同探索更多前沿技術。


        聯系作者

        文章來源:智猩猩GenAI
        作者微信:
        作者簡介:智猩猩旗下公眾號之一,深入關注大模型與AI智能體,及時搜羅生成式AI技術產品。

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲av午夜精品一区二区三区| 成人A级毛片免费观看AV网站| 亚洲欧洲日产国码一级毛片 | 日本免费高清一本视频| 亚洲视频一区在线播放| 永久在线免费观看| 91嫩草私人成人亚洲影院| 99re免费99re在线视频手机版| 亚洲av无码专区在线播放| 你懂的免费在线观看网站| 亚洲AV综合色区无码一区爱AV| 久久久高清日本道免费观看| 亚洲网站在线观看| 免费看美女裸露无档网站| 亚洲一卡2卡三卡4卡无卡下载| 国产高清免费在线| 一级毛片在播放免费| 亚洲av无码精品网站| 中文毛片无遮挡高潮免费| 美女视频黄免费亚洲| 国产成人在线观看免费网站| 一级毛片免费在线播放| 亚洲AV一宅男色影视| 国国内清清草原免费视频99| 国产精品亚洲а∨无码播放不卡| 亚洲人成国产精品无码| 亚欧免费一级毛片| 亚洲一卡一卡二新区无人区| 亚洲精品视频免费| 曰批视频免费40分钟试看天天| 亚洲日韩av无码中文| 久久亚洲中文字幕精品一区四| 精品无码无人网站免费视频| 亚洲精品精华液一区二区| 亚洲国产一区视频| 免费看h片的网站| 美女黄色免费网站| 久久国产亚洲高清观看| 免费国产在线观看老王影院| 久草免费福利资源站| 一本天堂ⅴ无码亚洲道久久|