考研數學得126分、還能編寫小游戲，智譜首個推理模型來了，人人免費用

國內推理模型又添「生力軍」。

原標題：考研數學得126分、還能編寫小游戲，智譜首個推理模型來了，人人免費用
文章來源：機器之心
內容字數：6120字

智譜GLM-Zero-Preview：深度推理大模型強勢來襲

2024年末，智譜AI發布了其GLM模型家族的新成員——GLM-Zero-Preview，一個專注于深度思考與推理的大模型。該模型在數學、代碼和復雜推理問題上表現出色，填補了智譜在推理模型領域的空白。

1. GLM-Zero-Preview 的核心能力

GLM-Zero-Preview基于擴展強化學習技術訓練，在多個基準測試中與OpenAI的o1-preview模型不相上下，甚至在部分測試中有所超越。其顯著特點在于深度推理能力的提升，能夠進行問題拆解、嘗試多種解法，并展現出類人的思考決策過程。它在數學題（例如完整解答2025年考研數學一，得分126分）和代碼編寫及調試方面都展現了強大的能力，甚至可以編寫HTML游戲。

2. 真實世界任務測試

機器之心對GLM-Zero-Preview進行了全方位測試，涵蓋了各種類型的推理問題，包括中文邏輯陷阱題、需要專業學科知識的題目以及視覺推理任務。測試結果顯示，GLM-Zero-Preview能夠輕松應對小數點比大小、干擾項排除、中文歧義等問題，并展現出強大的常識推理和時間感知能力。在數學題方面，它能夠解決序列求解、青蛙爬井等問題，甚至能夠解答高考數學題。

3. 與競品模型的對比

機器之心將GLM-Zero-Preview與o1、DeepSeek-R1-Lite、QwQ-32B-Preview等競品模型進行了對比測試。結果顯示，GLM-Zero-Preview的推理過程更加清晰完整，并展現出自我反思、自我懷疑、自我肯定等擬人化的思維模式，在邏輯性和準確性方面具有優勢。

4. 智譜AI的AGI戰略

GLM-Zero-Preview的發布是智譜AI在AGI道路上邁出的關鍵一步。智譜AI制定了從L1到L5階段的AGI路線圖，GLM-Zero-Preview代表著其在L4階段取得的突破，標志著大模型開始具備內省、自我學習和自我改進的能力。智譜AI的產品矩陣涵蓋基座模型、多模態模型、視頻生成模型、語音模型以及推理模型等，在完整度上處于業界領先地位。