20萬卡吞金獸 Grok 3 炸裂登場,卡帕西大神親測:性能超過DeepSeek R1!馬斯克:短期不開源
Grok?3發(fā)布后,能否改寫以OpenAI、谷歌、Meta為核心的AI新秩序?

原標(biāo)題:20萬卡吞金獸 Grok 3 炸裂登場,卡帕西大神親測:性能超過DeepSeek R1!馬斯克:短期不開源
文章來源:AI前線
內(nèi)容字?jǐn)?shù):10045字
xAI發(fā)布Grok 3:挑戰(zhàn)LLM格局的超級AI模型
本文總結(jié)了xAI公司發(fā)布的新一代AI模型Grok 3及其mini版本的主要特點、性能表現(xiàn)和未來展望。
Grok 3的發(fā)布與目標(biāo)
埃隆·馬斯克旗下xAI公司發(fā)布了新一代AI模型Grok 3和Grok 3-mini,馬斯克將其稱為“迄今為止最強大的AI模型”。Grok一詞源于科幻小說,意為“深刻理解”。xAI團隊耗時214天建成并擴建了包含20萬張英偉達GPU的Colossus超級計算機用于訓(xùn)練Grok 3。其目標(biāo)是完成現(xiàn)實世界中的復(fù)雜任務(wù),例如制造特斯拉汽車、解決太空發(fā)射問題等,并預(yù)測未來兩年內(nèi)AI將超越人類,實現(xiàn)科學(xué)突破。
Grok 3的性能與特點
Grok 3最顯著的特點是集成了推理能力,能夠在解決問題前進行思考。在數(shù)學(xué)、科學(xué)和編碼方面,Grok 3及其mini版本均表現(xiàn)優(yōu)異,在多個基準(zhǔn)測試中擊敗了其他競爭對手,例如在Arena測試中得分超過1400分,在AIME考試中取得93%的成績。Grok 3-mini的性能雖然略遜于Grok 3,但也優(yōu)于其他主流模型。xAI還推出了DeepSearch,一種新型搜索引擎和Agent工具,能夠輔助編程和解答日常問題。
Grok 3的訂閱模式與未來規(guī)劃
Grok 3提供兩種訂閱模式:X平臺Premium+深度用戶和月費30美元/年費300美元的SuperGrok。xAI計劃在一周內(nèi)上線語音模式,數(shù)周后為企業(yè)用戶提供包含DeepSearch的API接入方案,并在幾個月后對Grok 2進行開源。
Grok 3對Scaling Law的意義
Grok 3的發(fā)布被視為對Scaling Law的又一次驗證,其強大的算力支持(20萬張英偉達GPU,4億個GPU小時)遠超其他模型,這表明在LLM領(lǐng)域,Scaling Laws或許依然成立。Grok 3的成功也挑戰(zhàn)了“Scaling Law終結(jié)”的論調(diào)。
Grok 3的市場競爭力與爭議
雖然Grok 3在技術(shù)上表現(xiàn)出色,但在市場競爭力方面仍面臨挑戰(zhàn)。其市場份額遠不及ChatGPT,并且曾因訪問X平臺數(shù)據(jù)而產(chǎn)生偏見爭議。一些觀點認(rèn)為,即使使用合成數(shù)據(jù),Grok 3也難以與參數(shù)規(guī)模更大的競爭對手匹敵。然而,Grok 3與X平臺的原生集成以及獨特的編程方式使其在X用戶中頗受歡迎。
Grok系列模型的演進
Grok系列模型是xAI的核心產(chǎn)品,從Grok 1的合成數(shù)據(jù)訓(xùn)練,到Grok 2的合成數(shù)據(jù)與真實數(shù)據(jù)結(jié)合,再到Grok 3的強大算力支持和推理能力集成,體現(xiàn)了xAI在AI模型發(fā)展上的持續(xù)改進和探索。
總而言之,Grok 3的發(fā)布是AI領(lǐng)域的一個重要,其強大的性能和獨特的特性使其成為一個值得關(guān)注的競爭者。然而,其能否最終躋身全球頂級模型之列,還需要時間的檢驗。
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實踐案例,助你全面擁抱AIGC。

粵公網(wǎng)安備 44011502001135號