馬斯克發(fā)布Grok 1.5，追了一年，仍落后于GPT-4和Claude3

AIGC動(dòng)態(tài)2年前 (2024)發(fā)布 AI范兒

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：馬斯克發(fā)布Grok 1.5，追了一年，仍落后于GPT-4和Claude3
關(guān)鍵字：模型,基準(zhǔn),前代,問(wèn)題,能力
文章來(lái)源：AI范兒
內(nèi)容字?jǐn)?shù)：2683字

內(nèi)容摘要：

點(diǎn)擊上方藍(lán)字關(guān)注我們“xAI公司近日推出了Grok-1.5 AI模型，具備強(qiáng)大的推理能力和處理高達(dá)10萬(wàn)字文本的能力。在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，盡管與市場(chǎng)領(lǐng)先產(chǎn)品GPT-4和Claude 3 Opus存在差距，但已顯著超越前代Grok-1。該模型尚未決定是否開(kāi)源，展現(xiàn)了xAI在AI訓(xùn)練效率和可靠性上的創(chuàng)新。由埃隆·馬斯克支持的AI初創(chuàng)公司xAI近日推出了其最新AI模型Grok-1.5，旨在提升人工智能在處理長(zhǎng)篇文本和復(fù)雜問(wèn)題上的能力。
Grok-1.5模型將向現(xiàn)有用戶及X平臺(tái)的早期體驗(yàn)者開(kāi)放，根據(jù)xAI的介紹，該模型增強(qiáng)了推理功能，并能一次性處理高達(dá)128,000個(gè)Token的文本，相當(dāng)于約10萬(wàn)字或300頁(yè)書(shū)籍的內(nèi)容。這一突破性的上下文長(zhǎng)度擴(kuò)展，使得Grok-1.5能夠應(yīng)對(duì)更為復(fù)雜的問(wèn)題和更多的示例。
在各項(xiàng)基準(zhǔn)測(cè)試中，Grok-1.5展現(xiàn)出了其卓越的性能。在MATH基準(zhǔn)測(cè)試中，Grok-1.5取得了50.6%的成績(jī)，而在GSM8K基準(zhǔn)測(cè)試中，該模型取得了90%的成績(jī)，這兩個(gè)測(cè)試覆蓋了從小學(xué)到高中競(jìng)賽級(jí)別的各類數(shù)學(xué)問(wèn)題。
在代碼生成和問(wèn)題解決方面，Grok-1.5在HumanEval

原文鏈接：馬斯克發(fā)布Grok 1.5，追了一年，仍落后于GPT-4和Claude3