馬斯克發(fā)布Grok 1.5,追了一年,仍落后于GPT-4和Claude3

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:馬斯克發(fā)布Grok 1.5,追了一年,仍落后于GPT-4和Claude3
關(guān)鍵字:模型,基準(zhǔn),前代,問(wèn)題,能力
文章來(lái)源:AI范兒
內(nèi)容字?jǐn)?shù):2683字
內(nèi)容摘要:
點(diǎn)擊上方藍(lán)字關(guān)注我們“xAI公司近日推出了Grok-1.5 AI模型,具備強(qiáng)大的推理能力和處理高達(dá)10萬(wàn)字文本的能力。在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,盡管與市場(chǎng)領(lǐng)先產(chǎn)品GPT-4和Claude 3 Opus存在差距,但已顯著超越前代Grok-1。該模型尚未決定是否開(kāi)源,展現(xiàn)了xAI在AI訓(xùn)練效率和可靠性上的創(chuàng)新。由埃隆·馬斯克支持的AI初創(chuàng)公司xAI近日推出了其最新AI模型Grok-1.5,旨在提升人工智能在處理長(zhǎng)篇文本和復(fù)雜問(wèn)題上的能力。
Grok-1.5模型將向現(xiàn)有用戶及X平臺(tái)的早期體驗(yàn)者開(kāi)放,根據(jù)xAI的介紹,該模型增強(qiáng)了推理功能,并能一次性處理高達(dá)128,000個(gè)Token的文本,相當(dāng)于約10萬(wàn)字或300頁(yè)書(shū)籍的內(nèi)容。這一突破性的上下文長(zhǎng)度擴(kuò)展,使得Grok-1.5能夠應(yīng)對(duì)更為復(fù)雜的問(wèn)題和更多的示例。
在各項(xiàng)基準(zhǔn)測(cè)試中,Grok-1.5展現(xiàn)出了其卓越的性能。在MATH基準(zhǔn)測(cè)試中,Grok-1.5取得了50.6%的成績(jī),而在GSM8K基準(zhǔn)測(cè)試中,該模型取得了90%的成績(jī),這兩個(gè)測(cè)試覆蓋了從小學(xué)到高中競(jìng)賽級(jí)別的各類數(shù)學(xué)問(wèn)題。
在代碼生成和問(wèn)題解決方面,Grok-1.5在HumanEval
原文鏈接:馬斯克發(fā)布Grok 1.5,追了一年,仍落后于GPT-4和Claude3
聯(lián)系作者
文章來(lái)源:AI范兒
作者微信:AI_Insights
作者簡(jiǎn)介:AI領(lǐng)域四大媒體之一。 智能未來(lái),始于Prompt!

粵公網(wǎng)安備 44011502001135號(hào)