馬斯克發(fā)布Grok 1.5! 編碼和數(shù)學(xué)能力大幅提升
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:馬斯克發(fā)布Grok 1.5! 編碼和數(shù)學(xué)能力大幅提升
關(guān)鍵字:得分,能力,上下文,模型,方面
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):2426字
內(nèi)容摘要:
夕小瑤科技說 分享來源 | 量子位就在剛剛,馬斯克Grok大模型宣布重大升級(jí)。
難怪之前突然開源了Grok-1,因?yàn)樗懈鼜?qiáng)的Grok-1.5了,主打推理能力。
來自xAI的官方推送啥也沒說,直接甩鏈接。主打一個(gè)“字少事大”圖片
▲image新版本Grok有啥突破?
一是上下文長(zhǎng)度飆升,從8192增長(zhǎng)到128k,和GPT-4齊平。
二是推理性能大幅提升,數(shù)學(xué)能力直接漲點(diǎn)50%之多、HumanEval數(shù)據(jù)集上得分超過GPT-4。
消息一出,評(píng)論區(qū)立刻就躁起來了。
具體跑分結(jié)果如何,咱們立馬來看。
Grok-1.5來了首先,對(duì)于上下文窗口。
這次是一把直接提升到之前的16倍,來到128k量級(jí)。
這也就意味著Grok可以處理更長(zhǎng)和更復(fù)雜的提示,同時(shí)保持其遵循指令的能力。
在“大海撈針”(NIAH)測(cè)試中,Grok-1.5在128K token的上下文中完美檢索嵌入的文本。
整個(gè)圖一水兒的藍(lán)色(100%的檢索深度):
其次,推理方面。
Grok-1.5處理編程和數(shù)學(xué)相關(guān)任務(wù)的能力大幅提升,全面超越Grok-1、Mistral Large、Claude 2。
數(shù)學(xué)方面,Grok-1.5在MATH
原文鏈接:馬斯克發(fā)布Grok 1.5! 編碼和數(shù)學(xué)能力大幅提升
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:更快的AI前沿,更深的行業(yè)洞見。聚集25萬AI一線開發(fā)者、互聯(lián)網(wǎng)中高管和機(jī)構(gòu)投資人。一線作者來自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)湫袠I(yè)嗅覺與報(bào)道深度。