馬斯克的首款多模態(tài)大模型來了,GPT-4V又被超越了一次
AIGC動態(tài)歡迎閱讀
原標(biāo)題:馬斯克的首款多模態(tài)大模型來了,GPT-4V又被超越了一次
關(guān)鍵字:模型,基準(zhǔn),世界,能力,人工智能
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8857字
內(nèi)容摘要:
機(jī)器之心報道
機(jī)器之心編輯部自從 2023 年 11 月 Grok 首次亮相以來,馬斯克的 xAI 正在大模型領(lǐng)域不斷取得進(jìn)步,向 OpenAI 等先行者發(fā)起進(jìn)攻。在 Grok-1 開源后不到一個月,xAI 的首個多模態(tài)模型就問世了。
昨天,xAI 推出了 Grok-1.5V,該模型不僅能理解文本,還能處理文檔、圖表、截圖和照片中的內(nèi)容。官方博文表示:「Grok-1.5V 在許多領(lǐng)域都能媲美當(dāng)前頂尖的多模態(tài)模型,從多學(xué)科推理到理解文檔、科學(xué)圖表、圖表、截圖和照片。」 xAI 還表示,在接下來的幾個月里,預(yù)計將在圖像、音頻和視頻等各種模態(tài)上顯著提高模型能力。
我們看到了 Grok-1.5V 與 GPT-4V、Claude 3Sonnet、Claude 3 Opus 和 Gemini Pro 1.5 的測試對比。其中特別提到的是:「Grok 在理解物理世界方面的能力尤其令我們興奮。在我們新推出的 RealWorldQA 基準(zhǔn)測試中,Grok 的表現(xiàn)優(yōu)于同類產(chǎn)品。對于下面的所有數(shù)據(jù)集,我們都是在沒有思維鏈提示的情況下對 Grok 進(jìn)行評估的。」如果 Grok-1.5 能在類似于 Grok-1
原文鏈接:馬斯克的首款多模態(tài)大模型來了,GPT-4V又被超越了一次
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺