AIGC動態歡迎閱讀
原標題:蘋果首次披露多模態大模型!AI 大招什么時候上 iPhone
關鍵字:模型,數據,圖像,研究人員,解讀
文章來源:愛范兒
內容字數:8283字
內容摘要:
一直在大模型浪潮有點克制的蘋果,終于不再低調了。在今年的蘋果股東大會上,庫克罕見地談及了生成式 AI。
蘋果 2024 年將在生成式 AI 領域「開辟新天地」。
今天,蘋果首次揭曉了在多模態大型語言模型(LLM)研究領域的最新突破。
這是一篇題為《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的學術論文,里面詳細介紹了具有高達 30B 參數規模的系列多模態 LLM。
不只是數蘋果!超大杯自帶火眼金睛
直入主題,先來看看「超大杯」 MM1-30B-Chat 的能力。
MM1-30B-Chat 不僅準確無誤地數出圖片中蘋果、橙子的數量,而且面對一連串數字的識別,也能輕松應對。
難度也進一步升級,研究人員設置了個陷阱問題,詢問 MM1-30B-Chat 能看到圖片中的紅球嗎?
并未中招的它能夠明確地回應道:「圖片中并無紅球,我所見到的是一只貓正坐在沙發的枕頭上,除此之外,別無他物。」
我們時常在朋友圈上看到飛機上隨手一拍的風景圖,那 MM1-30B-Chat 會怎么解讀這些風景圖呢?
目睹這幅圖像,人們會
原文鏈接:蘋果首次披露多模態大模型!AI 大招什么時候上 iPhone
聯系作者
文章來源:愛范兒
作者微信:ifanr
作者簡介:關注明日產品的數字潮牌
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...