AIGC動態歡迎閱讀
原標題:梗圖理解“天花板”!港中文終身教授賈佳亞團隊推出多模態模型:GPT-4+DALL-E 3,王炸組合刷爆榜單
關鍵字:字節跳動,小米,報告,模型,圖像
文章來源:AI前線
內容字數:5373字
內容摘要:
整理 | 傅宇琪
近日,港中文終身教授賈佳亞團隊推出了一款名為 Mini-Gemini 的多模態模型,包括 2B 小杯到 34B 的超大杯,一經發布便登上了 PaperWithCode 熱榜。憑借超強的圖文理解力,Mini-Gemini 的最強模型版本在多個指標上,直接媲美 Gemini Pro,GPT-4V,網友稱其效果堪稱是開源社區的 GPT4+DALL-E 3 的王炸組合!
目前,研究團隊將 Mini-Gemini 的代碼、模型、數據全部開源。更有意思的是,超會玩梗的 Mini-Gemini 線上 Demo 已經發布,人人皆可上手試玩?!皽\嘗”之后,有人認為:Mini-Gemini 跟商業模型差不了多少!最“懂”圖的大模型?圖像理解及推理當下,絕大多數多模態模型僅支持低分辨率圖像輸入和文字輸出。而在實際場景中,許多任務都需要對高清圖像進行解析,并用圖像的形式進行展現。Mini-Gemini 在這一點上有著不錯的表現:
給它一張做面包的九宮格漫畫教程,Mini-Gemini 能看懂并進行手把手教學。
拍一張蘋果店 Mac 電腦信息圖,Mini-Gemini 能夠將兩種 Mac 的參
原文鏈接:梗圖理解“天花板”!港中文終身教授賈佳亞團隊推出多模態模型:GPT-4+DALL-E 3,王炸組合刷爆榜單
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...