iPhone動嘴10秒P圖!UCSB蘋果全華人團隊發(fā)布多模態(tài)MGIE,官宣開源人人可玩
AIGC動態(tài)歡迎閱讀
原標(biāo)題:iPhone動嘴10秒P圖!UCSB蘋果全華人團隊發(fā)布多模態(tài)MGIE,官宣開源人人可玩
關(guān)鍵字:指令,圖像編輯,編輯,模型,視覺
文章來源:新智元
內(nèi)容字數(shù):7396字
內(nèi)容摘要:
新智元報道編輯:桃子
【新智元導(dǎo)讀】最近,來自UCSB和蘋果的華人團隊提出了MGIE,通過多模態(tài)模型引導(dǎo)圖像精準(zhǔn)編輯,可以10秒完成P圖。幾天前,庫克在蘋果電話會上證實,「今年晚些時候會發(fā)布生成式AI」。
ChatGPT掀起全球熱潮之后,蘋果也在悄悄發(fā)力AI,曾曝出的大模型框架Ajax、AppleGPT等AI工具讓業(yè)界充滿了期待。
6月舉辦的WWDC上,這家曾全球市值第一公司,將會宣布各種AI能力整合到iOS 18、iPadOS 18等軟件產(chǎn)品中。
而在此之前,你在iPhone可以搶先用上AI超能力了!
隨意拍攝一張餐桌圖,然后說一句「在餐桌上添加一份披薩」。披薩瞬間就出現(xiàn)在桌子上了。
此外,你還可以隨意選一張圖,可以讓圖片中哭臉變成笑臉、照片提亮、移除背景人物,甚至可以將綠植景色更換成海洋。
這些魔法實現(xiàn),只需你動動嘴,立刻完成P圖。
這項神奇的技術(shù)背后是由一個基于自然語言修改圖片的新模型——MGIE加持,由UCSB和蘋果全華人團隊共同完成。
具體就是,通過多模態(tài)模型,去引導(dǎo)圖像進行編輯。
論文地址:https://arxiv.org/pdf/2309.17102.pdf
從上
原文鏈接:iPhone動嘴10秒P圖!UCSB蘋果全華人團隊發(fā)布多模態(tài)MGIE,官宣開源人人可玩
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。