多模態(tài)大模型線上閉門會(huì):通義實(shí)驗(yàn)室/港中文/港科大三位學(xué)者主講ControlLLM、LLaMA-VID和mPLUG-DocOwl
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:多模態(tài)大模型線上閉門會(huì):通義實(shí)驗(yàn)室/港中文/港科大三位學(xué)者主講ControlLLM、LLaMA-VID和mPLUG-DocOwl
關(guān)鍵字:模型,語言,達(dá)摩,視覺,猩猩
文章來源:算法邦
內(nèi)容字?jǐn)?shù):5744字
內(nèi)容摘要:
智猩猩,由智東西公開課升級(jí)而來,定位硬科技講解與服務(wù)平臺(tái),提供講座、線上閉門會(huì)、公開課、在線研討會(huì)、峰會(huì)等線上線下產(chǎn)品。
「線上閉門會(huì)」由智猩猩全新企劃,將持續(xù)邀請(qǐng)行業(yè)、領(lǐng)域?qū)<覔?dān)任出品人共同策劃出品,探討人工智能、自動(dòng)駕駛領(lǐng)域中的最新技術(shù)研究與應(yīng)用。2023 年可謂是多模態(tài)大模型爆發(fā)的元年。從OpenAI 的 GPT-4V,到谷歌的 Gemini,再到國(guó)內(nèi)眾多機(jī)構(gòu)發(fā)布的多模態(tài)大模型。大模型的能力已經(jīng)不僅僅局限于傳統(tǒng)的文本輸入和輸出,通過處理包括文本、圖像、音頻和視頻在內(nèi)的多種數(shù)據(jù)類型,使得它能夠執(zhí)行更加復(fù)雜和多樣化的任務(wù),從而擴(kuò)展到了圖像生成、視頻處理、文檔處理、語音識(shí)別和生成等領(lǐng)域。
多模態(tài)大模型是智猩猩重點(diǎn)關(guān)注的領(lǐng)域,今年也將持續(xù)深入挖掘?qū)W術(shù)界和工業(yè)界在多模態(tài)大模型上的研究進(jìn)展和最新成果。1月17日晚7點(diǎn),智猩猩推出「多模態(tài)大模型線上閉門會(huì)」。本次閉門會(huì)由阿里巴巴通義實(shí)驗(yàn)室 NLP 高級(jí)算法專家嚴(yán)明參與出品,并聚焦于大語言模型工具調(diào)用 ControlLLM、長(zhǎng)視頻理解視覺語言模型 LLaMA-VID和多模態(tài)文檔理解大模型 mPLUG-DocOwl。
出品人嚴(yán)明的主要研究方向?yàn)閷?duì)話
原文鏈接:多模態(tài)大模型線上閉門會(huì):通義實(shí)驗(yàn)室/港中文/港科大三位學(xué)者主講ControlLLM、LLaMA-VID和mPLUG-DocOwl
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡(jiǎn)介:「算法邦」,隸屬于智猩猩,關(guān)注大模型、生成式AI、計(jì)算機(jī)視覺三大領(lǐng)域的研究與開發(fā),提供技術(shù)文章、講座、在線研討會(huì)。
相關(guān)文章
