AIGC動態歡迎閱讀
原標題:微軟用GPT-4V解讀視頻,看懂電影還能講給盲人聽,1小時不是問題
文章來源:機器之心
內容字數:7381字
內容摘要:機器之心報道編輯:Panda、陳萍差不多已經掌握語言能力的大模型正在進軍視覺領域,但具有里程碑意義的 GPT-4V 也仍有諸多不足之處,參閱《》。近日,微軟 Azure AI 將 GPT-4V 與一些專用工具集成到一起,打造出了更強大的 MM-Vid,其不僅具備其它 LMM 的基本能力,還能分析長達一小時的長視頻以及解說視頻給視障人士聽。世界各地的人們每天都會創造大量視頻,包括用戶直播的內容、短視…
原文鏈接:點此閱讀原文:微軟用GPT-4V解讀視頻,看懂電影還能講給盲人聽,1小時不是問題
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...