AIGC動態歡迎閱讀
原標題:最強國產多模態大模型來了!硬剛GPT-4o,商湯現場演示實時音視頻交互
關鍵字:商湯,模型,政策,解讀,演示
文章來源:智東西
內容字數:0字
內容摘要:
商湯發布國內首個流式多模態大模型日日新5o,多項測評超GPT-4o。
作者|三北
編輯|漠影
今日,“國產版GPT-4o”,日日新5o,亮相WAIC大會。
5月中旬,OpenAI推出新旗艦模型GPT-4o,憑借自然流暢的實時音視頻交互震驚世界。
僅僅一個多月之后,在我國一年一度的最大人工智能盛會WAIC 2024上,商湯科技正式推出日日新5.5,以及可進行流式多模態交互的5o版本,不僅多項測評超GPT-4o,還實現實時跨文本、音頻、圖像與視頻推理。
▲商湯日日新5.5多項核心指標測評超GPT-4o
商湯科技現場演示了新模型日日新5o的實時音視頻交互,引起了WAIC觀眾的一片沸騰。
比如,當演示者用手機對著桌上小狗,日日新5o可以在要求下講出小狗的表情,并識別出帽子上的文字和背景,多輪對話十分絲滑流暢。與此同時,商湯還推出可控人物類AI視頻生成產品Vimi,可穩定生成長達1分鐘的單鏡頭人物類視頻,具有高動態、高保真特點,預計月內公測。
通過Vimi,商湯董事長兼CEO徐立在現場致敬了人工智能領域的多位大咖,包括讓已故的AI科學家、商湯科技創始人湯曉鷗的照片“復活”,久違的音容笑貌浮現
原文鏈接:最強國產多模態大模型來了!硬剛GPT-4o,商湯現場演示實時音視頻交互
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...