標(biāo)簽:智能語音識別
Veo 2:高分辨率4K視頻生成的先進AI模型,助力創(chuàng)意無限
Veo 2 是 Google DeepMind 推出的 AI 視頻生成模型,能根據(jù)文本或圖像提示生成高質(zhì)量視頻內(nèi)容。Veo 2支持高達 4K 分辨率的視頻制作,理解鏡頭控制指令,能模...
Step-1o:國內(nèi)首個千億參數(shù)端到端語音大模型震撼發(fā)布,性提升語音識別與合成能力
Step-1o是階躍星辰推出的國內(nèi)首個千億參數(shù)端到端語音大模型。模型支持語音、文本等混合形式的輸入和輸出,可以快速反應(yīng)并隨時打斷,提供最便捷的互動體驗;同...
I2V-01-Live:海螺AI創(chuàng)新圖生視頻模型助力創(chuàng)意內(nèi)容生成與視覺表現(xiàn)提升
I2V-01-Live是海螺AI推出的圖生視頻模型,能將靜態(tài)二維圖像轉(zhuǎn)化為動態(tài)視頻。模型基于深度學(xué)習(xí)技術(shù),增強動作的流暢度和生動性,讓人物或?qū)ο蟮膭幼鞲幼匀缓?..
小羊標(biāo)書:智能標(biāo)書生成工具助力高效招標(biāo)文檔創(chuàng)建與管理
小羊標(biāo)書是AI驅(qū)動的標(biāo)書生成工具,旨在簡化和加速標(biāo)書制作過程。用戶只需上傳招標(biāo)文件,系統(tǒng)能自動解析關(guān)鍵信息,智能生成標(biāo)書大綱和內(nèi)容。支持用戶自定義目...
吱意:智能多模態(tài)翻譯與創(chuàng)作平臺助力全球溝通與創(chuàng)意表達
吱意是AI多模態(tài)翻譯平臺,提供視頻翻譯、智能配音和音頻轉(zhuǎn)寫等功能。平臺基于智能語音識別技術(shù)和神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),為用戶提供專業(yè)高效的視頻在線翻譯服務(wù)。...
慧播星:智能直播助力電商新體驗,提升互動與銷售效率
慧播星是百度推出的AI電商直播平臺,通過人工智能技術(shù)幫助商家快速創(chuàng)建數(shù)字人主播,自動生成直播劇本和互動文案?;鄄バ侵С种悄苎b修直播間,提升直播互動性...
GLM-4V-Plus
GLM-4V-Plus是智譜AI最新推出的多模態(tài)AI模型,專注于圖像和視頻理解。GLM-4V-Plus不僅能夠精確分析靜態(tài)圖像,還具備動態(tài)視頻內(nèi)容的時間感知和理解能力,能捕...