最大參數(shù) 300 億!階躍星辰與吉利聯(lián)合開源兩款多模態(tài)大模型
開源大模型陣營(yíng)又添新成員。

原標(biāo)題:最大參數(shù) 300 億!階躍星辰與吉利聯(lián)合開源兩款多模態(tài)大模型
文章來源:AI前線
內(nèi)容字?jǐn)?shù):4343字
階躍星辰與吉利汽車聯(lián)合開源全球最大參數(shù)量視頻生成模型
本文總結(jié)了2025年2月18日階躍星辰和吉利汽車集團(tuán)聯(lián)合開源兩款Step系列多模態(tài)大模型的新聞要點(diǎn)。
開源兩款大模型
階躍星辰和吉利汽車集團(tuán)聯(lián)合宣布開源兩款Step系列多模態(tài)大模型:Step-Video-T2V和Step-Audio。Step-Video-T2V是全球參數(shù)量最大、性能最好的開源視頻生成模型,擁有300億參數(shù),可生成高分辨率視頻;Step-Audio是行業(yè)首款產(chǎn)品級(jí)開源語(yǔ)音交互模型,能夠生成多種風(fēng)格的語(yǔ)音。
吉利汽車的戰(zhàn)略布局
吉利汽車集團(tuán)CEO淦家閱表示,吉利致力于成為智能汽車AI科技的引領(lǐng)者和普及者,并已搭建了端到端的自研體系和生態(tài)聯(lián)盟。星睿AI大模型已與開源模型深度融合,將提升用戶體驗(yàn)。
階躍星辰的AGI目標(biāo)
階躍星辰創(chuàng)始人兼CEO姜大昕博士表示,開源的目的是分享技術(shù)成果,并與開發(fā)者共同探索多模態(tài)模型技術(shù)邊界,推動(dòng)產(chǎn)業(yè)落地,最終實(shí)現(xiàn)AGI(通用人工智能)的目標(biāo)。
Step-Video-T2V模型詳解
Step-Video-T2V模型參數(shù)量達(dá)300億,可生成204幀、540P分辨率的高質(zhì)量視頻。其在復(fù)雜、人物刻畫、視覺想象力等方面表現(xiàn)出色,語(yǔ)義理解和指令遵循能力突出。階躍星辰還發(fā)布了新的基準(zhǔn)數(shù)據(jù)集Step-Video-T2V-Eval用于評(píng)測(cè)文生視頻質(zhì)量。
Step-Audio模型詳解
Step-Audio模型是行業(yè)首個(gè)產(chǎn)品級(jí)開源語(yǔ)音交互模型,能夠生成不同情緒、方言、語(yǔ)種和風(fēng)格的語(yǔ)音,并具備高情商和音色復(fù)刻能力。在多個(gè)公開測(cè)試集中,其性能均高于同類型開源模型。
模型測(cè)試與評(píng)估
為全面評(píng)測(cè)開源模型,階躍星辰還開源了Step-Video-T2V-Eval和StepEval-Audio-360基準(zhǔn)測(cè)試,分別用于評(píng)估視頻生成模型和語(yǔ)音交互模型的性能。
體驗(yàn)方式
用戶可在躍問APP和網(wǎng)頁(yè)端體驗(yàn)Step-Video-T2V的視頻生成能力。
總而言之,此次開源標(biāo)志著階躍星辰在AGI研發(fā)道路上邁出了重要一步,也為全球開發(fā)者提供了強(qiáng)大的工具,推動(dòng)了AI技術(shù)在視頻生成和語(yǔ)音交互領(lǐng)域的進(jìn)步,并促進(jìn)與智能汽車領(lǐng)域的深度融合。
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡(jiǎn)介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。

粵公網(wǎng)安備 44011502001135號(hào)