引領未來的視頻創(chuàng)作:騰訊Sora免費開放,參數(shù)量最大文生視頻模型來襲!
騰訊開源進一步促進大模型生態(tài)繁榮發(fā)展。

原標題:開源社區(qū)參數(shù)量最大的文生視頻模型來了,騰訊版Sora免費使用
文章來源:機器之心
內容字數(shù):9780字
騰訊混元視頻生成模型開源概覽
近日,騰訊宣布旗下的混元視頻生成大模型HunYuan-Video(HY-Video)正式對外開源。這款參數(shù)量達到130億的模型為企業(yè)與個人開發(fā)者提供了全新的視頻生成工具,旨在促進視頻生成領域的開源生態(tài)發(fā)展。
1. 模型特點
HunYuan-Video具備以下幾個顯著特點:
- 卓越畫質:提供超寫實的視覺體驗,支持真實與虛擬風格的無縫切換。
- 動態(tài)流暢:突破了動態(tài)圖像的局限,實現(xiàn)完整大幅度動作的流暢演繹。
- 語義遵從:以多模態(tài)大語言模型為文本編碼器,展現(xiàn)出強大的語義理解能力。
- 原生鏡頭轉換:具備多視角鏡頭切換能力,能夠實現(xiàn)藝術鏡頭無縫銜接。
2. 開源資源與應用
HunYuan-Video的開源資源包括官網鏈接、代碼庫和技術報告,用戶可通過騰訊元寶APP申請試用該功能。該模型在多個應用場景中表現(xiàn)出色,能夠實現(xiàn)高質量的文生視頻創(chuàng)作。
3. 技術創(chuàng)新與架構設計
混元團隊在模型架構設計中引入了多個創(chuàng)新技術,包括:
- 自研的3D視覺編碼器,支持圖像與視頻混合訓練。
- 采用全注意力機制,提升畫面流暢度并實現(xiàn)主體一致的多視角切換。
- 基于Scaling Law的設計與訓練,優(yōu)化模型參數(shù)與數(shù)據(jù)配比。
4. 開源生態(tài)的未來
騰訊混元系列模型的開源進程不斷加快,未來將繼續(xù)推出更多基于視頻創(chuàng)作的模型與生態(tài)插件,促進大模型生態(tài)的繁榮發(fā)展。騰訊對開源社區(qū)的貢獻已超過170個項目,吸引了大量開發(fā)者的關注。
總而言之,HunYuan-Video的開源不僅為視頻生成領域帶來了新的機遇,也為創(chuàng)作者與開發(fā)者提供了強大的工具,有望推動整個行業(yè)的創(chuàng)新與發(fā)展。
聯(lián)系作者
文章來源:機器之心
作者微信:
作者簡介:專業(yè)的人工智能媒體和產業(yè)服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號