<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        學發布百萬規模文本生成視頻數據集OpenVid-1M

        AIGC動態1年前 (2024)發布 夕小瑤科技說
        426 0 0

        南京大學發布百萬規模文本生成視頻數據集OpenVid-1M

        AIGC動態歡迎閱讀

        原標題:學發布百萬規模文本生成視頻數據集OpenVid-1M
        關鍵字:視頻,文本,標記,視覺,數據
        文章來源:夕小瑤科技說
        內容字數:0字

        內容摘要:


        夕小瑤科技說 原創作者 | Zicy“巧婦難為無米之炊”,文生視頻作為一個在AI中較為年輕的研究方向,由許多至關重要的問題還尚未解決,其中之一就是缺乏大規模高質量數據集,因此,最近學提出了一個名為OpenVid-1M的大規模高質量數據集,它包含了100萬個帶有字幕的高質量視頻片段。
        除了數據集,他們還提出了一種新穎的多模態視頻擴散Transformer(MVDiT),能夠同時提取視覺標記和文本標記中的結構信息和語義信息。與以往主要關注視覺內容的DiT架構不同,MVDiT通過并行的視覺-文本架構增強文本和生成視頻之間的一致性。其核心機制包括多模態自注意力模塊、多模態時間注意力模塊和多頭交叉注意力模塊,分別用于增強標記間的交互、確保時間一致性和融合文本語義信息。
        論文標題:
        OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation
        論文鏈接:
        https://arxiv.org/pdf/2407.02371
        OpenVid-1M數據集OpenVid-1M是一個精確的高質量數據集,包含超過10


        原文鏈接:學發布百萬規模文本生成視頻數據集OpenVid-1M

        聯系作者

        文章來源:夕小瑤科技說
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲区视频在线观看| 中文字幕在亚洲第一在线| 婷婷亚洲久悠悠色悠在线播放 | 亚洲成a人片在线播放| 亚洲国产精品无码中文lv| 在线播放免费播放av片| 亚洲中文字幕无码中文字| 卡一卡二卡三在线入口免费| 四虎必出精品亚洲高清| 一区二区三区免费电影| 免费一级肉体全黄毛片| fc2免费人成为视频| 亚洲AV无码乱码在线观看富二代| 久久免费看少妇高潮V片特黄| 亚洲激情在线观看| 国产精品成人免费福利| 亚洲娇小性xxxx| jjzz亚洲亚洲女人| 国产精品综合专区中文字幕免费播放| 久久久久女教师免费一区| 国产aⅴ无码专区亚洲av| 国产精品久久久久久亚洲影视| 国产hs免费高清在线观看| 九九久久国产精品免费热6| 亚洲精品乱码久久久久久中文字幕 | 亚洲成a人片在线观看中文!!!| 好湿好大好紧好爽免费视频| 亚洲国产精品国自产拍AV| 真人做人试看60分钟免费视频| 亚洲熟女www一区二区三区| 2021在线观看视频精品免费| 亚洲五月激情综合图片区| 国产精品免费观看| 国产亚洲视频在线观看| 亚洲av综合avav中文| 国产一卡二卡3卡四卡免费| 四虎精品成人免费视频| 亚洲宅男永久在线| 四虎永久免费影院在线| 性xxxx视频免费播放直播| 三上悠亚亚洲一区高清|