<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        僅聽3秒,AI零樣本克隆人聲達到人類水平,情緒語調隨意改

        AIGC動態1年前 (2024)發布 量子位
        451 0 0

        僅聽3秒,AI零樣本克隆人聲達到人類水平,情緒語調隨意改

        AIGC動態歡迎閱讀

        原標題:僅聽3秒,AI零樣本克隆人聲達到人類水平,情緒語調隨意改
        關鍵字:語音,屬性,模型,分解,韻律
        文章來源:量子位
        內容字數:6768字

        內容摘要:


        量子位 | 公眾號 QbitAI零樣本、僅聽3秒提示音頻,即可1:1復刻人聲。還能給生聲帶入情緒,比如“悲傷”的情緒:“惡心”的情緒:這就是微軟與中國科技大學、香港中文大學(深圳)和浙江大學等機構合作,推出的NaturalSpeech 3系統。
        該系統采用了創新的屬性分解擴散模型和屬性分解語音神經編解碼器FACodec,從“表示”和“建模”兩個維度對語音數據進行深入研究。通過數據/模型的規模化方法,在多說話人數據集LibriSpeech上首次實現了零樣本的人類水平語音合成。
        指定特征實現個性化輸出文本到語音合成(TTS)技術作為生成式人工智能的關鍵分支,在大型語言模型(LLM)的推動下近年來迎來了突飛猛進的發展。特別是隨著語音合成技術的進步,它為大模型帶來了聲音交互的新維度,受到了業界的高度重視。在這一領域內,微軟一直是技術研究與產品開發的積極參與者,旨在創造出高度自然的人類語音。為此,微軟啟動了NaturalSpeech研究項目(https://speechresearch.github.io/)。
        該項目為實現其目標,制定了分階段的實施路線圖:
        首先,項目聚焦于在單個說話人語音


        原文鏈接:僅聽3秒,AI零樣本克隆人聲達到人類水平,情緒語調隨意改

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲第一成人在线| 久久精品国产亚洲AV香蕉| 2020久久精品亚洲热综合一本| 国产免费无码一区二区| 亚洲午夜电影在线观看| 在线看片免费人成视久网| 久久青青草原亚洲av无码app| 91短视频在线免费观看| 亚洲国产精品成人久久久| 性xxxxx免费视频播放| 亚洲免费福利在线视频| 日本人护士免费xxxx视频| 亚洲成av人片天堂网无码】| 免费成人午夜视频| aaa毛片免费观看| 亚洲一卡2卡三卡4卡有限公司| 四虎精品视频在线永久免费观看| 亚洲av产在线精品亚洲第一站| 免费无遮挡无码视频网站| 美女被吸屁股免费网站| 亚洲国产一成人久久精品| 24小时在线免费视频| 在线视频亚洲一区| 国产精品亚洲精品日韩已满| 成年黄网站色大免费全看| 色窝窝亚洲AV网在线观看| 久久国产亚洲精品麻豆| 日本免费网址大全在线观看| 在线观看亚洲免费视频| 久久精品亚洲中文字幕无码网站 | 亚洲一级毛片免费在线观看| 亚洲一卡二卡三卡| 高清在线亚洲精品国产二区| 国产va在线观看免费| 亚洲精品无码国产片| 国产亚洲婷婷香蕉久久精品| 成视频年人黄网站免费视频| 产传媒61国产免费| 91亚洲国产成人久久精品| 亚洲精品国产高清嫩草影院| 国产男女爽爽爽爽爽免费视频|