AIGC動態歡迎閱讀
原標題:字節打造大模型TTS:不僅能高保真合成,而且支持調整編輯
關鍵字:語音,模型,字節跳動,說話,團隊
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
編輯:Panda通過高保真合成語音與真人語音無異。
首先來聽一段《凡人修仙傳》:你猜的沒錯,這段有聲書并非來自某個專業制作團隊,而是一個 AI 模型 Seed-TTS,而這個模型則是來自字節跳動的 Seed Team。
TTS 是指文本轉語音,這是一種具備諸多妙用的技術,像是讓個人智能助理說話、為視頻或游戲配音、輔助視障人士、制作有聲書等等。對于 TTS 技術研發者來說,流暢自然的表達一直以來都是值得追求的重要目標。
字節跳動 Seed Team 發布的 Seed-TTS 不只是一個模型,而是一整個模型系列。論文標題:Seed-TTS: A Family of High-Quality Versatile Speech Generation Models
論文地址:https://arxiv.org/pdf/2406.02430
演示網站:https://bytedancespeech.github.io/seedtts_tech_report/
據介紹,該系列模型有能力合成自然度和表現力達到人類水平的語音。不僅如此,Seed-TTS 還能以零樣本方式基于一段較短的錄入語
原文鏈接:字節打造大模型TTS:不僅能高保真合成,而且支持調整編輯
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...