OpenAI最新發(fā)布:只需15秒音頻,Voice Engine即可幫助失語者“重獲聲音”
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:OpenAI最新發(fā)布:只需15秒音頻,Voice Engine即可幫助失語者“重獲聲音”
關(guān)鍵字:語音,聲音,人工智能,說話,語言
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):2952字
內(nèi)容摘要:
今日凌晨,OpenAI 在官網(wǎng)分享了他們?cè)?AI 語音合成方面的一些進(jìn)展——公布了一個(gè)名為“語音引擎”(Voice Engine)的模型的小規(guī)模預(yù)覽的初步見解和結(jié)果。
據(jù)介紹,該模型使用文本輸入和單個(gè) 15 秒音頻樣本來生成與原始說話者非常相似的自然語音。值得注意的是,一個(gè)只有 15 秒樣本的小型模型就能生成富有感情和逼真的聲音。
早在 2022 年底,OpenAI 便開發(fā)了 Voice Engine 并將其用于支持文本到語音 API 中的預(yù)設(shè)語音以及 ChatGPT 語音和朗讀。
今天,通過一些實(shí)際案例,OpenAI 分享了一些 Voice Engine 的早期應(yīng)用。
例如,使用 Voice Engine 幫助恢復(fù)一名因血管性腦腫瘤而失去流利語言能力的年輕患者的聲音。此外,Voice Engine 還可以被用來提供閱讀幫助、翻譯內(nèi)容、為不會(huì)說話的人群提供支持等。
1)通過聲音自然、富有感情的聲音為非閱讀者和兒童提供閱讀幫助
這些聲音代表了更廣泛的說話者,而不是預(yù)設(shè)的聲音。Age of Learning 是一家教育技術(shù)公司,該公司一直在使用 Voice Engine 生成預(yù)設(shè)的畫外音(
原文鏈接:OpenAI最新發(fā)布:只需15秒音頻,Voice Engine即可幫助失語者“重獲聲音”
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:AItists
作者簡(jiǎn)介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)