Voice Engine是OpenAI推出的一項(xiàng)創(chuàng)新AI語(yǔ)音合成和聲音克隆技術(shù),能夠通過(guò)15秒的簡(jiǎn)短音頻樣本和文本輸入,生成與原聲相似的自然語(yǔ)音。這項(xiàng)技術(shù)自2022年底開(kāi)發(fā)以來(lái),已被集成到OpenAI的文本到語(yǔ)音API和ChatGPT的語(yǔ)音功能中,展現(xiàn)出廣泛的應(yīng)用潛力。
Voice Engine是什么
Voice Engine是OpenAI最新發(fā)布的一項(xiàng)AI語(yǔ)音合成和聲音克隆技術(shù)。該技術(shù)能夠利用15秒的音頻樣本和相應(yīng)的文本輸入,生成自然且接近真實(shí)聲音的語(yǔ)音。自2022年底開(kāi)發(fā)以來(lái),Voice Engine已經(jīng)被成功應(yīng)用于OpenAI的文本到語(yǔ)音API和ChatGPT的語(yǔ)音功能中。其應(yīng)用前景廣泛,包括為兒童和閱讀困難者提供閱讀輔助、翻譯內(nèi)容以觸達(dá)全球受眾、支持溝通障礙者以及幫助恢復(fù)患者的聲音等。為確保技術(shù)的安全使用,OpenAI制定了嚴(yán)格的使用政策,并采取了包括水印追蹤在內(nèi)的多項(xiàng)安全措施,以防止聲音冒充的發(fā)生。
官方博客介紹:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices
Voice Engine的主要功能
- 高質(zhì)量語(yǔ)音合成:使用簡(jiǎn)短音頻樣本生成自然流暢的語(yǔ)音,滿足多種應(yīng)用需求。
- 多語(yǔ)言支持:可將內(nèi)容翻譯成多種語(yǔ)言,保持原有說(shuō)話者的口音和風(fēng)格。
- 個(gè)性化交互:結(jié)合GPT-4,提供實(shí)時(shí)、個(gè)性化的互動(dòng)響應(yīng),提升用戶體驗(yàn)。
- 安全措施:通過(guò)水印追蹤等技術(shù)防止濫用,確保用戶隱私和安全。
應(yīng)用場(chǎng)景
- 教育與閱讀輔助:Voice Engine為兒童和閱讀困難者提供自然的語(yǔ)音支持,幫助他們更好地理解書(shū)面內(nèi)容。例如,教育科技公司Age of Learning利用這一技術(shù)為學(xué)生提供個(gè)性化的學(xué)習(xí)體驗(yàn)。
- 內(nèi)容翻譯與全球化:通過(guò)Voice Engine,視頻和播客等內(nèi)容可以翻譯成觀眾的母語(yǔ),同時(shí)保持原說(shuō)話者的口音,使創(chuàng)作者能夠更自然地觸及全球受眾。例如,AI視覺(jué)敘事平臺(tái)HeyGen使用Voice Engine進(jìn)行視頻翻譯,打破語(yǔ)言障礙。
- 改善偏遠(yuǎn)地區(qū)的服務(wù)提供:Voice Engine通過(guò)提供本地語(yǔ)言服務(wù),提升偏遠(yuǎn)社區(qū)的基本服務(wù)質(zhì)量,如健康咨詢等。Dimagi公司正在開(kāi)發(fā)工具,利用Voice Engine和GPT-4為社區(qū)衛(wèi)生工作者提供互動(dòng)反饋。
- 支持言語(yǔ)殘障人士:Voice Engine為有交流障礙的個(gè)體提供獨(dú)特且自然的聲音,使他們能夠通過(guò)增強(qiáng)和替代通訊設(shè)備進(jìn)行交流。例如,Livox公司利用這一技術(shù)為用戶提供多種語(yǔ)言的自然語(yǔ)音。
- 患者聲音恢復(fù):Voice Engine幫助因疾病或神經(jīng)問(wèn)題失去語(yǔ)言能力的患者重建聲音。例如,Norman Prince Neurosciences Institute正在研究如何使用Voice Engine幫助因腫瘤或神經(jīng)問(wèn)題導(dǎo)致語(yǔ)言障礙的患者。
常見(jiàn)問(wèn)題
Voice Engine目前對(duì)公眾開(kāi)放嗎?
Voice Engine目前仍處于小規(guī)模預(yù)覽階段,尚未廣泛發(fā)布。OpenAI正在與部分可信賴的合作伙伴進(jìn)行私下測(cè)試,以了解其途。
如何確保Voice Engine的安全使用?
OpenAI已制定嚴(yán)格的使用政策并采取多項(xiàng)安全措施,如水印追蹤,以防止技術(shù)的濫用和聲音冒充。
未來(lái)Voice Engine會(huì)面向更多用戶嗎?
OpenAI可能會(huì)根據(jù)小規(guī)模測(cè)試的結(jié)果和社會(huì)需求,決定是否將Voice Engine推廣給更廣泛的用戶群體。
如何使用Voice Engine
目前,Voice Engine尚未向公眾開(kāi)放在線使用。OpenAI采取謹(jǐn)慎態(tài)度,以確保在推廣技術(shù)的同時(shí)充分考慮潛在風(fēng)險(xiǎn)。未來(lái),OpenAI可能會(huì)根據(jù)測(cè)試結(jié)果和社會(huì)發(fā)展需求,決定是否讓更多用戶使用Voice Engine。


粵公網(wǎng)安備 44011502001135號(hào)