AIGC動態歡迎閱讀
原標題:150萬條多語種音頻數據!浙大清華發布語音偽造檢測框架SafeEar,兼顧隱私保護|CCS 2024
關鍵字:語音,聲學,特征,音頻,模型
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:LRST
【新智元導讀】SafeEar是一種內容隱私保護的語音偽造檢測方法,其核心是設計基于神經音頻編解碼器的解耦模型,分離語音聲學與語義信息,僅利用聲學信息檢測,包括前端解耦模型、瓶頸層和混淆層、偽造檢測器、真實環境增強四部分。近年來,語音合成和語音轉換等技術取得快速發展,基于相關技術能夠合成逼真、自然的音頻。然而,攻擊者可利用該技術進行語音偽造,即「克隆」特定對象語音,為用戶隱私安全與社會穩定帶來嚴重威脅。
目前,已有較多基于卷積神經網絡、圖神經網絡等的偽造檢測方法取得了優越的檢測效果。但現有工作通常需要采用音頻波形或頻譜特征作為輸入,即需要訪問語音完整信息,在該過程中存在語音隱私泄露問題。同時,已有研究證實音色、響度等聲學特征在語音偽造檢測上的重要性[1,2],這為僅基于聲學特征進行深度偽造檢測帶來潛在可能。
針對此問題,浙江大學智能系統安全實驗室(USSLAB)與清華大合提出SafeEar,一種內容隱私保護的語音偽造檢測方法。論文地址:https://safeearweb.github.io/Project/files/SafeEar_CCS2024.pd
原文鏈接:150萬條多語種音頻數據!浙大清華發布語音偽造檢測框架SafeEar,兼顧隱私保護|CCS 2024
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...