FunASR 基礎(chǔ)語音識別工具包
FunASR是一個(gè)基礎(chǔ)語音識別工具包,提供多種功能,包括語音識別(ASR)、語音端點(diǎn)檢測(VAD)、標(biāo)點(diǎn)恢復(fù)、語言模型、說話人驗(yàn)證、說話人分離和多人對話語音識別等。FunASR提供了便...
標(biāo)簽:Ai開源項(xiàng)目 AI編程ai導(dǎo)航網(wǎng) AI開源項(xiàng)目 AI編程 FunASR基礎(chǔ)語音識別工具包FunASR 基礎(chǔ)語音識別工具包官網(wǎng)
FunASR是一個(gè)基礎(chǔ)語音識別工具包,提供多種功能,包括語音識別(ASR)、語音端點(diǎn)檢測(VAD)、標(biāo)點(diǎn)恢復(fù)、語言模型、說話人驗(yàn)證、說話人分離和多人對話語音識別等。FunASR提供了便捷的腳本和教程,支持預(yù)訓(xùn)練好的模型的推理與微調(diào)
網(wǎng)站服務(wù):AI開源項(xiàng)目,AI編程,AI開源項(xiàng)目,F(xiàn)unASR基礎(chǔ)語音識別工具包,AI導(dǎo)航網(wǎng)。

FunASR 基礎(chǔ)語音識別工具包簡介
FunASR希望在語音識別的學(xué)術(shù)研究和工業(yè)應(yīng)用之間架起一座橋梁。 通過發(fā)布工業(yè)級語音識別模型的訓(xùn)練和微調(diào),研究人員和開發(fā)人員可以更方便地進(jìn)行語音識別模型的研究和生產(chǎn),并推動(dòng)語音識別生態(tài)的發(fā)展。 讓語音識別更有趣!目前可以用cpu來部署,實(shí)測準(zhǔn)確率還可以
FunASR是一個(gè)基礎(chǔ)語音識別工具包,提供多種功能,包括語音識別(ASR)、語音端點(diǎn)檢測(VAD)、標(biāo)點(diǎn)恢復(fù)、語言模型、說話人驗(yàn)證、說話人分離和多人對話語音識別等。FunASR提供了便捷的腳本和教程,支持預(yù)訓(xùn)練好的模型的推理與微調(diào)。我們在ModelScope與huggingface上發(fā)布了大量開源數(shù)據(jù)集或者海量工業(yè)數(shù)據(jù)訓(xùn)練的模型,可以通過我們的模型倉庫了解模型的詳細(xì)信息。代表性的Paraformer非自回歸端到端語音識別模型具有高精度、高效率、便捷部署的優(yōu)點(diǎn),支持快速構(gòu)建語音識別服務(wù),詳細(xì)信息可以閱讀(服務(wù)部署文檔)。
最新動(dòng)態(tài)
2024/01/25: 中文離線文件轉(zhuǎn)寫服務(wù) 4.2、英文離線文件轉(zhuǎn)寫服務(wù) 1.3,優(yōu)化vad數(shù)據(jù)處理方式,大幅降低峰值內(nèi)存占用,內(nèi)存泄漏優(yōu)化;中文實(shí)時(shí)語音聽寫服務(wù) 1.7 發(fā)布,客戶端優(yōu)化;詳細(xì)信息參閱(部署文檔)2024/01/09: funasr社區(qū)軟件包windows 2.0版本發(fā)布,支持軟件包中文離線文件轉(zhuǎn)寫4.1、英文離線文件轉(zhuǎn)寫1.2、中文實(shí)時(shí)聽寫服務(wù)1.6的最新功能,詳細(xì)信息參閱(FunASR社區(qū)軟件包windows版本)網(wǎng)址https://www.modelscope.cn/models/iic/funasr-runtime-win-cpu-x64/summary2024/01/03: 中文離線文件轉(zhuǎn)寫服務(wù) 4.0 發(fā)布,新增支持8k模型、優(yōu)化時(shí)間戳不匹配問題及增加句子級別時(shí)間戳、優(yōu)化英文單詞fst熱詞效果、支持自動(dòng)化配置線程參數(shù),同時(shí)修復(fù)已知的crash問題及內(nèi)存泄漏問題,詳細(xì)信息參閱(部署文檔)2024/01/03: 中文實(shí)時(shí)語音聽寫服務(wù) 1.6 發(fā)布,2pass-offline模式支持Ngram語言模型解碼、wfst熱詞,同時(shí)修復(fù)已知的crash問題及內(nèi)存泄漏問題,詳細(xì)信息參閱(部署文檔)2024/01/03: 英文離線文件轉(zhuǎn)寫服務(wù) 1.2 發(fā)布,修復(fù)已知的crash問題及內(nèi)存泄漏問題,詳細(xì)信息參閱(部署文檔)2023/12/04: funasr社區(qū)軟件包windows 1.0版本發(fā)布,支持中文離線文件轉(zhuǎn)寫、英文離線文件轉(zhuǎn)寫、中文實(shí)時(shí)聽寫服務(wù),詳細(xì)信息參閱(FunASR社區(qū)軟件包windows版本)2023/11/08:中文離線文件轉(zhuǎn)寫服務(wù)3.0 CPU版本發(fā)布,新增標(biāo)點(diǎn)大模型、Ngram語言模型與wfst熱詞,詳細(xì)信息參閱(部署文檔)2023/10/17: 英文離線文件轉(zhuǎn)寫服務(wù)一鍵部署的CPU版本發(fā)布,詳細(xì)信息參閱(部署文檔)2023/10/13:?SlideSpeech: 一個(gè)大規(guī)模的多模態(tài)音視頻語料庫,主要是在線會議或者在線課程場景,包含了大量與發(fā)言人講話實(shí)時(shí)同步的幻燈片。2023.10.10:?Paraformer-long-Spk模型發(fā)布,支持在長語音識別的基礎(chǔ)上獲取每句話的說話人標(biāo)簽。2023.10.07:?FunCodec: FunCodec提供開源模型和訓(xùn)練工具,可以用于音頻離散編碼,以及基于離散編碼的語音識別、語音合成等任務(wù)。2023.09.01: 中文離線文件轉(zhuǎn)寫服務(wù)2.0 CPU版本發(fā)布,新增ffmpeg、時(shí)間戳與熱詞模型支持,詳細(xì)信息參閱(部署文檔)2023.08.07: 中文實(shí)時(shí)語音聽寫服務(wù)一鍵部署的CPU版本發(fā)布,詳細(xì)信息參閱(部署文檔)2023.07.17: BAT一種低延遲低內(nèi)存消耗的RNN-T模型發(fā)布,詳細(xì)信息參閱(BAT)2023.06.26: ASRU2023 多通道多方會議轉(zhuǎn)錄挑戰(zhàn)賽2.0完成競賽結(jié)果公布,詳細(xì)信息參閱(M2MeT2.0)122 閱讀全文
FunASR 基礎(chǔ)語音識別工具包官網(wǎng)入口網(wǎng)址
OpenI小編發(fā)現(xiàn)FunASR 基礎(chǔ)語音識別工具包網(wǎng)站非常受用戶歡迎,請?jiān)L問FunASR 基礎(chǔ)語音識別工具包網(wǎng)址入口試用。
數(shù)據(jù)評估
本站OpenI提供的FunASR 基礎(chǔ)語音識別工具包都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時(shí),對于該外部鏈接的指向,不由OpenI實(shí)際控制,在2024年 1月 26日 下午12:05收錄時(shí),該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。




粵公網(wǎng)安備 44011502001135號