小米新一代Kaldi團(tuán)隊(duì)論文解讀:新型自動(dòng)語音識(shí)別 (ASR) 模型Zipformer誕生之路|ICLR 2024 Oral
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:小米新一代Kaldi團(tuán)隊(duì)論文解讀:新型自動(dòng)語音識(shí)別 (ASR) 模型Zipformer誕生之路|ICLR 2024 Oral
關(guān)鍵字:小米,模型,解讀,模塊,參數(shù)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):24168字
內(nèi)容摘要:
機(jī)器之心專欄
作者:新一代 Kaldi 團(tuán)隊(duì)近日,小米集團(tuán)新一代 Kaldi 團(tuán)隊(duì)關(guān)于語音識(shí)別聲學(xué)模型的論文《Zipformer: A faster and better encoder for automatic speech recognition》被 ICLR 2024 接收為 Oral (Top 1.2%)。論文鏈接:https://arxiv.org/pdf/2310.11230.pdf
代碼鏈接:https://github.com/k2-fsa/icefall/tree/master/egs/librispeech/ASR/zipformer
團(tuán)隊(duì)介紹
新一代 Kaldi 團(tuán)隊(duì)是由 Kaldi 之父、IEEE fellow、小米集團(tuán)首席語音科學(xué)家 Daniel Povey 領(lǐng)銜的團(tuán)隊(duì),專注于開源語音基礎(chǔ)引擎研發(fā),從神經(jīng)網(wǎng)絡(luò)聲學(xué)編碼器、損失函數(shù)、優(yōu)化器和解碼器等各方面重構(gòu)語音技術(shù)鏈路,旨在提高智能語音任務(wù)的準(zhǔn)確率和效率。
目前,新一代 Kaldi 項(xiàng)目主要由四個(gè)子項(xiàng)目構(gòu)成:核心算法庫 k2、通用語音數(shù)據(jù)處理工具包 Lhotse、解決方案集合 Icefall 以及服務(wù)端引擎
原文鏈接:小米新一代Kaldi團(tuán)隊(duì)論文解讀:新型自動(dòng)語音識(shí)別 (ASR) 模型Zipformer誕生之路|ICLR 2024 Oral
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)
相關(guān)文章
