大模型時(shí)代的ASR就是不一樣!豆包“聽力”水平現(xiàn)場(chǎng)評(píng)測(cè),方言&小朋友口音直接拿捏!

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:大模型時(shí)代的ASR就是不一樣!豆包“聽力”水平現(xiàn)場(chǎng)評(píng)測(cè),方言&小朋友口音直接拿捏!
關(guān)鍵字:模型,報(bào)告,語音,上下文,團(tuán)隊(duì)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心發(fā)布
機(jī)器之心編輯部2024 火山引擎 AI 創(chuàng)新巡展上海站于近日舉辦,活動(dòng)展示了豆包大模型在綜合評(píng)分、語音識(shí)別等方面的效果提升,還發(fā)布了對(duì)話式 AI 實(shí)時(shí)交互解決方案。豆包大模型團(tuán)隊(duì)成果 Seed-ASR ,提供了語音識(shí)別能力支持。
Seed-ASR 是一款 ASR(自動(dòng)語音識(shí)別)成果。它能準(zhǔn)確轉(zhuǎn)錄各種語音信號(hào),識(shí)別不同語言、方言、口音。對(duì)于人名、生詞,Seed-ASR 也能結(jié)合文本語音等上下文,實(shí)現(xiàn)更準(zhǔn)確轉(zhuǎn)錄。該成果目前已被集成進(jìn)豆包 APP 、火山引擎相關(guān)服務(wù)模塊中。本文介紹了 Seed-ASR 技術(shù)亮點(diǎn)——高精度識(shí)別、大容量模型、支持多種語言、上下文感知、分階段訓(xùn)練方法。相關(guān)同學(xué)還分享了立項(xiàng)動(dòng)機(jī)、研發(fā)歷程及總結(jié)思考,展望了大模型 Scaling Laws 對(duì) ASR 技術(shù)的推動(dòng)和影響。8 月 21 日,2024 火山引擎 AI 創(chuàng)新巡展﹒上海站帶來了豆包大模型最新進(jìn)展。
公開及內(nèi)部測(cè)評(píng)集顯示,最新版本豆包大模型對(duì)比 5 月 15 日發(fā)布版本綜合能力提升 20.3% ,其中,角色扮演能力提升 38.3% ,語言理解能力提升 33.3% ,數(shù)學(xué)能力提升 13.5% 。根據(jù)
原文鏈接:大模型時(shí)代的ASR就是不一樣!豆包“聽力”水平現(xiàn)場(chǎng)評(píng)測(cè),方言&小朋友口音直接拿捏!
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:

粵公網(wǎng)安備 44011502001135號(hào)