Whisper by OpenAI官網
Whisper是一個接近人類級別準確性的自動語音識別系統,具有魯棒性和多語言轉錄翻譯功能。
網站服務:文字轉語音,自動語音識別,語音識別,音頻AI,文字轉語音,自動語音識別,語音識別。
Whisper by OpenAI簡介
We’ve trained and are open-sourcing a neural net called Whisper that approaches human level robustness and accuracy on English speech?recognition.
什么是”Whisper by OpenAI”?
Whisper是一個自動語音識別(ASR)系統,經過訓練后可以接近人類級別的魯棒性和準確性。它使用了680,000小時的多語言和多任務監督數據進行訓練,可以提供更好的口音、背景噪音和技術語言的魯棒性。此外,它還可以進行多語言轉錄和從其他語言翻譯成英語。我們開源了模型和推理代碼,以便構建有用的應用程序和進行更深入的魯棒性語音處理研究。
“Whisper by OpenAI”有哪些功能?
1. 提供魯棒的語音識別功能,對口音、背景噪音和技術語言具有較高的識別準確性。
2. 支持多語言轉錄和從其他語言翻譯成英語的功能。
3. 使用簡單的端到端架構,基于編碼器-解碼器Transformer模型實現。
4. 輸入音頻被分割成30秒的片段,轉換為對數梅爾頻譜圖,并傳入編碼器進行處理。
5. 訓練解碼器以預測相應的文本標題,并與特殊標記交替使用,以指示單個模型執行語言識別、短語級時間戳、多語言語音轉錄和到英語的語音翻譯等任務。
應用場景:
1. 語音識別應用程序:可以用于構建語音助手、語音輸入工具等應用。
2. 多語言轉錄和翻譯應用程序:可以用于將其他語言的音頻轉錄成文本,并進行翻譯。
“Whisper by OpenAI”如何使用?
開發者可以使用Whisper的模型和推理代碼來構建語音識別和轉錄翻譯應用程序。詳細信息和使用方法請參考論文、模型卡片和代碼。
Whisper by OpenAI官網入口網址
https://openai.com/blog/whisper/
OpenI小編發現Whisper by OpenAI網站非常受用戶歡迎,請訪問Whisper by OpenAI網址入口試用。
數據評估
本站OpenI提供的Whisper by OpenAI都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2024年 4月 18日 上午3:38收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。