標(biāo)簽:語音識(shí)別

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會(huì)員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業(yè)~AI生成影視解說,半個(gè)月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會(huì)還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì),然后抓住它。 接觸過很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...

Mobvoi MCP Server

Mobvoi MCP Server 是出門問問推出的一站式集成各項(xiàng) AI 能力的工具,Mobvoi MCP Server集成語音生成、聲音克隆、圖片驅(qū)動(dòng)數(shù)字人、視頻配音等多項(xiàng)多模態(tài) AI 能...
閱讀原文

Largo

Largo是基于AI技術(shù)加速影視內(nèi)容開發(fā)的創(chuàng)新平臺(tái)。平臺(tái)分析海量影視數(shù)據(jù)(包括超過40萬部電影和電視劇、95萬名演員、5.9萬個(gè)劇本等),為影視制作提供數(shù)據(jù)驅(qū)動(dòng)...
閱讀原文

CoGenAV

CoGenAV - 通義聯(lián)合深圳技術(shù)大學(xué)推出的多模態(tài)語音表征模型
閱讀原文

幻舟AI

幻舟AI是一站式AI短片創(chuàng)作平臺(tái),支持批量生成廣告片、宣傳片、動(dòng)畫片等。基于Midjourney、Runway等全球領(lǐng)先的AI模型,實(shí)現(xiàn)劇本創(chuàng)作、角色設(shè)計(jì)、分鏡生成及視...
閱讀原文

SOM AI

SOM AI 是 AI 輔助學(xué)術(shù)寫作工具,幫助學(xué)生輕松完成畢業(yè)論文(Skripsi)和學(xué)術(shù)研究。工具基于自然語言交互,提供研究主題頭腦風(fēng)暴、段落釋義、簡化復(fù)雜內(nèi)容等...
閱讀原文

Unmute

Unmute 是 Kyutai 推出的低延遲語音交互系統(tǒng),專注于低延遲語音轉(zhuǎn)文字(Speech-to-Text)和文字轉(zhuǎn)語音(Text-to-Speech)。Unmute 基于先進(jìn)的 AI 模型,為用...
閱讀原文

LLaDA-V

LLaDA-V是中國人民大學(xué)高瓴人工智能學(xué)院、螞蟻集團(tuán)推出的多模態(tài)大語言模型(MLLM),基于純擴(kuò)散模型架構(gòu),專注于視覺指令微調(diào)。模型在LLaDA的基礎(chǔ)上,引入視...
閱讀原文

Context7

Context7 是 Upstash 推出的AI工具,為大型語言模型(LLMs)和 AI 代碼編輯器提供最新、版本特定的文檔和代碼片段。通過解析文檔、豐富內(nèi)容、向量化和重新排...
閱讀原文

豆包·語音播客模型

豆包·語音播客模型是字節(jié)跳動(dòng)旗下火山引擎推出的語音播客模型。模型基于流式模型構(gòu)建,可將文本秒級(jí)轉(zhuǎn)化為雙人對(duì)話式播客,具有低成本、高時(shí)效、強(qiáng)互動(dòng)特點(diǎn)。...
閱讀原文

Notato

Notato 是AI筆記應(yīng)用,專為高效學(xué)習(xí)和工作設(shè)計(jì)。能將音頻、視頻、文檔或網(wǎng)頁鏈接快速轉(zhuǎn)換為清晰的筆記、總結(jié)、閃卡和測驗(yàn),幫助用戶輕松整理和復(fù)習(xí)關(guān)鍵信息。
閱讀原文

DICE-Talk

DICE-Talk是復(fù)旦大學(xué)聯(lián)合騰訊優(yōu)圖實(shí)驗(yàn)室推出的新穎情感化動(dòng)態(tài)肖像生成框架,支持生成具有生動(dòng)情感表達(dá)且保持身份一致性的動(dòng)態(tài)肖像視頻。DICE-Talk引入情感關(guān)...
閱讀原文

Speech-02

Speech-02 是 MiniMax 推出的新一代文本到語音(TTS)模型。模型基于回歸 Transformer 架構(gòu),實(shí)現(xiàn)零樣本語音克隆,僅需幾秒?yún)⒖颊Z音能生成高度相似的目標(biāo)語音...
閱讀原文

AI智能體

AI工具集收錄了最新最全的AI智能體工具,包括通用型AI Agent、AI編程、AI設(shè)計(jì)、AI數(shù)據(jù)分析、AI智能體開發(fā)等。
閱讀原文

Zoe

Zoe是百型智能推出的國內(nèi)首個(gè)外貿(mào)行業(yè)垂類Agent,AI外貿(mào)員。能根據(jù)企業(yè)設(shè)定的目標(biāo)自動(dòng)拆解工作流程,獨(dú)立完成外貿(mào)開發(fā)拓客的全鏈路操作,涵蓋市場分析、潛在...
閱讀原文

Chinese-LiPS

Chinese-LiPS 是智源研究院聯(lián)合南開大學(xué)共同打造的高質(zhì)量中文多模態(tài)語音識(shí)別數(shù)據(jù)集,包含100小時(shí)的語音、視頻和手動(dòng)轉(zhuǎn)錄文本,創(chuàng)新性地融合了唇讀視頻和演講...
閱讀原文
12315