成立半年就敢踢館 OpenAI ,首個(gè)開源模型不輸 GPT-4o,LeCun 、PyTorch 之父齊聲叫好!
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:成立半年就敢踢館 OpenAI ,首個(gè)開源模型不輸 GPT-4o,LeCun 、PyTorch 之父齊聲叫好!
關(guān)鍵字:模型,語(yǔ)音,華為,音頻,文本
文章來(lái)源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
整理 | 華衛(wèi)
想象一下,一個(gè) AI 模型可以表達(dá) 70 多種情緒,以不同的風(fēng)格說話,甚至令人信服地模仿口音。并且,它能夠同時(shí)處理兩個(gè)音頻流,同時(shí)聽和說。這不是科幻小說,而是 Kyutai 在語(yǔ)音 AI 技術(shù)上的最新突破。
只用短短 6 個(gè)月的時(shí)間,這個(gè)由 8 人組成的非營(yíng)利性 AI 研究實(shí)驗(yàn)室從零開發(fā)出了一種名為 “Moshi “的實(shí)時(shí)原生多模態(tài)基礎(chǔ) AI 模型。根據(jù) Kyutai 的說法,Moshi 是世界上首個(gè)具有自然對(duì)話能力的可公開訪問 AI 助手。OpenAI 之前曾展示過 GPT-4o 的語(yǔ)音引擎和語(yǔ)音模式功能,但尚未發(fā)布。
據(jù)稱,該模型具備的功能可與 OpenAI 的 GPT-4o 和 Google Astra 相媲美,但模型要小得多?!癕oshi 在說話時(shí)思考?!盞yutai 首席執(zhí)行官帕特里克·佩雷斯 (Patrick Pérez) 表示,Moshi 具有徹底改變?nèi)藱C(jī)通信的潛力。
7 月 4 日,Kyutai 在法國(guó)巴黎公開發(fā)布了 Moshi 的實(shí)驗(yàn)原型,用戶可以在網(wǎng)上測(cè)試體驗(yàn)(https://moshi.chat/?queue_id=talktomoshi)。值
原文鏈接:成立半年就敢踢館 OpenAI ,首個(gè)開源模型不輸 GPT-4o,LeCun 、PyTorch 之父齊聲叫好!
聯(lián)系作者
文章來(lái)源:AI前線
作者微信:ai-front
作者簡(jiǎn)介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。