月虧4億 vs 毛利545%:MaaS商業(yè)模式的羅生門|甲子光年
DeepSeek很強(qiáng),但作業(yè)難抄。
原標(biāo)題:月虧4億 vs 毛利545%:MaaS商業(yè)模式的羅生門|甲子光年
文章來(lái)源:甲子光年
內(nèi)容字?jǐn)?shù):14572字
DeepSeek引發(fā)的MaaS商業(yè)模式大討論
本文探討了圍繞DeepSeek大模型引發(fā)的MaaS(模型即服務(wù))商業(yè)模式的爭(zhēng)議,并試圖理清各方觀點(diǎn)的合理性。
1. MaaS模式的本質(zhì)與演變
MaaS是云計(jì)算產(chǎn)業(yè)鏈的新生態(tài),分為兩類:一類是像智譜、阿里云這樣的大模型公司或云廠商,自研大模型并提供服務(wù);另一類是像潞晨科技、硅基流動(dòng)這樣,提供第三方開源模型的MaaS服務(wù),即“AI推理云服務(wù)”。開源模型的出現(xiàn),降低了大模型服務(wù)的準(zhǔn)入門檻,激發(fā)了AI推理云服務(wù)的興起,也使得大模型token價(jià)格有下降空間。
2. DeepSeek:高性能與高門檻
DeepSeek大模型性能強(qiáng)勁,但其商業(yè)模式的盈利能力卻引發(fā)爭(zhēng)議。潞晨科技創(chuàng)始人尤洋認(rèn)為,基于token計(jì)費(fèi)的MaaS模式在現(xiàn)有算力成本下難以盈利,甚至可能月虧損4億。硅基流動(dòng)創(chuàng)始人袁進(jìn)輝則反駁,認(rèn)為尤洋的成本估算過(guò)于夸張,并指出DeepSeek官方公布的基于“MLA+DeepSeek MoE+專家并行”架構(gòu)的部署策略,成本利潤(rùn)率高達(dá)545%。
爭(zhēng)議的核心在于DeepSeek的推理效率。尤洋的計(jì)算基于較低的token生成速度,而DeepSeek官方及其他廠商的數(shù)據(jù)顯示,通過(guò)優(yōu)化,吞吐率可提升數(shù)倍甚至十倍以上,從而大幅降低成本,實(shí)現(xiàn)盈利。然而,DeepSeek的高效部署策略并非易于復(fù)制,其獨(dú)特的架構(gòu)和軟硬件協(xié)同優(yōu)化能力是關(guān)鍵。
3. DeepSeek MoE架構(gòu)與技術(shù)挑戰(zhàn)
DeepSeek采用MoE(混合專家)模型和專家并行策略,這與主流的Dense模型和張量并行策略不同。MoE模型通過(guò)激活特定專家來(lái)處理任務(wù),提高效率,但需要復(fù)雜的部署和優(yōu)化。DeepSeek的部署方案需要至少320張GPU卡,對(duì)資源和技術(shù)能力要求極高,這使得其他廠商難以復(fù)現(xiàn)其低成本高效率的模式。業(yè)內(nèi)專家認(rèn)為,DeepSeek的MoE架構(gòu)更適合大廠或在C端有野心的公司。
4. 成本降低的兩種途徑:工程優(yōu)化與架構(gòu)創(chuàng)新
大模型成本降低主要依靠工程優(yōu)化和架構(gòu)創(chuàng)新。DeepSeek的“MLA+DeepSeek MoE+專家并行”架構(gòu)是工程優(yōu)化的典范,而其他公司如月之暗面也在工程優(yōu)化方面取得了顯著成果。與此同時(shí),對(duì)注意力機(jī)制的改進(jìn),如DeepSeek的MLA和月之暗面的MoBA,以及硬件層面的創(chuàng)新,也推動(dòng)了成本下降。
5. 結(jié)論:兩種觀點(diǎn)的融合
尤洋和袁進(jìn)輝的觀點(diǎn)并非完全對(duì)立。尤洋強(qiáng)調(diào)當(dāng)前技術(shù)水平的限制,而袁進(jìn)輝則著眼于未來(lái)的技術(shù)可能性。DeepSeek的成功表明,通過(guò)極致的工程優(yōu)化和架構(gòu)創(chuàng)新,MaaS模式是可行的,但對(duì)于大多數(shù)廠商而言,這仍然是一個(gè)高門檻的挑戰(zhàn)。DeepSeek的成功,也為AI普惠時(shí)代開啟了新的可能性。
聯(lián)系作者
文章來(lái)源:甲子光年
作者微信:
作者簡(jiǎn)介:甲子光年是一家科技智庫(kù),包含智庫(kù)、社群、企業(yè)服務(wù)版塊,立足中國(guó)科技創(chuàng)新前沿陣地,動(dòng)態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級(jí)案例,推動(dòng)人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。