DeepSeek是否利空算力?
長(zhǎng)遠(yuǎn)來(lái)看,算力才是真正的決勝因素。

原標(biāo)題:DeepSeek是否利空算力?
文章來(lái)源:智猩猩GenAI
內(nèi)容字?jǐn)?shù):3787字
DeepSeek V3與R1:開(kāi)源浪潮下的算力博弈
本文總結(jié)了關(guān)于DeepSeek V3和R1模型訓(xùn)練成本及開(kāi)源對(duì)算力市場(chǎng)影響的討論要點(diǎn),主要觀點(diǎn)是:開(kāi)源模型的崛起,特別是DeepSeek系列,正在重塑AI算力格局,并最終利好整個(gè)行業(yè)。
訓(xùn)練成本的:遠(yuǎn)超550萬(wàn)美元
網(wǎng)絡(luò)廣泛流傳的DeepSeek V3 550萬(wàn)美元訓(xùn)練成本,僅為其正式訓(xùn)練成本的冰山一角,未包含前期研究、實(shí)驗(yàn)等費(fèi)用。 幻方R1的訓(xùn)練成本更是遠(yuǎn)高于V3,這體現(xiàn)了前沿探索與后發(fā)追趕在算力需求上的巨大差異。
算力效率提升并非成本降低:而是更高效地攫取更大收益
算法進(jìn)步、算力通縮、模型蒸餾等技術(shù)提升了訓(xùn)練效率,但并未降低整體訓(xùn)練成本。相反,這使得模型訓(xùn)練者能夠利用更高的效率,榨取更多算力,以獲得更大的收益。 這解釋了為何即使在算力效率提升后,像幻方這樣的機(jī)構(gòu)仍在面臨算力不足的問(wèn)題。
開(kāi)源的勝利:閉源模型的挑戰(zhàn)
DeepSeek的開(kāi)源,代表著開(kāi)源模型對(duì)閉源模型的一次重大勝利。 這在國(guó)內(nèi)已有所體現(xiàn),一些未能趕上開(kāi)源模型步伐的閉源公司面臨倒閉或轉(zhuǎn)型。 未來(lái),如果閉源模型無(wú)法超越開(kāi)源模型的性能,其API價(jià)值將大幅下降。 然而,這也將導(dǎo)致模型訓(xùn)練參與者的減少。
推理成本的降低:應(yīng)用繁榮的引擎
DeepSeek V3在推理成本上的降低,比訓(xùn)練成本的降低更為顯著。其兼容性強(qiáng),支持多種類(lèi)型的GPU,這將促進(jìn)LLM應(yīng)用的繁榮,并最終拉動(dòng)更大的算力需求。 這與早期昂貴的推理成本形成鮮明對(duì)比。
北美算力投資的反思:從浪費(fèi)到繁榮
北美大型云服務(wù)提供商過(guò)去兩年投入巨資用于算力建設(shè),但其中一部分可能因早期探索而浪費(fèi)。 然而,開(kāi)源模型的繁榮最終將利好這些云服務(wù)提供商,因?yàn)樗懔π枨髮⑥D(zhuǎn)向推理,而非僅僅是訓(xùn)練。 這印證了“算力才是真正的決勝因素”的觀點(diǎn)。
未來(lái)展望:算力與應(yīng)用的雙重增長(zhǎng)
未來(lái),算力需求將主要來(lái)自推理,而非訓(xùn)練。 開(kāi)源模型的快速迭代和應(yīng)用生態(tài)的繁榮,將持續(xù)推動(dòng)算力需求的增長(zhǎng)。 這將形成一個(gè)良性循環(huán),驅(qū)動(dòng)整個(gè)AI行業(yè)的進(jìn)一步發(fā)展。
聯(lián)系作者
文章來(lái)源:智猩猩GenAI
作者微信:
作者簡(jiǎn)介:智猩猩旗下賬號(hào),專(zhuān)注于生成式人工智能,主要分享技術(shù)文章、論文成果與產(chǎn)品信息。

粵公網(wǎng)安備 44011502001135號(hào)