大模型商用格局雛形初現(xiàn):Tokens用量決高下,火山引擎問(wèn)鼎2024
單日萬(wàn)億商用Tokens消耗,大模型落地開(kāi)始規(guī)模化
原標(biāo)題:大模型商用格局雛形初現(xiàn):Tokens用量決高下,火山引擎問(wèn)鼎2024
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):7415字
大模型應(yīng)用落地:Tokens消耗量成為關(guān)鍵指標(biāo)
量子位最新文章指出,2024年下半年,國(guó)內(nèi)大模型商用落地日均Tokens消耗量暴增,從1000億級(jí)躍升至10000億級(jí),月復(fù)合增長(zhǎng)率達(dá)到45%。這標(biāo)志著大模型應(yīng)用進(jìn)入大規(guī)模商用落地階段,生產(chǎn)力釋放的同時(shí)也帶來(lái)了巨大的商業(yè)機(jī)遇。
1. Tokens消耗量:衡量大模型應(yīng)用落地的關(guān)鍵指標(biāo)
文章強(qiáng)調(diào),Tokens作為大模型理解和生成的最小單位,已成為衡量大模型能力和商業(yè)價(jià)值的關(guān)鍵指標(biāo)。它可以反映模型預(yù)訓(xùn)練規(guī)模、理解能力、推理算力,甚至直接用于API定價(jià)。目前,云廠商已將日均Tokens消耗量作為衡量自身大模型服務(wù)能力的重要指標(biāo)。
2. 火山引擎領(lǐng)跑Tokens消耗量增長(zhǎng)
數(shù)據(jù)顯示,火山引擎在Tokens消耗量增長(zhǎng)方面表現(xiàn)突出,月均復(fù)合增長(zhǎng)率超過(guò)60%,12月日均Tokens市場(chǎng)份額占比超過(guò)50%,遠(yuǎn)超其他廠商。其自研模型豆包,日均Tokens使用量更是超過(guò)4萬(wàn)億,七個(gè)月增長(zhǎng)33倍,并以5998萬(wàn)月活位居全球AI原生應(yīng)用月活榜第二。
3. AI原生應(yīng)用爆發(fā)驅(qū)動(dòng)Tokens消耗量增長(zhǎng)
Tokens消耗量暴增的核心驅(qū)動(dòng)力是AI原生應(yīng)用的爆發(fā)式增長(zhǎng)。2024年1月至10月,中國(guó)AI原生應(yīng)用累計(jì)下載量已達(dá)1.8億。RAG、智能體、多模態(tài)技術(shù)的興起,進(jìn)一步拓寬了大模型應(yīng)用場(chǎng)景,加速了整體增長(zhǎng)。
4. 大模型落地周期縮短,成本下降,加速市場(chǎng)增長(zhǎng)
文章指出,大模型落地周期縮短至6-18個(gè)月,且成本持續(xù)下降,使得千行百業(yè)對(duì)大模型的需求日益強(qiáng)烈。互聯(lián)網(wǎng)、金融、智能終端、游戲等領(lǐng)域已開(kāi)始規(guī)模化應(yīng)用,進(jìn)一步推動(dòng)了Tokens消耗量的增長(zhǎng)。
5. 未來(lái)展望:Tokens消耗量持續(xù)增長(zhǎng),MaaS市場(chǎng)潛力巨大
文章預(yù)測(cè),Tokens成本將進(jìn)一步下降,規(guī)模化增長(zhǎng)遠(yuǎn)未到達(dá)瓶頸。大模型訓(xùn)練成本增速放緩,算力提升以及云廠商模式優(yōu)化,都將為未來(lái)持續(xù)增長(zhǎng)提供支撐。火山引擎預(yù)測(cè),2027年豆包每天Token消耗量將超過(guò)100萬(wàn)億。MaaS市場(chǎng)也將呈現(xiàn)Agent加速應(yīng)用、大小模型協(xié)同、工具鏈生態(tài)完善以及混合云部署模式等特點(diǎn)。
6. 總結(jié):Tokens消耗量是觀察大模型商用落地的重要窗口
通過(guò)分析Tokens消耗量,我們可以清晰地看到大模型應(yīng)用落地的趨勢(shì)和各廠商的競(jìng)爭(zhēng)態(tài)勢(shì)。目前大模型正處于起跑階段,未來(lái)發(fā)展?jié)摿薮螅l(shuí)能成為引領(lǐng)者,值得持續(xù)關(guān)注。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破