AI基礎(chǔ)設(shè)施:在大模型成長(zhǎng)放緩的時(shí)代,仍然值得投資的黃金機(jī)會(huì)!
AI Infra 格局呈現(xiàn)兩個(gè)極端:海外被巨頭壟斷,而國(guó)內(nèi)則過(guò)于分散。
原標(biāo)題:當(dāng)大模型升級(jí)速度變緩,AI Infra 還是一門「好生意」嗎?
文章來(lái)源:智猩猩GenAI
內(nèi)容字?jǐn)?shù):11155字
2024中國(guó)生成式AI大會(huì)即將召開(kāi)
2024中國(guó)生成式AI大會(huì)將于12月5-6日在上海舉辦,屆時(shí)將有20多位嘉賓參與演講。嘉賓包括來(lái)自上海交大的副教授戴國(guó)浩、GMI Cloud亞太區(qū)總裁King.Cui等知名業(yè)內(nèi)人士,討論AI基礎(chǔ)設(shè)施(AI Infra)的現(xiàn)狀與未來(lái)發(fā)展。
國(guó)內(nèi)AI Infra市場(chǎng)現(xiàn)狀
目前,國(guó)內(nèi)AI Infra市場(chǎng)呈現(xiàn)出分散化的特點(diǎn),與海外市場(chǎng)的巨頭壟斷形成鮮明對(duì)比。清華系在中國(guó)大模型創(chuàng)業(yè)中占據(jù)重要地位,多個(gè)創(chuàng)企如清昴智能、無(wú)問(wèn)芯穹等均來(lái)自清華實(shí)驗(yàn)室。當(dāng)前的創(chuàng)業(yè)重點(diǎn)在于將各類模型與芯片進(jìn)行深度適配,以減少算力資源閑置并降低成本。
推理成本與MaaS平臺(tái)挑戰(zhàn)
推理成本的降低是大模型應(yīng)用落地的關(guān)鍵。盡管創(chuàng)業(yè)公司紛紛布局MaaS(模型即服務(wù))平臺(tái),但行業(yè)內(nèi)對(duì)這一模式存在分歧。一些創(chuàng)業(yè)者擔(dān)心與大型大模型公司競(jìng)爭(zhēng)的壓力,認(rèn)為不做優(yōu)質(zhì)大模型將難以在推理平臺(tái)上立足。
端側(cè)推理的未來(lái)
隨著需求的增長(zhǎng),端側(cè)大模型推理處理器的開(kāi)發(fā)逐漸受到關(guān)注。無(wú)問(wèn)芯穹計(jì)劃推出端側(cè)大模型推理處理器,預(yù)計(jì)將在明年實(shí)現(xiàn)落地。這表明,端側(cè)硬件在未來(lái)將扮演重要角色。
國(guó)內(nèi)外市場(chǎng)的不同挑戰(zhàn)
中美市場(chǎng)的差異使得創(chuàng)業(yè)的難度不同。雖然海外市場(chǎng)相對(duì)成熟,但也因巨頭的存在而導(dǎo)致必要性不強(qiáng)。國(guó)內(nèi)芯片廠商則處于分散狀態(tài),面臨技術(shù)統(tǒng)一和生態(tài)建設(shè)的挑戰(zhàn)。
未來(lái)展望與結(jié)論
隨著AI Infra創(chuàng)業(yè)的不斷探索,業(yè)內(nèi)觀點(diǎn)碰撞加劇。無(wú)論是MaaS平臺(tái)的競(jìng)爭(zhēng),還是異構(gòu)混訓(xùn)的可行性,各家企業(yè)都在努力尋找商機(jī)。總體來(lái)看,AI Infra的重要性日益凸顯,國(guó)產(chǎn)算力問(wèn)題仍是未來(lái)發(fā)展的關(guān)鍵。
聯(lián)系作者
文章來(lái)源:智猩猩GenAI
作者微信:
作者簡(jiǎn)介:智猩猩旗下矩陣賬號(hào)之一,聚焦大模型開(kāi)啟的通用人工智能浪潮。