用擴(kuò)散模型生成網(wǎng)絡(luò)參數(shù),LeCun點(diǎn)贊尤洋團(tuán)隊(duì)新研究
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:用擴(kuò)散模型生成網(wǎng)絡(luò)參數(shù),LeCun點(diǎn)贊尤洋團(tuán)隊(duì)新研究
關(guān)鍵字:模型,參數(shù),報(bào)告,神經(jīng)網(wǎng)絡(luò),噪聲
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):8698字
內(nèi)容摘要:
機(jī)器之心報(bào)道
機(jī)器之心編輯部如果你有被 Sora 生成的視頻震撼到,那你就已經(jīng)見識(shí)過擴(kuò)散模型在視覺生成方面的巨大潛力。當(dāng)然,擴(kuò)散模型的潛力并不止步于此,它在許多其它不同領(lǐng)域也有著讓人期待的應(yīng)用前景,更多案例可參閱機(jī)器之心不久前的報(bào)道《爆火Sora背后的技術(shù),一文綜述擴(kuò)散模型的最新發(fā)展方向》。
近日,來自新加坡國(guó)立大學(xué)的尤洋團(tuán)隊(duì)、加州大學(xué)伯克利分校、Meta AI Research 的一項(xiàng)新研究找到了擴(kuò)散模型的一個(gè)新應(yīng)用方向:用來生成神經(jīng)網(wǎng)絡(luò)的模型參數(shù)!論文地址:https://arxiv.org/pdf/2402.13144.pdf
項(xiàng)目地址:https://github.com/NUS-HPC-AI-Lab/Neural-Network-Diffusion
論文標(biāo)題:Neural Network Diffusion
這樣一來,似乎就可以使用現(xiàn)有的神經(jīng)網(wǎng)絡(luò)來輕松生成新的神經(jīng)網(wǎng)絡(luò)了!這一點(diǎn)讓 Yann LeCun 也忍不住點(diǎn)贊分享。不僅如此,生成的模型的性能表現(xiàn)甚至還能超越原始模型。擴(kuò)散模型的起源可以追溯到非平衡熱力學(xué)。2015 年時(shí),Jascha Sohl-Dickstein 等在論文
原文鏈接:用擴(kuò)散模型生成網(wǎng)絡(luò)參數(shù),LeCun點(diǎn)贊尤洋團(tuán)隊(duì)新研究
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)
相關(guān)文章
