深度神經(jīng)網(wǎng)絡(luò)作為拓?fù)淞孔由窠?jīng)網(wǎng)絡(luò)的半經(jīng)典極限:泛化問題
AIGC動態(tài)歡迎閱讀
原標(biāo)題:深度神經(jīng)網(wǎng)絡(luò)作為拓?fù)?/a>量子神經(jīng)網(wǎng)絡(luò)的半經(jīng)典極限:泛化問題
關(guān)鍵字:報(bào)告,神經(jīng)網(wǎng)絡(luò),人工智能,拓?fù)?量子
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):4970字
內(nèi)容摘要:
來源:CreateAMind
摘要:
深度神經(jīng)網(wǎng)絡(luò)缺少其運(yùn)行的原則模型。最近探索了一種基于拓?fù)淞孔訄稣摰谋O(jiān)督學(xué)習(xí)新框架,該框架看起來特別適合在量子處理器上實(shí)現(xiàn)。我們建議使用該框架來理解深度神經(jīng)網(wǎng)絡(luò)中的泛化問題。更具體地說,在這種方法中,深度神經(jīng)網(wǎng)絡(luò)被視為拓?fù)淞孔由窠?jīng)網(wǎng)絡(luò)的半經(jīng)典極限。這種框架可以輕松解釋深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練步驟中的過度擬合行為以及相應(yīng)的泛化能力。簡介:
深度神經(jīng)網(wǎng)絡(luò)(DNNs),即具有幾個隱藏層的神經(jīng)網(wǎng)絡(luò),由于它們在從分子設(shè)計(jì)[1]和社會經(jīng)濟(jì)預(yù)測[2]到機(jī)器翻譯[3]和近似偏微分算子[4]的各種學(xué)習(xí)任務(wù)中的成功而變得流行。然而,我們對這項(xiàng)技術(shù)的基本理解卻遠(yuǎn)遠(yuǎn)落后。DNNs在很大程度上被認(rèn)為是“黑箱”系統(tǒng),
一方面,它們?nèi)鄙倨洳僮鞯脑瓌t模型,另一方面,DNNs的內(nèi)部操作不容易被人類讀出。
第一個問題主要與我們對dnn如何實(shí)現(xiàn)這些泛化能力的有限理解有關(guān),這些泛化能力使我們能夠聲明它們能夠?qū)W習(xí)(無論“學(xué)習(xí)”在這里是什么意思),
而第二個問題與解釋非線性加權(quán)模型的操作行為的困難有關(guān),該模型在成千上萬的輸入上訓(xùn)練,對網(wǎng)絡(luò)的最終配置做出微觀貢獻(xiàn)。這些問題共同構(gòu)成了實(shí)現(xiàn)公平、負(fù)責(zé)和透明
原文鏈接:深度神經(jīng)網(wǎng)絡(luò)作為拓?fù)淞孔由窠?jīng)網(wǎng)絡(luò)的半經(jīng)典極限:泛化問題
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:AItists
作者簡介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)