国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

LSTM之父:我也是注意力之父!1991年就發表線性復雜度,遙遙領先Transformer 26年

AIGC動態1年前 (2024)發布 新智元
431 0 0

新智元報道編輯:LRS【新智元導讀】Transformer模型自2017年問世以來,已成為AI領域的核心技術,尤其在自然語言處理中占據主導地位。然而,關于其核心機制“注意力”的起源,學界存在爭議,一些學者如Jürgen Schmidhuber主張自己更早提出了相關概念。當今AI屆的繁榮,很大程度上要歸功于Transformer模型,2017年的開山之作,把「注意力機制」(attention)帶入了大眾的視野,此后七年中,在AI模型中占據了絕對的主導地位,甚至Attention is All You Need這個名字都讓之后的論文在起標題時紛紛效仿,逐漸走向狂野。但「正統」注意力機制其實來源于2014年Bengio的論文,ACM還在圖靈獎頒獎時,為Bengio寫的貢獻為「引入了一種注意力機制,帶來了機器翻譯的突破,并形成了深度學習順序處理的關鍵組成部分」。論文鏈接:https://arxiv.org/pdf/1409.0473最近,Andrej Karpathy在社交媒體上公開了與第一作者Dzmitry兩年前的聯絡郵件,詳細敘述了這段發明注意力的故事,頓時又掀起網友熱議。不過,LSTM作者Jürgen Schmidhuber卻不認可這段故事,而是表明自己才是真正的創造者,1991年就已經提出線性復雜度Transformer,并且在兩年后提出術語「注意力」,他在2023年12月還發表過一篇報告,控訴圖靈獎三巨頭抄襲自己的研究成果。關于「Attention起源」的辯論進展火熱,仿佛現代AI完全構建在注意力機制的理論之上,關于Transformer、系統實現的重要性卻被忽視了。雖然Attention is All You Need論文的核心貢獻是引入Transformer神經網絡,刪除了除各種注意力機制之外的所有模塊,并且基本上只是將其與多層感知機堆疊在ResNe中,但其實論文中還是有相當多的貢獻和獨特想法,包括位置編碼、縮放注意力、多頭注意力、極簡設計等等,并且被廣為接受。即便是到了今天,業內普遍使用的模型架構仍然大體遵循2017年的原始版本,只是在部分模塊進行了簡單的修改,比如更好的位置編碼方案(RoPE家族)等等。谷歌杰出科學家、計算成像、機器學習和視覺領域的專家Peyman Milanfar說的很中肯:我——或者我認為任何成像領域的人——都不能合理地宣稱機器學習背景下的注意力概念有任何功勞。但記錄、追溯完整的歷史淵源是有價值的,如果不從更廣泛的角度來理解「依賴于數據的加權平均運算」的重要性和普遍性,那追溯的歷史也是不完整的。最極端的例子莫過于一位網友的評價,「其實,算術的出現要比這些論文都早。」「注意力」的起源故事2014年,故事的主角Dzmitry Bahdanau還只是一個在德國雅各布大學(Jakobs University)剛完成碩士一年級的學生,之后選擇在Yoshua Bengio(圖靈獎得主)的實驗室開始實習。當時他跟Yoshua表示干什么都行,然后Yoshua便讓他開始與Kyunghyun Cho的團隊合作開發機器翻譯模型。當時自然語言處理屆的主流思路是「把單詞序列轉為一個向量」,比如經典的word2vec都是當時常用的算法,但Dzmitry卻對這種想法表示懷疑,不過為了獲得博士的入學offer,他也只能聽從導師的話,從寫代碼、修復Bug等最基本的工作入手。逐步熟悉團隊的工作內容之后,Yoshua就對他發起了攻讀博士學位的邀請,當時AI屆還沒有現在這么卷,這些工作已經足以讓這位碩士生開始他的博士生涯了,Dzmitry至今仍表示慶幸、懷念。博士offer穩了之后,據Dzmitry的說法是,可以享受科研樂趣,并充分發揮自己的創造力了!Dzmitry開始思考如何避免RNN模型中Encoder和Decoder之間的信息瓶頸,第一個想法是建立一個帶有兩個「光標」(cursor)的模型:其中一個由BiRNN編碼,在源序列中移動;另一個在目標序列中移動;光標軌跡使用動態規劃進行邊際化。但Kyunghyun Cho認為這種做法和Alex Graves的RNN Transducer模型沒什么兩樣。讀完Graves的手寫識別論文后,Dzmitry也認可這種方法法對于機器翻譯來說不太合適,并且實習也只剩5周了,很難在短時間內完成代碼實現,所以就嘗試了更簡單的方法,讓兩個光標同時、同步移動,實際上相當于硬編碼的對角注意力(hard-coded diagonal attention)。這種方法雖說有點效果,但不夠優雅。某一天,Dzmitry受到了英語翻譯練習中的啟發,人類在翻譯時,目光會在源序列和目標序列之間來回移動,將軟搜索表示為softmax,然后對BiRNN狀態進行加權平均,就能讓Decorder RNN學會在源序列中搜索放置光標的位置。團隊把這個架構叫做RNNSearch,第一次嘗試效果就很好,只需要1個GPU就能運行。當時,谷歌的Ilya(OpenAI前首席科學家Ilya Sutskever)團隊使用8個GPU的LSTM模型在某些指標上仍然領先,所以團隊趕緊在ArXiV上發表了一篇論文。后來團隊發現,這個架構的名字其實并不好,Yoshua在最后的一次修改中確定了「注意力機制」,直觀地看,讓解碼器來決定源語句中的哪些部分需要受到關注,減輕了編碼器將源語句中的所有信息編碼為固定長度向量的負擔。通過這種新方法,信息可以分布在整個標注序列中,解碼器可以有選擇地進行檢索。一個半月后,團隊又看了Alex Graves發表的關于NMT論文,想法完全相同,但出發點完全不同。Dzmitry發明新算法是需求驅動的,Alex那邊或許是出于連接神經學派和符號學派的目的;Jason Weston團隊的Memory Networks論文也有類似的機制。Dzmitry表示沒有預見到注意力機制作為表征學習的核心算法,其實可以在更低的層次上使用。所以當Transformer論文發表時,Dzmitry就立刻跟實驗室的同事說,RNN已經死了。總之,在蒙特利爾Yoshua的實驗室中「可微且數據依賴的加權平均」(differentiable and data-dependent weighted average operation)的發明與神經圖靈機、Memory Networks以及90年代(甚至 70 年代)的一些相關認知科學論文無關,主要來源于Yoshua的領導,Kyunghyun Cho在管理由初級博士生和實習生組成的大型機器翻譯項目方面的出色技能,以及Dzmitry多年來在編程競賽中磨練出的創造力和編程技能。即使Dzmitry、Alex Graves和其他人當時沒有從事深度學習工作,這個想法也會由其他人發表出來。注意力機制只是深度學習中實現靈活空間連接的自然方式,只要GPU的運算速度足夠快,讓科研人員有動力并認真對待深度學習,就會自然而然出現。良好的研發工作可以為基礎技術的進步做出更多貢獻,而不是通常意義上、所謂「真正的」人工智能研究的花哨理論。九十年代的「注意力」機制正如Dzmitry所說,注意力機制其實就是模仿大腦的認知過程,在更遙遠的90年代,也是認知科學快速發展的時代,類似注意力機制的模型也早有研究。最早的「可微加權平均操作」甚至并不來源于機器學習領域,而是圖像處理中常用的「濾波器」(filter)。比如最著名的是1998年Tomasi和Manduchi的雙邊濾波器,以及1997年Smith和Brady提出的SUSAN濾波器;后面還出現過許多變體形式,包括2005年的Buades、Coll和Morel提出的非局部均值,以及2007年Peyman Milanfar提出的更通用的核回歸濾波器。論文鏈接:https://ieeexplore.ieee.org/abstract/document/4060955阿卜杜拉科技大學 (KAUST) 人工智能研究所所長、瑞士人工智能實驗室IDSIA科學主任、LSTM作者、現代人工智能之父Jürgen Schmidhube也參與到這場大戰之中。2023年12月,Jürgen就曾發布過一篇報告,控訴三位圖靈獎得主Bengio, Hinton和LeCun各有相關工作參考于他之前的工作,但并沒有標注引用,「抄襲」罪狀中,Bengio七條、Hinton六條、LeCun四條。報告鏈接:https://people.idsia.ch/~juergen/ai-priority-disputes.htmlJürgen在報告中指出,1991年3月,他就已經提出了所謂的具有「線性自注意力」的非歸一化線性Transformer(unnormalized linear Transformer with linearized self-attention),只不過當時的名字叫做「快速權重編程器」(Fast Weight Programmers)和「快速權重控制器」(Fast Weight Controllers),類似傳統計算機將存儲和控制分開的方式,以端到端可微分、自適應、完全神經的方法,只不過當時Key/Value被稱為From/To雖然名字不一樣,但兩個模型背后的數學原理大致相同。1991年發表的模型原理類似于:為了回答接收到的query,通過梯度下降來學習生成key和value的模式,對自身的某些部分進行重新編程,從而根據上下文將注意力引導到重要的事情上;現代Transformer也采用了同樣的原理。2021年,Jürgen在ICML上發表了一篇論文,進一步證明了二者的等價性。論文鏈接:https://arxiv.org/pdf/2102.11174在1991年,當時的計算成本比現在高出數百萬倍,所以計算效率很重要,Transformer的計算復雜度為二次方,所以無法擴大數據處理規模,而快速權重編程器的計算復雜度只有線性,據Jürgen所說,當年幾乎沒有期刊會接受二次縮放的神經網絡。1993年,Jürgen對線性Transformer進行循環擴展時,使用了術語「注意力」。論文鏈接:https://sferics.idsia.ch/pub/juergen/ratio.pdf正如文章開頭所說,Bengio團隊因注意力機制獲圖靈獎,之后的工作都以Bengio 2014年的論文作為注意力機制起源。Jürgen還表示,在2010年代,ACM所謂的關鍵「機器翻譯的突破」也不是Bengio的功勞,而是LSTM的功勞,在2016年極大地改進了Google 翻譯,甚至直到 2017 年,Facebook用戶每周還要進行300億次基于LSTM的翻譯請求。總之,技術起源的是是非非很難辯個清楚,拿出小板凳,理性吃瓜!參考資料:https://x.com/SchmidhuberAI/status/1864701357107634390

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        在线免费av播放| 日本一级免费视频| 精品国产免费视频| 天天躁日日躁成人字幕aⅴ| 国产精品美女久久久免费| 国产精品一级黄| 天天爱天天操天天干| 日韩一区二区在线看片| 一区二区三区日本久久久| 99久久99久久| 国产精品拍天天在线| 男人操女人动态图| 91精品国产高清久久久久久91 | 欧美日韩一区精品| 精品女人视频| 精品一区二区三区免费毛片| 亚洲成人av| 日韩精品久久久| 亚洲丶国产丶欧美一区二区三区| 国产亚洲一区在线播放| 欧美国产日韩在线观看| 国产精品jizz| 91高清视频免费观看| 国产成人在线视频网站| 免费观看一区二区三区| 91麻豆精品国产91久久久久| 精品久久成人| 99精品视频网站| 欧美精品久久久久久久多人混战| 不卡中文字幕| 日韩在线视频在线| 精品国产91洋老外米糕| 欧美久久成人| 黄色一级片播放| 亚洲激情自拍图| 国产日韩欧美三级| 天天干天天干天天干天天干天天干| 精品五月天久久| 亚洲综合国产| а 天堂 在线| 97人洗澡人人免费公开视频碰碰碰| 大尺度一区二区| 亚洲免费黄色网| 精品久久久91| 成人在线综合网| 色无极影院亚洲| 国产国语videosex另类| 国产一区二区三区免费看| 四虎成人免费视频| 国产999精品久久久影片官网| 国产亲近乱来精品视频| www.欧美视频| 亚欧洲精品在线视频免费观看| 欧美精品日日鲁夜夜添| 激情六月综合| 一区二区三区国产好的精华液| 97在线视频一区| 国产精品无圣光一区二区| 国产欧美视频在线| 欧美性bbwbbwbbwhd| 欧美一区二区三区在线看| 一道本一区二区| 久久久无码人妻精品无码| 欧美重口另类videos人妖| 国产成人自拍在线| 强制高潮抽搐sm调教高h| 国产精品v欧美精品v日韩精品| 一本久道中文字幕精品亚洲嫩| 日韩伦理视频| 最新天堂中文在线| 欧美一级免费看| 一区二区三区在线视频观看| 国产一区毛片| 密臀av一区二区三区| 97免费中文视频在线观看| 亚洲色图一区二区| 波多野结衣在线观看一区二区| 无遮挡又爽又刺激的视频| 欧美激情欧美激情| 一区二区三区中文字幕精品精品 | 9色国产精品| 最新日本中文字幕| 成人免费视频网站| 亚洲天堂a在线| 成人3d动漫在线观看| 男女视频一区二区三区| 国产99在线|中文| 欧美日韩亚洲91| 在哪里可以看毛片| 国产一区二区高清不卡| 日韩一级完整毛片| 国产福利一区在线| 香蕉免费一区二区三区在线观看 | 色婷婷一区二区三区四区| 91久久黄色| 成人免费av片| 日本成人三级电影网站| 国产视频久久网| 久久久久国产精品免费免费搜索 | 日本不卡一区二区三区| 四虎永久免费地址| 男女啪啪免费观看| 亚洲2020天天堂在线观看| 天天综合日日夜夜精品| 香蕉亚洲视频| 日本精品人妻无码77777| 今天免费高清在线观看国语| 欧美激情精品久久久久久大尺度| 香蕉久久一区二区不卡无毒影院| 久久精选视频| 欧美视频免费看| 国产美女网站在线观看| 国产精品久久久久9999| 在线播放亚洲一区| 99久久99久久精品免费观看| 国产性生活大片| 大胆欧美熟妇xx| 青青精品视频播放| 日韩视频在线观看一区二区| 97精品久久久久中文字幕| 怕怕欧美视频免费大全| 91精品国产高清91久久久久久 | 日韩经典第一页| 中文字幕一区二区三区在线播放| 国产精品v日韩精品v欧美精品网站| 欧美 变态 另类 人妖| 一区二区国产日产| 全亚洲最色的网站在线观看| 欧美群妇大交群中文字幕| 91在线观看下载| 欧美日本一区| 亚洲色婷婷一区二区三区| 精品国产成人av在线免| 成人毛片网站| 久久精品视频导航| 欧美在线播放高清精品| 91在线视频免费观看| 欧美高清一区| 四虎精品在线观看| 国产高清av片| 国产精品久久成人免费观看| 国产国语videosex另类| 亚洲欧美另类国产| 26uuu欧美| 国内精品亚洲| 日本精品在线播放| 人妻 丝袜美腿 中文字幕| www.午夜色| 91精品久久久久久久久久另类 | 欧美黑白配在线| 国产十八熟妇av成人一区| 六月婷婷激情网| 国产色综合天天综合网| www.亚洲天堂| 91精品国产色综合久久不卡蜜臀 | 色综合中文网| 国精产品视频一二二区| 在线观看免费不卡av| 伊人婷婷久久| 国产精品一区二区免费| 性欧美xxxx交| 亚洲精品综合精品自拍| 欧美性生交xxxxx久久久| 久久精品亚洲乱码伦伦中文| 青青青伊人色综合久久| 欧美一级精品片在线看| 99久久这里有精品| 日本一卡二卡在线| 国产精品人人妻人人爽人人牛| 欧美一区二区福利| 91精品在线影院| 欧美激情亚洲自拍| 亚洲欧美激情视频| 91精品国产91热久久久做人人| 亚洲卡通欧美制服中文| 91小视频免费观看| 久久99精品久久久| 99视频+国产日韩欧美| 成人3d精品动漫精品一二三| 日韩在线成人| 熟女少妇a性色生活片毛片| 免费观看一区二区三区| 99久久激情视频| 人妻无码一区二区三区四区| 精品视频导航| 成人淫片在线看| 日本欧美一二三区| 欧美成人高清视频| 亚洲性无码av在线| 亚洲第一网中文字幕| 在线成人小视频| 日韩欧美极品在线观看| 亚洲一区二区偷拍精品| 国产精品国产三级国产普通话蜜臀| 国产不卡视频一区二区三区| 日韩av成人高清| 伊人蜜桃色噜噜激情综合| 成人女性视频| 香蕉视频一区| 精品国内亚洲2022精品成人| 成人51免费| 蜜臀久久精品久久久用户群体| 亚洲国产av一区| www.免费av| 超碰男人的天堂| 欧美熟妇精品一区二区| 久久人人爽人人片| 波多野结衣网页| 激情文学亚洲色图| 手机在线观看日韩av| 三级一区二区三区| 手机av在线免费| 久久这里只精品| 欧美在线观看视频网站| 手机在线看福利| 亚洲色图 在线视频| 五月婷婷狠狠操| 五月天婷婷激情视频| 免费涩涩18网站入口| 啊啊啊国产视频| 久久久精品麻豆| 超碰中文字幕在线观看| 久久久久亚洲AV成人网人人小说| 在线观看免费看片| 少妇极品熟妇人妻无码| 黄色国产在线观看| a级在线免费观看| 日本黄色激情视频| 国产一区二区三区在线视频观看| 色欲人妻综合网| 色综合视频一区二区三区日韩| 国产精品毛片无码| 在线精品国产亚洲| 日本在线中文字幕一区| 精品久久久久中文字幕小说| 99久久影视| 久久99精品国产自在现线| 牛牛影视一区二区三区免费看| 精品欧美午夜寂寞影院| 久久影院一区| 亚洲国产导航| 久久精品国产**网站演员| 国产精品一区二区免费不卡 | 在线免费观看污视频| 色屁屁草草影院ccyy.com| 亚洲色图综合区| 久久草在线视频| 99国产**精品****| 国产日韩一区二区三区在线播放 | 99久久99久久精品国产| 国色天香久久精品国产一区| 亚洲免费观看高清完整版在线观| 加勒比久久综合| 亚洲青色在线| 国产又粗又猛又爽又黄91精品| www.欧美亚洲| 依依成人综合视频| 欧美日韩国产另类一区| 亚洲精品wwww| 欧美激情在线播放| 成人高h视频在线| 日本精品一区二区三区视频| 精品国产av无码一区二区三区| 91制片厂毛片| 亚洲色图第四色| 国产精品男女| 亚洲女同中文字幕| 久久99精品网久久| 中文字幕av资源一区| 一本大道久久a久久综合| 精品福利一区二区三区免费视频| 久久久999精品视频| 国产精品视频资源| 先锋影音日韩| 最新天堂中文在线| 可以免费看av的网址| 国产剧情一区| 奇米影视在线99精品| 国产视频亚洲色图| 欧日韩精品视频| 在线丨暗呦小u女国产精品| 国产精品国产三级国产aⅴ9色| 精品一区久久久久久| 精品这里只有精品| 国产网站无遮挡| 精品素人av| 亚洲综合丁香| 国产精品无遮挡| 日韩一区二区精品| 欧美激情亚洲自拍| 免费电影一区| 色婷婷成人在线| 在线日韩国产网站| 午夜久久tv| 久久久亚洲高清| 欧美日韩亚洲国产综合| 欧美成人中文字幕在线| 国产伦精品一区二区三区| 久久久噜噜噜www成人网| 国产精成人品免费观看| 欧美艳星介绍134位艳星| 国产精品一区三区| 欧美小视频在线| 精品国产一区久久久| 国产一区福利视频| 国产又黄又猛又粗又爽的视频| 午夜精品福利在线视频| 亚洲欧美一级二级三级| 91女神在线视频| 717成人午夜免费福利电影| 欧美大码xxxx| 亚洲va韩国va欧美va精四季| 韩国三级在线播放| 午夜影院黄色片| 欧美激情偷拍自拍| 99国产麻豆精品| 欧美一区二区三区播放老司机| 91精品91久久久久久| 亚洲成人动漫在线| 国产免费无遮挡吸奶头视频| 久久精品免费一区二区三区| 91在线视频免费91| 亚洲电影中文字幕| 91在线播放视频| 天天综合网日韩| 欧美调教网站| 成人精品一区二区三区四区| 欧美二区三区91| 国产精品久久久久久亚洲影视| 日本a级片在线播放| 国产调教在线观看| 99成人在线| 无吗不卡中文字幕| 久久青草精品视频免费观看| 懂色av一区二区三区四区五区| 91中文字幕永久在线| 亚洲国产一区二区精品专区| 亚洲免费在线电影| 久久视频在线直播| 日本一本草久p| 久久精品亚洲a| 青青草伊人久久| 欧美日韩中文精品| 成人欧美一区二区三区黑人| 中文字幕亚洲欧洲| 日韩av有码| 中文字幕视频一区| 欧美成在线视频| 日本午夜激情视频| 九九热播视频在线精品6| 懂色av中文一区二区三区| 精品国产一区二区亚洲人成毛片 | 一区二区中文视频| 成人97在线观看视频| 4444亚洲人成无码网在线观看| 婷婷伊人五月天| 韩国欧美国产一区| 精品久久久久久久久久久久久久久久久| 99在线观看| 国产激情第一页| 国产亚洲高清视频| 欧美日韩精品电影| 97se亚洲综合| 免费污网站在线观看| 日韩不卡一二三区| 日韩一二三四区| 欧美日韩精品免费在线观看视频| 91免费在线看片| 国产成人8x视频一区二区| 国产视频亚洲精品| 日本a级片在线观看| 白白在线精品| 国产精品久久久久毛片软件| 久久久久久网站| 天天成人综合网| 视频二区欧美| 欧美国产乱子伦| 2019中文在线观看| 三级黄色片播放| 久久久xxx| 欧美不卡视频一区| 水蜜桃亚洲一二三四在线| 精品一区二区三区中文字幕| 久久综合九色欧美综合狠狠 | 伊人网伊人影院| 国产成人免费av在线| 日韩网站在线观看| 欧美成人黑人猛交| 欧美欧美全黄| 欧美一区二区三区性视频| 免费久久一级欧美特大黄| 欧美h版在线观看| 自拍偷拍欧美精品| 国产精品日韩av| 人妻少妇精品视频一区二区三区| 精品综合久久久久久8888| 国产亚洲欧美日韩一区二区| 日本一区二区黄色| 亚洲视频精品| 欧美成人性战久久|