<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來

        AIGC動態9個月前發布 量子位
        354 0 0

        質疑微軟,理解微軟

        ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來

        原標題:ViT作者飛機上也要讀的改進版Transformer論文,花2個小時詳細批注解讀分享出來
        文章來源:量子位
        內容字數:3875字

        Lucas Beyer點評微軟Differencial Transformer論文:改進Transformer架構的“簡單而優雅”嘗試

        近日,OpenAI研究員Lucas Beyer在其個人社交媒體上發表長文,對一篇來自微軟的改進Transformer架構的論文(簡稱DiffTransformer)進行了深入分析。這篇論文提出了一種名為“Differencial Transformer”的模型,旨在解決Transformer模型信噪比低的問題,其核心思想類似于差分放大電路或降噪耳機,利用兩個注意力頭的差值來濾除共模噪聲。

        1. 論文核心思想及Beyer的初步質疑

        論文的核心創新點可以用一句話概括:將兩個注意力頭配對,然后執行(softmax(Q1K1) – λ*softmax(Q2K2)) V,其中λ是一個可學習的標量。 Beyer最初對該方法持保留態度,認為普通的Transformer的多個注意力頭應該能夠自行學習到這種機制,無需額外設計。

        2. Beyer的觀點轉變及論文細節分析

        然而,在與同行交流并重新閱讀論文后,Beyer改變了看法。他贊揚了論文中實驗的公平性和謹慎性。但他同時指出了一些論文中容易被忽視的細節,例如:DiffAttn實際上并沒有對差值重新歸一化,λ的計算較為復雜,且缺乏對λ參數的深入分析,以及實驗中基線模型選擇的合理性存疑等。 Beyer建議論文作者提供更多關于注意力分布、熵、以及λ參數和層歸一化影響的圖表數據,以增強論文的說服力。

        3. 實驗結果及Beyer的質疑

        論文中大量的實驗結果顯示,Diff Transformer在某些方面表現優于基線模型StableLM-3B。然而,Beyer對實驗結果提出了兩點質疑:首先,縮放曲線存在明顯的斷裂,且使用了不同的學習率;其次,訓練數據量相對較小(100億token)。他認為這些因素可能影響了實驗結果的可靠性,并建議提供基于計算量或實際時間的縮放曲線。

        4. Diff Transformer的優勢及不足

        盡管存在一些質疑,Beyer仍然肯定了Diff Transformer在長文本評測和對輸入樣本順序的魯棒性方面的優勢。特別是在上下文學習的魯棒性實驗中,Diff Transformer表現出更強的穩定性。但同時,Diff Transformer的推理速度略慢于基線模型(慢5-10%)。

        5. 總結與展望

        總而言之,Beyer對Diff Transformer的評價是積極的,他認為這項工作展現了比單純的“兩個注意力頭相減”更多的潛力,是一個有前景的研究方向。但他同時也強調,需要進一步的研究來驗證其在其他任務中的泛化能力和復現性。

        6. 關于作者Lucas Beyer

        Lucas Beyer是OpenAI的研究員,曾是谷歌的研究員,參與了Vision Transformer的研發。他經常對最新的AI研究發表評論,是一位值得關注的學者。


        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV无码成人精品区在线观看| 婷婷亚洲综合五月天小说| 久久久久久亚洲精品无码| 免费一级毛片在级播放| 国产真人无码作爱免费视频| 亚洲AV日韩AV永久无码绿巨人 | 特级aaaaaaaaa毛片免费视频| 国产亚洲精品va在线| 成人毛片18女人毛片免费| 一个人看的hd免费视频| 亚洲一区在线免费观看| 亚洲欧洲久久久精品| 免费无遮挡无码永久视频| 国产亚洲综合久久| 亚洲视频网站在线观看| 无码不卡亚洲成?人片| 日本免费xxxx| 大地资源网高清在线观看免费 | 在线观看免费无码专区 | 在线免费观看亚洲| 一级毛片免费播放视频| 亚洲av专区无码观看精品天堂| 亚洲精品无码你懂的网站| 在线视频观看免费视频18| 免费人成激情视频在线观看冫 | 91福利视频免费观看| 一级黄色毛片免费看| 中文无码亚洲精品字幕| 久久久久久a亚洲欧洲AV| 亚洲AV无码一区二三区| 成人免费午夜在线观看| 97免费人妻在线视频| 国精产品一区一区三区免费视频 | 亚洲成a人片77777老司机| 亚洲s色大片在线观看| 国产精品免费久久| 国产亚洲精彩视频| 亚洲www77777| 亚洲a视频在线观看| 亚洲国产精品lv| 亚洲AV无码成人精品区大在线|