<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        不分割成token,直接從字節(jié)中高效學習,Mamba原來還能這樣用

        AIGC動態(tài)2年前 (2024)發(fā)布 機器之心
        454 0 0

        不分割成token,直接從字節(jié)中高效學習,Mamba原來還能這樣用

        AIGC動態(tài)歡迎閱讀

        原標題:不分割成token,直接從字節(jié)中高效學習,Mamba原來還能這樣用
        關鍵字:模型,字節(jié),序列,時間,建模
        文章來源:機器之心
        內容字數(shù):6575字

        內容摘要:


        機器之心報道
        編輯:張倩給出一句「Hello, world!」你要怎么把它喂給 AI 模型?目前常見的方法是利用某種算法將它分為若干 token,比如 [“Hello”, “,”, “world”, “!”]。模型通過學習這些 token 的上下文關系以及如何組合它們來表示原始文本或預測下一個 token。但這種方法依賴于有效的 token 分割算法,而且可能無法很好地處理新詞、專有名詞或非標準用法。因此,不少研究者也在嘗試另一種方法:直接讓模型從字節(jié)中學習。在 Mamba 問世之后,這條路似乎有希望了。
        在定義語言模型時,通常會使用一種基本分詞方法,把句子分為詞(word)、子詞(subword)或字符(character)。其中,子詞分詞法一直是最受歡迎的選擇,因為它在訓練效率和處理詞匯表外單詞的能力之間實現(xiàn)了自然的折中。然而,一些研究指出了子詞分詞法的問題,如對、拼寫和大小寫變化以及形態(tài)變化缺乏穩(wěn)健性。
        因此,有些研究人員另辟蹊徑,采用了一種使用字節(jié)序列的方法,即從原始數(shù)據(jù)到預測的端到端映射,中間不進行任何分詞。與子詞模型相比,基于字節(jié)級的語言模型能夠更容易地在不同的書寫形


        原文鏈接:不分割成token,直接從字節(jié)中高效學習,Mamba原來還能這樣用

        聯(lián)系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業(yè)的人工智能媒體和產業(yè)服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲欧洲专线一区| 亚洲av无码片在线观看| 永久免费无码日韩视频| 最近中文字幕mv免费高清电影| 亚洲熟妇无码爱v在线观看| 久久免费国产视频| 亚洲AV无码一区二区三区DV | 亚洲国产成人精品无码一区二区 | 亚洲欧美日韩中文字幕一区二区三区 | 97无码人妻福利免费公开在线视频| 久久夜色精品国产亚洲av| jizz在线免费观看| 亚洲国产精品VA在线看黑人| 免费高清国产视频| 亚洲人成网站日本片| 成人永久福利免费观看| 爱情岛论坛网亚洲品质自拍| 国产三级在线免费观看| 国产成人精品免费视频软件| 亚洲自偷自拍另类图片二区| 野花高清在线观看免费3中文| 亚洲欧美日韩国产精品一区| 亚洲精品tv久久久久久久久久| 97在线免费视频| 亚洲人成在久久综合网站| 国产乱子伦精品免费无码专区| 国产免费一级高清淫曰本片| 亚洲色偷偷av男人的天堂| 国产一级特黄高清免费大片| 一个人看的www免费视频在线观看| 亚洲欧洲精品视频在线观看| 国产午夜无码视频免费网站| 东方aⅴ免费观看久久av| 国产日本亚洲一区二区三区 | 我们的2018在线观看免费高清| 亚洲国产精品成人午夜在线观看| 中文字幕亚洲图片| 亚洲人成电影网站免费| eeuss在线兵区免费观看| 亚洲成a人片7777| 久久精品亚洲男人的天堂|