<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        谷歌揭秘大模型不會數r原因:嵌入維度是關鍵,不止分詞器問題

        AIGC動態12個月前發布 量子位
        522 0 0

        谷歌揭秘大模型不會數r原因:嵌入維度是關鍵,不止分詞器問題

        AIGC動態歡迎閱讀

        原標題:谷歌揭秘大模型不會數r原因:嵌入維度是關鍵,不止分詞器問題
        關鍵字:詞匯量,模型,序列,維度,長度
        文章來源:量子位
        內容字數:0字

        內容摘要:


        克雷西 發自 凹非寺量子位 | 公眾號 QbitAI大模型做奧賽題游刃有余,簡單的數數卻屢屢翻車的原因找到了。
        谷歌的一項新研究,發現大模型不會數數的原因,并不是簡單的tokenizer所致,而是沒有足夠的空間來存儲用于計數的向量。
        數出一段話中某個單詞出現的次數,這樣簡單的任務可以難倒許多大模型,GPT-4o、Claude 3.5也無法幸免。
        如果再進一步,想要找到出現頻率最高的一個詞,更是難如登天,即便能蒙對給出的具體數量也是錯的。
        有人認為是詞匯的token化導致了大模型看到的“詞”和我們的看法不一致,但論文表明,實際情況并不是這么簡單。
        想數清單詞,嵌入維度要夠大Transformer的計數能力與其嵌入維度d和詞匯量m(指詞匯表中詞的數量,非序列長度)的關系密切相關。
        詳細的原因,就涉及到了Transformer統計詞頻時的機制。
        Transformer通過一種特殊的嵌入方式,利用嵌入空間的線性結構,巧妙地將計數問題轉化為了向量加法。
        具體說是將每個詞映射到一個獨特的正交向量上,在這種表示下,詞頻可以通過對這些正交向量求和來簡單地計算。
        然而,這種機制的局限性在于,它要求詞匯表


        原文鏈接:谷歌揭秘大模型不會數r原因:嵌入維度是關鍵,不止分詞器問題

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲欧洲成人精品香蕉网| 亚洲一区AV无码少妇电影| 亚洲国产精品无码久久SM| 日本亚洲欧洲免费天堂午夜看片女人员 | 国产亚洲美女精品久久久2020| 亚洲av无码乱码国产精品| 亚洲精品第一国产综合精品 | 亚洲第一第二第三第四第五第六 | 国产免费的野战视频| 国产一级淫片视频免费看| 亚洲成熟xxxxx电影| 亚洲一线产区二线产区区| 好大好硬好爽免费视频| 美腿丝袜亚洲综合| 亚洲人成网站在线在线观看| 中国极品美軳免费观看| ww在线观视频免费观看| 亚洲小说区图片区另类春色| 不卡视频免费在线观看| 亚洲午夜未满十八勿入| 一级毛片免费视频网站| 最近免费中文字幕4| 亚洲∧v久久久无码精品| 91精品国产免费| 在线亚洲午夜理论AV大片| 91免费福利视频| yy6080久久亚洲精品| 亚洲国产综合人成综合网站00| 中文字幕不卡免费高清视频| 亚洲第一视频网站| 女人张腿给男人桶视频免费版| 亚洲av无码专区青青草原| 亚洲第一成年免费网站| 亚洲综合在线视频| 国产va在线观看免费| 久久精品国产亚洲一区二区三区| 久久免费视频观看| 亚洲v高清理论电影| 无码视频免费一区二三区| 一区二区免费国产在线观看| va亚洲va日韩不卡在线观看|