<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Scaling Laws終結(jié),量化無用,AI大佬都在審視這篇論文

        AIGC動態(tài)10個月前發(fā)布 機器之心
        483 0 0

        Scaling Laws終結(jié),量化無用,AI大佬都在審視這篇論文

        AIGC動態(tài)歡迎閱讀

        原標(biāo)題:Scaling Laws終結(jié),量化無用,AI大佬都在審視這篇論文
        關(guān)鍵字:精度,模型,權(quán)重,數(shù)據(jù),定律
        文章來源:機器之心
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        機器之心報道
        作者:澤南、小舟研究表明,你訓(xùn)練的 token 越多,你需要的精度就越高。最近幾天,AI 社區(qū)都在討論同一篇論文。
        UCSD 助理教授 Dan Fu 說它指明了大模型量化的方向。CMU 教授 Tim Dettmers 則直接說:它是很長一段時間以來最重要的一篇論文。OpenAI 創(chuàng)始成員、特斯拉前 AI 高級總監(jiān) Andrej Karpathy 也轉(zhuǎn)發(fā)了他的帖子。Tim Dettmers 表示,可以說,人工智能的大部分進(jìn)步都來自計算能力的提升,而(在最近)這主要依賴于低精度路線的加速(32- > 16 – > 8 位)。現(xiàn)在看來,這一趨勢即將結(jié)束。再加上摩爾定律的物理限制,大模型的大規(guī)模擴展可以說要到頭了。
        例如,英偉達(dá)最新的 AI 計算卡 Blackwell 將擁有出色的 8 位能力,并在硬件層面實現(xiàn)逐塊量化。這將使 8 位訓(xùn)練變得像從 FP16 切換到 BF16 一樣簡單。然而,正如我們從新論文中看到的那樣,對于很多大模型的訓(xùn)練來說,8 位是不夠的。
        與其他模型相比,Llama 405B 沒有得到太多應(yīng)用的主要原因是它體量太大了,運行 405B 模型進(jìn)行推理非常麻煩。


        原文鏈接:Scaling Laws終結(jié),量化無用,AI大佬都在審視這篇論文

        聯(lián)系作者

        文章來源:機器之心
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 1000部啪啪毛片免费看| 亚洲砖码砖专无区2023| 人人鲁免费播放视频人人香蕉| 欧洲人成在线免费| 亚洲国产av无码精品| 亚洲精品视频久久久| 99亚洲精品卡2卡三卡4卡2卡| 国内大片在线免费看| 亚洲精品欧美综合四区| 色www永久免费视频| 亚洲AV成人无码网站| 国产成人免费永久播放视频平台| 亚洲国产欧洲综合997久久| 国产成人高清精品免费软件| 亚洲AV无码一区二区乱子仑| 免费中文字幕不卡视频| 九九全国免费视频| 亚洲精品无码久久久久sm| 18禁在线无遮挡免费观看网站| 五月天网站亚洲小说| 久草视频在线免费| 亚洲综合久久精品无码色欲| 国产成人免费片在线观看| caoporn国产精品免费| 亚洲AV无码成人精品区在线观看 | 国产乱辈通伦影片在线播放亚洲 | 热99RE久久精品这里都是精品免费| 亚洲乱码中文字幕综合| 国色精品va在线观看免费视频 | 日本特黄特色aa大片免费| 亚洲精品乱码久久久久久自慰 | 亚洲香蕉在线观看| 尤物永久免费AV无码网站| 久久成人永久免费播放| 免费被黄网站在观看| 无套内射无矿码免费看黄| 亚洲av无码一区二区三区乱子伦| 免费人成在线观看69式小视频| 久久精品国产亚洲AV天海翼| 亚洲国产精品无码一线岛国| 久久国内免费视频|