<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        北京大學:利用好不確定性,8B小模型也能超越GPT-4

        北京大學:利用好不確定性,8B小模型也能超越GPT-4

        AIGC動態(tài)歡迎閱讀

        原標題:北京大學:利用好不確定性,8B小模型也能超越GPT-4
        關(guān)鍵字:模型,性能,任務(wù),確定性,方法
        文章來源:夕小瑤科技說
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        夕小瑤科技說 原創(chuàng)作者 | 謝年年大模型有一個顯著的特點,那就是不確定性——對于特定輸入,相同的LLM在不同解碼配置下可能生成顯著不同的輸出。
        比如問一問chatgpt“今天開心嗎?”,可以得到兩種不同的回答。
        常用的解碼策略有兩種,一個是貪婪解碼,即永遠選擇概率最高的下一個token,另一種就是采樣方法,根據(jù)概率分布隨機選擇下一個token,常常使用溫度參數(shù)平衡響應質(zhì)量和多樣性。
        那么,這兩種方式哪個更好呢?北大的一篇論文給出了答案:
        貪婪解碼在大多數(shù)任務(wù)中通常優(yōu)于采樣方法。
        另外作者還發(fā)現(xiàn),LLMs的這種不確定性具有巨大潛力。通過采用“Best-of-N”策略,從多個采樣響應中挑選最優(yōu)答案的方式,Llama-3-8B-Instruct在MMLU、GSM8K和HumanEval上均超越GPT-4-Turbo。
        這是否可以說明,即使小模型單次回答可能不夠準確,但多試幾次,從里面挑最好的,也能找到正確答案。就像多猜幾次謎語,總有一次能猜對一樣。一起來看看論文中怎么說的吧~
        論文標題:The Good, The Bad, and The Greedy:
        Evaluation of LLMs


        原文鏈接:北京大學:利用好不確定性,8B小模型也能超越GPT-4

        聯(lián)系作者

        文章來源:夕小瑤科技說
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲综合一区二区国产精品| 亚洲AⅤ永久无码精品AA| 久久精品国产亚洲综合色| 免费精品国自产拍在线播放| 男人的天堂亚洲一区二区三区| 久久精品国产亚洲AV香蕉| 十九岁在线观看免费完整版电影| 久久精品亚洲综合| 95免费观看体验区视频| 亚洲国产精品日韩在线观看| 国产男女爽爽爽爽爽免费视频| 国产精品亚洲专区在线观看| 影音先锋在线免费观看| 老司机福利在线免费观看| 免费人成视频x8x8入口| 国产精品免费视频观看拍拍| 亚洲精品无码av人在线观看| 四虎影视在线影院在线观看免费视频| 久久久久久亚洲av成人无码国产| 亚洲视频免费一区| 亚洲国产精华液2020| 四虎永久免费地址在线观看| 黄色网站软件app在线观看免费| 亚洲黑人嫩小videos| 四虎www成人影院免费观看| 黄网站色成年片大免费高清| 亚洲精品无码久久久久| **真实毛片免费观看| 亚洲日本VA午夜在线影院| 久久久久亚洲AV成人网人人网站| 免费在线观看一级片| 亚洲av乱码一区二区三区香蕉| 国产免费资源高清小视频在线观看| 一级毛片免费毛片毛片| 亚洲s色大片在线观看| 久久精品免费一区二区喷潮| 春意影院午夜爽爽爽免费| 在线免费观看亚洲| 免费人成年激情视频在线观看| 免费国产成人午夜在线观看| 亚洲色精品三区二区一区|