模型A：幸虧有你，我才不得0分，模型B：俺也一樣

AIGC動態2年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：模型A：幸虧有你，我才不得0分，模型B：俺也一樣
關鍵字：模型,任務,算術,語言,能力
文章來源：機器之心
內容字數：9068字

內容摘要：

機器之心報道
機器之心編輯部現在大模型都學會借力了。琳瑯滿目的樂高積木，通過一塊又一塊的疊加，可以創造出各種栩栩如生的人物、景觀等，不同的樂高作品相互組合，又能為愛好者帶來新的創意。
我們把思路打開一點，在大模型（LLM）爆發的當下，我們能不能像拼積木一樣，把不同的模型搭建起來，而不會影響原來模型的功能，還能起到 1+1>2 的效果。
這樣的想法，谷歌已經實現了。他們的研究為未來的語言模型發展提供了一個新的方向，特別是在資源節約和模型適應性方面。如今的大語言模型（LLM）仿佛一個全能戰士，能進行常識和事實推理、懂得世界知識、生成連貫的文本…… 在這些基礎功能的底座上，研究者們又進行了一系列努力對這些模型進行微調，以實現特定于領域的功能，如代碼生成、文案編輯以及解決數學問題等。
但這些特定于領域的模型開始出現一些棘手的問題，例如，有些模型在標準代碼生成方面做得很好，但在一般邏輯推理方面并不精通，反之亦然。
我們不禁要問：是否可以將 anchor 模型（即具有基礎功能的模型）與特定于領域的增強模型組合在一起，從而開啟模型新功能？例如，我們能否將理解代碼的增強模型與 anchor 模型的語言

原文鏈接：模型A：幸虧有你，我才不得0分，模型B：俺也一樣