AIGC動態歡迎閱讀
原標題:模型A:幸虧有你,我才不得0分,模型B:俺也一樣
關鍵字:模型,任務,算術,語言,能力
文章來源:機器之心
內容字數:9068字
內容摘要:
機器之心報道
機器之心編輯部現在大模型都學會借力了。琳瑯滿目的樂高積木,通過一塊又一塊的疊加,可以創造出各種栩栩如生的人物、景觀等,不同的樂高作品相互組合,又能為愛好者帶來新的創意。
我們把思路打開一點,在大模型(LLM)爆發的當下,我們能不能像拼積木一樣,把不同的模型搭建起來,而不會影響原來模型的功能,還能起到 1+1>2 的效果。
這樣的想法,谷歌已經實現了。他們的研究為未來的語言模型發展提供了一個新的方向,特別是在資源節約和模型適應性方面。如今的大語言模型(LLM)仿佛一個全能戰士,能進行常識和事實推理、懂得世界知識、生成連貫的文本…… 在這些基礎功能的底座上,研究者們又進行了一系列努力對這些模型進行微調,以實現特定于領域的功能,如代碼生成、文案編輯以及解決數學問題等。
但這些特定于領域的模型開始出現一些棘手的問題,例如,有些模型在標準代碼生成方面做得很好,但在一般邏輯推理方面并不精通,反之亦然。
我們不禁要問:是否可以將 anchor 模型(即具有基礎功能的模型)與特定于領域的增強模型組合在一起,從而開啟模型新功能?例如,我們能否將理解代碼的增強模型與 anchor 模型的語言
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...