7B大模型測試成績超GPT-4!微軟新研究解決工具調(diào)用難題
AIGC動態(tài)歡迎閱讀
原標(biāo)題:7B大模型測試成績超GPT-4!微軟新研究解決工具調(diào)用難題
關(guān)鍵字:模型,語言,工具,能力,方法
文章來源:智東西
內(nèi)容字?jǐn)?shù):4200字
內(nèi)容摘要:
微軟靠“想象力”解決大語言模型調(diào)用工具兩大難題!方法已開源。
作者|徐珊
編輯|云鵬
智東西3月10日消息,近日微軟和俄亥俄州立大學(xué)的研究人員發(fā)布論文,提出了一種受到生物啟發(fā)的可以增強大語言模型使用工具能力的方法,即模擬試錯(STE)法,并將其開源。
該方法協(xié)調(diào)了試錯、想象和記憶三個關(guān)鍵機制。具體而言,STE通過大模型的“想象力”來模擬使用工具的一些合理場景,從而嘗試適配不同的大模型,隨后從新的反饋中,獲得反饋不斷優(yōu)化。
ToolBench實驗結(jié)果顯示,STE在上下文學(xué)習(xí)和微調(diào)設(shè)置下顯著提高了大語言模型的工具學(xué)習(xí)能力,讓Mistral-Instruct-7B實現(xiàn)了46.7%的性能提升,使其成績超過了GPT-4。▲論文封面
論文PDF:https://arxiv.org/pdf/2403.04746.pdf
01.
無法兼顧準(zhǔn)確性和靈活性,
大語言模型調(diào)用工具遭遇兩大難題
尋找合適的工具一直以來都是訓(xùn)練大語言模型中關(guān)鍵一環(huán)。目前有關(guān)大語言模型的工具研究,主要集中在兩個方面:為大語言模型增加一些新的工具,以及能夠讓大語言模型訪問多個工具。
這些研究方向一般采用兩種常見的設(shè)置:1)上下文學(xué)習(xí)
原文鏈接:7B大模型測試成績超GPT-4!微軟新研究解決工具調(diào)用難題
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。