AIGC動態歡迎閱讀
原標題:7B大模型測試成績超GPT-4!微軟新研究解決工具調用難題
關鍵字:模型,語言,工具,能力,方法
文章來源:智東西
內容字數:4200字
內容摘要:
微軟靠“想象力”解決大語言模型調用工具兩大難題!方法已開源。
作者|徐珊
編輯|云鵬
智東西3月10日消息,近日微軟和俄亥俄州立大學的研究人員發布論文,提出了一種受到生物啟發的可以增強大語言模型使用工具能力的方法,即模擬試錯(STE)法,并將其開源。
該方法協調了試錯、想象和記憶三個關鍵機制。具體而言,STE通過大模型的“想象力”來模擬使用工具的一些合理場景,從而嘗試適配不同的大模型,隨后從新的反饋中,獲得反饋不斷優化。
ToolBench實驗結果顯示,STE在上下文學習和微調設置下顯著提高了大語言模型的工具學習能力,讓Mistral-Instruct-7B實現了46.7%的性能提升,使其成績超過了GPT-4。▲論文封面
論文PDF:https://arxiv.org/pdf/2403.04746.pdf
01.
無法兼顧準確性和靈活性,
大語言模型調用工具遭遇兩大難題
尋找合適的工具一直以來都是訓練大語言模型中關鍵一環。目前有關大語言模型的工具研究,主要集中在兩個方面:為大語言模型增加一些新的工具,以及能夠讓大語言模型訪問多個工具。
這些研究方向一般采用兩種常見的設置:1)上下文學習
原文鏈接:7B大模型測試成績超GPT-4!微軟新研究解決工具調用難題
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...