AIGC動態歡迎閱讀
原標題:北大千問團隊推出數學專用版CriticGPT,“找茬”讓大模型進步更快
關鍵字:錯誤,數據,自然語言,模型,數學
文章來源:量子位
內容字數:0字
內容摘要:
蔡澤凡 投稿量子位 | 公眾號 QbitAI批評不僅能讓人進步,也能讓大模型的能力提升。
OpenAI就用這個思路造了個“找茬模型”CriticGPT。非常巧合的是,就在CriticGPT放出的前幾天,北大聯合千問等團隊以類似的思路設計出了“數學專用版”CriticGPT。
在無需訓練的設置下,驗證器能夠在推理時輔助模型在GSM8K上的準確率從86.6%提升到88.2%。
在GSM8K數據集上,它可以讓模型的準確率從86.6%提升到88.2%。
CriticGPT的核心思路是在代碼中故意設置bug并進行詳細標注,然后用得到的數據訓練出會debug的模型。
北大團隊發現,這種方法不僅在代碼當中有用,也能幫助語言模型解決數學問題。
于是團隊利用相似的思路,把代碼換成數學問題,推出了“數學版CriticGPT”——Math-Minos。
用GPT4逐步提出修正意見在數學推理領域,驗證解決方案的正確性,是確保推理質量的關鍵步驟。
然而,現有的數學驗證器大多依賴于二元分類標簽進行訓練,這種方式在提供正確或錯誤原因的解釋上存在明顯不足,無法給驗證器提供足夠充分的監督信號來訓練。
Math-Mino
原文鏈接:北大千問團隊推出數學專用版CriticGPT,“找茬”讓大模型進步更快
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...