AIGC動態歡迎閱讀
原標題:ICLR 2024 Spotlight | 無懼中間步驟,MUSTARD可生成高質量數學推理數據
關鍵字:數據,數學,華為,自然語言,定理
文章來源:機器之心
內容字數:9257字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。近年來,大型語言模型(LLM)在數學應用題和數學定理證明等任務中取得了長足的進步。數學推理需要嚴格的、形式化的多步推理過程,因此是 LLMs 推理能力進步的關鍵里程碑, 但仍然面臨著重要的挑戰。
以往的研究工作,如思維鏈(CoT),揭示了中間步驟引導的有效性。然而,人工地去標注這樣的中間步驟需要花費大量人力和時間成本,而自動合成的數據也容易在正確性和人類易讀性上面出現問題。
本文中,來自香港城市大學、中山大學、華為諾亞方舟實驗室等機構的研究人員提出了一個統一的數學推理數據合成框架 MUSTARD,能夠生成大量的、正確的且人類可讀可理解的高質量數學推理數據。論文題目:MUSTARD: Mastering Uniform Synthesis of Theorem
原文鏈接:ICLR 2024 Spotlight | 無懼中間步驟,MUSTARD可生成高質量數學推理數據
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...