揭秘 OpenR：首個類 o1 開源推理框架，增強大型語言模型復雜推理能力

AIGC動態1年前 (2024)發布 AI科技評論

AIGC動態歡迎閱讀

原標題：揭秘 OpenR：首個類 o1 開源推理框架，增強大型語言模型復雜推理能力
關鍵字：模型,步驟,報告,過程,數據
文章來源：AI科技評論
內容字數：0字

內容摘要：

OpenR 研究團隊成員包括：汪軍教授，倫敦大學學院（UCL）計算機系教授，阿蘭?圖靈研究所 Turing Fellow，其指導的 UCL 一年級博士生宋研。利物浦大學助理教授方蒙。上海交通大學 Apex 和多智能體實驗室張偉楠教授（上海交通大學計算機系教授、博士生導師、副系主任），溫穎副教授（上海交通大學約翰?霍普克羅夫特計算機科學中心副教授）以及其指導的博士生萬梓煜、溫睦寧、朱家琛。張偉楠教授和溫穎副教授博士期間就讀于 UCL，指導教師為汪軍教授。香港科技大學（廣州）創校校長，倪明選（Lionel M. Ni），香港工程科學院院士，香港科技大學（廣州）講席教授。陳雷，香港科技大學（廣州）信息樞紐院長，講席教授。香港科技大學（廣州）一年級博士生劉安杰、龔子欽受汪軍教授和楊林易博士聯合執導，以及西湖大學工學院助理教授（研究）楊林易。o1 作為 OpenAI 在推理領域的最新模型，大幅度提升了 GPT-4o 在推理任務上的表現，甚至超過了平均人類水平。o1 背后的技術到底是什么？OpenAI 技術報告中所強調的強化學習和推斷階段的 Scaling Law 如何實現？
為了嘗試回答這些問題

原文鏈接：揭秘 OpenR：首個類 o1 開源推理框架，增強大型語言模型復雜推理能力