AIGC動態歡迎閱讀
原標題:揭秘 OpenR:首個類 o1 開源推理框架,增強大型語言模型復雜推理能力
關鍵字:模型,步驟,報告,過程,數據
文章來源:AI科技評論
內容字數:0字
內容摘要:
OpenR 研究團隊成員包括:汪軍教授,倫敦大學學院(UCL)計算機系教授,阿蘭?圖靈研究所 Turing Fellow,其指導的 UCL 一年級博士生宋研。利物浦大學助理教授方蒙。上海交通大學 Apex 和多智能體實驗室張偉楠教授(上海交通大學計算機系教授、博士生導師、副系主任),溫穎副教授(上海交通大學約翰?霍普克羅夫特計算機科學中心副教授)以及其指導的博士生萬梓煜、溫睦寧、朱家琛。張偉楠教授和溫穎副教授博士期間就讀于 UCL,指導教師為汪軍教授。香港科技大學(廣州)創校校長,倪明選(Lionel M. Ni),香港工程科學院院士,香港科技大學(廣州)講席教授。陳雷,香港科技大學(廣州)信息樞紐院長,講席教授。香港科技大學(廣州)一年級博士生劉安杰、龔子欽受汪軍教授和楊林易博士聯合執導,以及西湖大學工學院助理教授(研究)楊林易。o1 作為 OpenAI 在推理領域的最新模型,大幅度提升了 GPT-4o 在推理任務上的表現,甚至超過了平均人類水平。o1 背后的技術到底是什么?OpenAI 技術報告中所強調的強化學習和推斷階段的 Scaling Law 如何實現?
為了嘗試回答這些問題
原文鏈接:揭秘 OpenR:首個類 o1 開源推理框架,增強大型語言模型復雜推理能力
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...