AIGC動態歡迎閱讀
原標題:o1研發團隊首次集體訪談:教AI數r用了一年半
關鍵字:模型,問題,發現,工作,范式
文章來源:量子位
內容字數:0字
內容摘要:
克雷西 明敏 發自 凹非寺量子位 | 公眾號 QbitAI笑死,原來o1也像人類一樣喜歡趕ddl。
這是在o1團隊的“大型見面會”上,OpenAI創始成員Wojciech Zaremba揭開的o1“黑歷史”。
包括Zaremba在內的18名團隊成員,在首席研究官Bob McGrew的帶領之下圍坐一團。
o1核心貢獻者Hyung Won Chung、Noam Brown等關鍵人物,也都在此列。
隨著成員們的踴躍發言,o1的發展歷程也逐漸被揭開——受AlphaGo和早期GPT模型的啟發,想到了將兩張背后的范式結合。
后來,團隊訓練出了第一個可以生成連貫思維鏈的模型,標志著研究方向開始逐漸明朗和聚焦……
在充滿松弛感的氣氛當中,眾人還分享了有關o1研發的許多趣事:
在OpenAI內部,也喜歡用“數r”來測試大模型能力
為了解決“數r”的問題,OpenAI花費了一年半
技術人員會把代錯信息直接丟給o1去debug
o1曾經說過,生命的意義是“42”,還試圖用代數來定義“love”
同時在研究過程中他們還發現,o1不僅比人類更善于發現新的CoT推理步驟,并且還涌現出了自我批評能力。
有網友稱
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...