AI創(chuàng)業(yè)者李博杰:小公司也能做RL,過幾個(gè)月可能出現(xiàn)o1開源平替
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:AI創(chuàng)業(yè)者李博杰:小公司也能做RL,過幾個(gè)月可能出現(xiàn)o1開源平替
關(guān)鍵字:華為,模型,政策,知乎,思維
文章來源:Founder Park
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
o1 的發(fā)布對于 AI 行業(yè)的創(chuàng)業(yè)者來說,到底意味著什么?
本文作者李博杰作為第一批華為“天才少年”在2019年加入華為,職級(jí)P20 (技術(shù)專家別),離開華為后成立了Logenic AI。
在他看來,從 o1 的實(shí)測成績看來,OpenAI 沒有吹牛。
而這一波更新,也會(huì)帶來 AI 技術(shù)的新一輪增長,尤其是 RL(強(qiáng)化學(xué)習(xí))的發(fā)展。
新模型的推出看似是OpenAI 再次領(lǐng)跑,但其實(shí)非常有利于中小 AI 公司和學(xué)術(shù)界。大多數(shù)推理任務(wù)用 o1 mini 就能解決,而強(qiáng)化學(xué)習(xí)的訓(xùn)練需要的算力大概率比預(yù)訓(xùn)練少,只要有高質(zhì)量的數(shù)據(jù)和正確的算法就能搞。
李博杰還預(yù)測,說不定過幾個(gè)月,OpenAI o1 mini 的開源平替版本都會(huì)到處開花,就像 2023 年初 ChatGPT 的開源平替一樣。
文章轉(zhuǎn)載自李博杰在知乎的回答,已獲授權(quán)。
點(diǎn)擊關(guān)注,每天更新深度 AI 行業(yè)洞察
01OpenAI的牛皮沒有吹破OpenAI o1 的傳言從去年的 Q* 開始,今年的 Strawberry 又拱了一波火,除了 o1 這個(gè)名字沒有人猜到以外,里面的內(nèi)容其實(shí)已經(jīng)被猜的七七八八了,主要就是用強(qiáng)化學(xué)習(xí)方法讓大模型
原文鏈接:AI創(chuàng)業(yè)者李博杰:小公司也能做RL,過幾個(gè)月可能出現(xiàn)o1開源平替
聯(lián)系作者
文章來源:Founder Park
作者微信:
作者簡介: