O3發(fā)布引發(fā)震動(dòng):碼農(nóng)飯碗遭重創(chuàng),未來(lái)何去何從?
未來(lái)打工人何去何從
原標(biāo)題:o3 發(fā)布了,摔碎了碼農(nóng)的飯碗
文章來(lái)源:智猩猩GenAI
內(nèi)容字?jǐn)?shù):6916字
引言
隨著科技的飛速發(fā)展,人工智能(AI)在各個(gè)領(lǐng)域的應(yīng)用越來(lái)越廣泛,尤其是在編程和數(shù)學(xué)等領(lǐng)域。OpenAI近期發(fā)布的o3模型引發(fā)了廣泛關(guān)注,尤其是在編程競(jìng)技平臺(tái)Codeforces和SWE-bench中的卓越表現(xiàn),預(yù)示著未來(lái)程序員職業(yè)可能面臨巨大的挑戰(zhàn)。
1. o3模型的重大突破
o3模型在編程競(jìng)技平臺(tái)Codeforces中排名第175,擊敗了99.9%的程序員,顯示出其在編程能力方面的強(qiáng)大。這一成績(jī)遠(yuǎn)超之前的版本,如GPT-4o和o1,使得o3成為頂尖程序員的代表。
2. 在實(shí)際軟件工程中的應(yīng)用
SWE-bench測(cè)試反映了o3在解決實(shí)際軟件工程問(wèn)題中的能力,其準(zhǔn)確率達(dá)到了71.7%。這意味著,o3能夠?yàn)榇蠹s70%的工程問(wèn)題生成有效的代碼補(bǔ)丁,極大地減少了人類程序員的工作需求。
3. 數(shù)學(xué)能力的提升
o3在數(shù)學(xué)測(cè)試中也表現(xiàn)優(yōu)異,AIME 2024測(cè)試得分為96.7%,而在ARC-AGI和FrontierMath等高級(jí)數(shù)學(xué)推理測(cè)試中,o3的得分分別達(dá)到了87.5%和25.2%,顯示出其在復(fù)雜數(shù)學(xué)問(wèn)題上的潛力。
4. 提升的成本與思考時(shí)間
盡管o3展現(xiàn)出強(qiáng)大的能力,但其研發(fā)成本也非常高,是OpenAI見(jiàn)過(guò)的最昂貴的模型。此外,o3的思考時(shí)間顯著增加,o3 mini版本的平均思考時(shí)間達(dá)到了23.33秒,說(shuō)明模型在處理問(wèn)題時(shí)需要更多時(shí)間。
5. o3 mini的發(fā)布預(yù)告
令人振奮的是,o3 mini預(yù)計(jì)將在明年一月底發(fā)布,將開(kāi)放API調(diào)用,并具備o1的所有功能。這一版本的發(fā)布將進(jìn)一步推動(dòng)AI在編程和其他領(lǐng)域的應(yīng)用。
結(jié)論
o3的發(fā)布標(biāo)志著AI在編程和數(shù)學(xué)領(lǐng)域的重大進(jìn)步,未來(lái)可能對(duì)程序員職業(yè)產(chǎn)生深遠(yuǎn)影響。這不僅讓我們對(duì)AI的能力有了新的認(rèn)識(shí),也促使我們思考人類在未來(lái)職場(chǎng)中的角色與定位。
聯(lián)系作者
文章來(lái)源:智猩猩GenAI
作者微信:
作者簡(jiǎn)介:智猩猩旗下公眾號(hào)之一,深入關(guān)注大模型與AI智能體,及時(shí)搜羅生成式AI技術(shù)產(chǎn)品。