未來打工人何去何從
原標題:o3 發布了,摔碎了碼農的飯碗
文章來源:智猩猩GenAI
內容字數:6916字
引言
隨著科技的飛速發展,人工智能(AI)在各個領域的應用越來越廣泛,尤其是在編程和數學等領域。OpenAI近期發布的o3模型引發了廣泛關注,尤其是在編程競技平臺Codeforces和SWE-bench中的卓越表現,預示著未來程序員職業可能面臨巨大的挑戰。
1. o3模型的重大突破
o3模型在編程競技平臺Codeforces中排名第175,擊敗了99.9%的程序員,顯示出其在編程能力方面的強大。這一成績遠超之前的版本,如GPT-4o和o1,使得o3成為頂尖程序員的代表。
2. 在實際軟件工程中的應用
SWE-bench測試反映了o3在解決實際軟件工程問題中的能力,其準確率達到了71.7%。這意味著,o3能夠為大約70%的工程問題生成有效的代碼補丁,極大地減少了人類程序員的工作需求。
3. 數學能力的提升
o3在數學測試中也表現優異,AIME 2024測試得分為96.7%,而在ARC-AGI和FrontierMath等高級數學推理測試中,o3的得分分別達到了87.5%和25.2%,顯示出其在復雜數學問題上的潛力。
4. 提升的成本與思考時間
盡管o3展現出強大的能力,但其研發成本也非常高,是OpenAI見過的最昂貴的模型。此外,o3的思考時間顯著增加,o3 mini版本的平均思考時間達到了23.33秒,說明模型在處理問題時需要更多時間。
5. o3 mini的發布預告
令人振奮的是,o3 mini預計將在明年一月底發布,將開放API調用,并具備o1的所有功能。這一版本的發布將進一步推動AI在編程和其他領域的應用。
結論
o3的發布標志著AI在編程和數學領域的重大進步,未來可能對程序員職業產生深遠影響。這不僅讓我們對AI的能力有了新的認識,也促使我們思考人類在未來職場中的角色與定位。
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下公眾號之一,深入關注大模型與AI智能體,及時搜羅生成式AI技術產品。