O3發布引發震動：碼農飯碗遭重創，未來何去何從？

未來打工人何去何從

原標題：o3 發布了，摔碎了碼農的飯碗
文章來源：智猩猩GenAI
內容字數：6916字

隨著科技的飛速發展，人工智能（AI）在各個領域的應用越來越廣泛，尤其是在編程和數學等領域。OpenAI近期發布的o3模型引發了廣泛關注，尤其是在編程競技平臺Codeforces和SWE-bench中的卓越表現，預示著未來程序員職業可能面臨巨大的挑戰。

o3模型在編程競技平臺Codeforces中排名第175，擊敗了99.9%的程序員，顯示出其在編程能力方面的強大。這一成績遠超之前的版本，如GPT-4o和o1，使得o3成為頂尖程序員的代表。

SWE-bench測試反映了o3在解決實際軟件工程問題中的能力，其準確率達到了71.7%。這意味著，o3能夠為大約70%的工程問題生成有效的代碼補丁，極大地減少了人類程序員的工作需求。

o3在數學測試中也表現優異，AIME 2024測試得分為96.7%，而在ARC-AGI和FrontierMath等高級數學推理測試中，o3的得分分別達到了87.5%和25.2%，顯示出其在復雜數學問題上的潛力。

盡管o3展現出強大的能力，但其研發成本也非常高，是OpenAI見過的最昂貴的模型。此外，o3的思考時間顯著增加，o3 mini版本的平均思考時間達到了23.33秒，說明模型在處理問題時需要更多時間。

令人振奮的是，o3 mini預計將在明年一月底發布，將開放API調用，并具備o1的所有功能。這一版本的發布將進一步推動AI在編程和其他領域的應用。

o3的發布標志著AI在編程和數學領域的重大進步，未來可能對程序員職業產生深遠影響。這不僅讓我們對AI的能力有了新的認識，也促使我們思考人類在未來職場中的角色與定位。

文章來源：智猩猩GenAI
作者微信：
作者簡介：智猩猩旗下公眾號之一，深入關注大模型與AI智能體，及時搜羅生成式AI技術產品。

文章版權歸作者所有，未經允許請勿轉載。

暫無評論...