原標題:GPT-4.5被DeepSeek 500倍吊打!基準測試全班墊底,OpenAI痛失護城河
文章來源:新智元
內容字數:7208字
GPT-4.5:OpenAI的“失敗”之作還是另有隱情?
近日,OpenAI發布的GPT-4.5引發了廣泛爭議,不少人將其評價為“失敗之作”,甚至認為OpenAI已失去護城河。本文將對GPT-4.5的評價進行梳理,并探討其背后的原因。
1. GPT-4.5的“失敗”:性能與成本的矛盾
眾多評測結果顯示,GPT-4.5的性能并未超越GPT-4,甚至在一些基準測試中表現更差。一些權威人士如紐約大學教授馬庫斯,直接將其斥為“空心漢堡”。更有AI初創公司CEO指出,GPT-4.5的成本是DeepSeek V3的500倍,性能卻不如后者。這引發了人們對OpenAI成本效益的質疑,以及其技術領先地位是否依然穩固的擔憂。
2. OpenAI的回應:Scaling Law的繼續
面對外界的批評,OpenAI首席研究官Mark Chen表示,GPT-4.5是團隊在無監督學習上的最新擴展實驗,證明了Scaling Law的有效性,并代表著模型規模邁入了新的發展階段。他強調,GPT-4.5的開發并非一帆風順,但其在某些方面仍有改進,例如在創意寫作等領域表現優于推理模型,并且在用戶體驗上也得到了提升。
3. 多方競爭加劇:OpenAI面臨挑戰
除了GPT-4.5自身的爭議,OpenAI還面臨著來自DeepSeek、xAI Grok 3、Anthropic等競爭對手的壓力。DeepSeek的開源策略和價格戰,進一步壓縮了大模型的利潤空間。這使得OpenAI的先發優勢不再明顯,其商業模式也面臨挑戰。
4. 技術路線之爭:預訓練與推理的并行
OpenAI目前正同時探索預訓練和推理兩種技術路線。GPT-4.5代表了對預訓練的繼續投入,而OpenAI也承認推理能力的提升同樣重要。兩種方法并非相互排斥,而是相輔相成的,預訓練提供知識基礎,推理則在此基礎上進行更高級的思考。
5. OpenAI的未來:挑戰與機遇并存
GPT-4.5的發布引發了對OpenAI的諸多質疑,其高昂的成本和相對有限的性能提升,使其面臨著巨大的商業壓力。然而,OpenAI仍在持續探索大模型的可能性,并積極尋求技術突破。其未來發展,將取決于能否在技術創新和商業模式上找到平衡點。
總而言之,GPT-4.5的發布并非一面倒的失敗,而是引發了對大模型發展方向和商業模式的深刻反思。OpenAI的未來,將取決于其能否應對激烈的市場競爭,并持續推動人工智能技術的發展。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。