編寫一個 Python 腳本,讓一個球在某個形狀內彈跳

原標題:o3-mini 碾壓DeepSeek R1?一條python程序引發近400萬圍觀
文章來源:機器之心
內容字數:4083字
OpenAI o3-mini強勢來襲,與DeepSeek R1展開激烈對決
近日,OpenAI發布全新推理模型系列o3-mini,其成本降低至o1系列的1/15,并首次向免費用戶開放。這一舉動打破了DeepSeek R1此前在大模型圈的統治地位,引發網友熱議。
DeepSeek R1的輝煌與挑戰
此前,DeepSeek R1在“編寫球在旋轉形狀內彈跳的Python腳本”任務中擊敗了OpenAI o1 pro、Claude 3.5 Sonnet和谷歌Gemini 1.5 Pro等模型,風靡全球。然而,o3-mini的出現改變了這一局面。
o3-mini的強勢表現
在相同的“球在旋轉六邊形內彈跳”任務中,o3-mini展現出更優秀的碰撞、彈跳效果,對重力和摩擦力的理解也更為準確。在模擬球在四維超立方體內部彈跳的任務中,o3-mini也表現出更穩定的幾何結構和更靈活的軌跡,而DeepSeek R1則出現了一些詭異的和形狀簡化的問題。
多場景測試對比
AIGC從業者@myapdx使用更復雜的“100個小球在旋轉球體內部彈跳”任務進行測試,o3-mini完美滿足了所有要求,DeepSeek R1的表現也不差。測試結果顯示,o3-mini在理解真實世界物理規律方面表現出色,尤其在對重力、摩擦力等物理狀態的“世界模型”理解上有所突破。
DeepSeek R1的不足與猜測
一些網友指出DeepSeek R1在某些測試中只生成一個球,可能是因為模型“想得太多”。OpenAI也在發布博客中提到,o3-mini在博士級科學問題上的表現優于o1系列。
結論
o3-mini的出現標志著大模型在理解物理規律方面取得了顯著進展。雖然DeepSeek R1仍具備競爭力,但o3-mini在某些特定任務上的表現更為出色,這場大模型之間的較量仍在繼續。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺

粵公網安備 44011502001135號