高質AI推理模型走向普及。
原標題:重磅!OpenAI推o3-mini新模型,被DeepSeek逼急?定價仍打不過
文章來源:智東西
內容字數:6265字
OpenAI發布全新推理模型o3-mini:性價比之王,挑戰DeepSeek
近日,OpenAI發布了其最新推理模型o3-mini,并將其應用于ChatGPT和API。這款模型被OpenAI譽為其最具成本效益的推理模型,在科學、數學、編程等領域性能顯著提升,同時保持了低成本和低延遲的特點,并支持聯網搜索功能。
1. **o3-mini的主要改進:** o3-mini在多個方面超越了前代模型o1-mini。其在科學、數學、編程基準測試中的得分均有顯著提高,例如在GPQA Diamond(理化生)、AIME 2022-2024(數學)、Codeforces ELO(編程)基準測試中分別取得了0.77、0.80、2036的高分。此外,其響應速度也提升了24%,平均響應時間縮短至7.7秒。 o3-mini還提供低、中、高三個推理能力版本,以滿足不同用戶的需求。高推理能力版本在FrontierMath測試中表現出色,首次嘗試便解決了超過32%的問題。
2. **安全性和成本:** OpenAI聲稱o3-mini在多個安全評估中超越了GPT-4o,在具有挑戰性的安全性和越獄評估方面表現突出。 盡管OpenAI宣稱每個token的價格已降低95%,但o3-mini的API定價仍然高于DeepSeek模型。 據報道,OpenAI可能已花費超過3000萬美元對o3進行基準測試,這凸顯了其模型開發的高昂成本。
3. **商業策略和融資:** o3-mini的發布被認為是OpenAI應對DeepSeek等低成本高性能開源模型的策略之一。 OpenAI正計劃進行新一輪高達400億美元的融資,日本軟銀集團有望成為領投方,這將成為軟銀迄今為止最大的投資之一。 這一舉動也反映了OpenAI在追求高性能的同時,也致力于提升模型的性價比,使高質量的AI更加普及。
4. **o3-mini的應用:** o3-mini已在ChatGPT和API中可用,企業版訪問權限也將很快推出。 它目前不支持視覺功能,開發者仍需使用o1進行視覺推理任務。 o3-mini在Chat Completions API、Assistants API、Batch API中均已推出。
5. **總結:** o3-mini的發布標志著OpenAI在高性價比AI模型領域邁出了重要一步。 它在性能、成本和安全性方面取得了顯著進展,但其高昂的研發成本和與DeepSeek的競爭也引人關注。 未來,高性價比AI推理模型的普及將對AI產業產生深遠的影響。
聯系作者
文章來源:智東西
作者微信:
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。