OpenAI 正式發布了其 o1 模型,該模型已從預覽版升級為核心功能,成為 ChatGPT 平臺的一部分。現在,該模型還具備圖像分析功能,這是一個極具實用性的更新。用戶可以上傳圖片,AI 機器人將對其進行解讀,并提供詳細的建造指導,例如,僅憑一張鳥屋的照片,用戶就能獲得完整的建造計劃。定價體系分為兩個層次:用戶可通過現有的 20 美元每月的 Plus 套餐訪問標準版 o1,而需要更強性能的用戶可以選擇新的 ChatGPT Pro 套餐,每月費用為 200 美元。每月 200 美元的 ChatGPT Pro 專為專業人士和組織設計,他們需要可擴展的研究級 AI 工具。它提供對 OpenAI 最先進功能的無限訪問,包括 o1 推理模型、GPT-4o 的獨家版本和高級語音功能。OpenAI 的聯合創始人兼首席執行官山姆·奧特曼于 2024 年 12 月 5 日上午 10 點太平洋時間在 YouTube 直播中宣布了這一消息。這次活動是 OpenAI 年末“12 天更新”系列的一部分,與圣誕節假期相呼應。為復雜任務提供更多計算能力o1 Pro 版本通過調用額外計算能力,以更高的精度解決復雜問題。據 OpenAI 稱,這種增強模式在數據科學、編程挑戰和法律分析方面表現出色。該公司針對研究人員、工程師等專業人士的需求,專門打造了這一專業級產品,他們需要每天使用 OpenAI 所說的“研究級智能”。測試結果顯示,OpenAI 的數據表明 o1 在多個基準測試中輕松超越了預覽模型和 GPT-4o。新模型在數學競賽、編程挑戰和博士級別科學問題上的表現尤為出色。OpenAI 計劃不久后推出 o1 的 API 版本,開發者將能夠直接利用這些功能。GPT-4o 升級到 o1 后,在編碼任務上的性能提升尤為顯著,部分結果甚至超越了人類專家。OpenAI 計劃不久后推出該模型的 API 版本。專業版憑借其強大的處理能力,全面提升了這些改進,全面超越了標準 o1 模型,表現更加出色。在可靠中,o1 的 Pro 模式設定了極高的標準——要求四個答案全部正確——并且持續超越標準版 o1 和預覽版。更高的準確度,幻覺更少測試結果顯示,o1 的幻覺頻率低于 GPT-4o。在針對 4,000 個基于事實問題的“SimpleQA”測試中,o1 的準確率達到了 47%,超過了 GPT-4o 的 38%,幻覺率從 61%下降到 44%。專注于公眾人物的“PersonQA”測試也取得了類似進步:o1 的準確率提升至 55%(高于 GPT-4o 的 50%),幻覺率從 30%降至 20%。較小的模型——GPT-4-Mini 和 o1-Mini——在準確性方面遇到更多困難,并且比它們的更大版本產生了更多的幻覺。圖片由 OpenAI 提供。OpenAI 將此次改進歸因于其新推出的“思維鏈”訓練方法。這種方法教會模型在作出回應前進行更深入的思考,從而使系統能夠更有效地核實事實,并更快地識別出不可靠的信息。o1 和 ChatGPT Pro 的發布正值人工智能行業競爭日趨激烈之時。中國的競爭對手,包括阿里巴巴和 DeepSeek,推出了諸如 Marco-o1 和 R1-Lite-Preview 等推理模型,發展勢頭迅猛,正通過開源方案對 OpenAI 的領導地位發起挑戰,并在某些第三方基準測試中超越了 o1-preview。這些發展體現了對能夠處理復雜問題解決任務的大型推理模型(LRM)需求的不斷增長。隨著 OpenAI 不斷改進其產品,o1 和 ChatGPT Pro 的推出標志著其在提供易于獲取、性能卓越的 AI 工具方面邁出了重要一步。這些新進展能否幫助 OpenAI 在競爭激烈的市場中保持領先地位,尚需時間驗證。? AI范兒要進“交流群”,請關注公眾號獲取進群方式投稿、需求合作或報道請添加公眾號獲取聯系方式往期推薦點這里??關注我,記得標星哦~點個在看你最好看
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
暫無評論...