DeepSeek開源超強推理模型。

原標題:驚爆老外的DeepSeek-R1到底多強?實測高考真題,仍存4個短板
文章來源:智東西
內容字數:5780字
DeepSeek-R1:一款爆火的開源推理模型
近日,DeepSeek-R1模型開源,在AI圈引發熱烈反響。其GitHub論文收藏量迅速突破5000,并在多個平臺引發超過萬次的互動。本文將對DeepSeek-R1的性能、優勢及不足進行總結。
1. 強大的推理能力與高效性
DeepSeek-R1展現出強大的推理能力,能夠快速解決復雜的理科和文科問題。例如,它可在80多秒內解答高考壓軸題,9分鐘內生成用于解釋量子力學概念的動畫代碼,并輕松應對腦筋急轉彎和歷史問題。其推理過程自然流暢,并會使用一些口語化的表達,例如“Yeah, that works!”。與前代模型DeepSeek-V3相比,DeepSeek-R1的回答更全面、詳實且論證充分,通常以結構化方式呈現,并補充大量有啟發性的背景信息。在數學、代碼和自然語言推理等任務上,其性能與OpenAI o1不相上下。
2. 開源與低成本優勢
DeepSeek-R1的開源性質使其獲得廣泛關注。它不僅開源了模型本身(正式版+6款蒸餾模型),還公開了所有訓練細節和方法,這在業界非常罕見。 其MIT協議開源許可,允許商用和模型蒸餾,進一步降低了使用門檻。 此外,DeepSeek-R1的API接口價格極低,僅為OpenAI o1的3.7%。
3. 模型的不足與未來展望
盡管DeepSeek-R1表現出色,但仍存在一些不足。其通用性、多語言能力、提示工程和軟件工程能力有待提升。在函數調用和復雜角色扮演等任務上的表現尚未達到預期。 此外,模型對英文優化較好,使用其它語言進行提問會降低效率。少樣本提示有時反而會影響其性能。 DeepSeek團隊計劃通過長思維鏈技術、異步評估等方法來改進這些不足。
4. 總結:中國開源AI的崛起
DeepSeek-R1的出現展現了中國開源AI力量的崛起。其強大的性能、低廉的價格和開放的許可協議,使其有望在全球AI領域產生重大影響,并從全球開源社區獲得持續改進。
聯系作者
文章來源:智東西
作者微信:
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。

粵公網安備 44011502001135號