拾象科技李廣密:對 DeepSeek 和智能下半場的幾條判斷
DeepSeek 雖然沒有發明新范式,但推進整個行業進入了新范式。
原標題:拾象科技李廣密:對 DeepSeek 和智能下半場的幾條判斷
文章來源:Founder Park
內容字數:9274字
DeepSeek:AI下半場的開端與未來展望
本文總結了近期關于DeepSeek的討論,并展望AI領域未來的發展方向。DeepSeek的出現,被認為是AI發展進入“下半場”的重要標志,引發了業界廣泛關注和熱議。文章從多個角度分析了DeepSeek的影響,并提出了對未來AI突破方向的思考。
1. DeepSeek與行業巨頭:DeepSeek在技術能力上已超越Meta Llama,但與OpenAI、Anthropic和Google等第一梯隊相比仍有差距。DeepSeek的成功并非范式級創新,而是將OpenAI o1的RL范式開源,極大提升了該范式的普及率。在Transformer架構下超越第一梯隊存在難度,未來突破有賴于下一代智能架構的出現。
2. DeepSeek開啟新范式:雖然DeepSeek并非發明新范式,但它成功地將RL和test time compute范式推向大眾,促進了更多AI研究人員轉向該方向,加速了行業發展。OpenAI、Anthropic和Google等公司也因此加快了對RL的研究。
3. DeepSeek與Anthropic技術路線差異:Anthropic認為基礎模型和推理模型應處于連續光譜,而非OpenAI的模型系列。Anthropic在預訓練階段就大量使用RL,提升基礎模型能力,而非單純依賴RL提升推理模型。
4. DeepSeek成功的因素:DeepSeek的成功既有必然性,也有偶然性。開源、低成本、聯網+公開CoT以及RL泛化等技術亮點,加上恰當的發布時間和輿論環境,共同造就了DeepSeek的轟動效應。
5. DeepSeek的影響:ToC領域的Chatbot受沖擊最大;To Developer領域影響有限;To Enterprise和To Government領域受影響較小,大型組織的決策更復雜。短期來看,閉源公司受沖擊較大,但長期來看,擁有充裕算力資源的公司將受益。
6. 蒸餾技術:DeepSeek是否在預訓練階段大量使用蒸餾數據,將影響其技術突破的評價。蒸餾技術不太可能在基礎模型層面超越SOTA,但DeepSeek R-1的成功可能與其優秀的Reward model有關。
7. AI領域的護城河:DeepSeek證明了智能技術進步的陡峭性,階段性產品難以形成絕對壁壘。在AI時代,智能創新可能比其他任何形式的創新都更重要。
8. DeepSeek的商業化:DeepSeek尚未決定如何利用當前的流量。這凸顯了將偉大的研究實驗室和偉大的商業公司整合在一起的挑戰。DeepSeek需要權衡短期流量和長期戰略目標。
9. 未來的智能突破:未來的突破可能來自第一梯隊的下一代模型或Agent的落地。擁有優秀人才和充裕資源的組織,更有可能在下一代范式中取得突破。
10. 結語:DeepSeek的出現增強了人們對中國AI人才的信心。未來AI發展需要全球合作,技術無國界。
聯系作者
文章來源:Founder Park
作者微信:
作者簡介:來自極客公園,專注與科技創業者聊「真問題」。