Anthropic創(chuàng)始人發(fā)聲:DeepSeek前所未有,美國要繼續(xù)加強出口管制
「我不認為 DeepSeek 本身是對手」
原標題:Anthropic創(chuàng)始人發(fā)聲:DeepSeek前所未有,美國要繼續(xù)加強出口管制
文章來源:Founder Park
內容字數(shù):12339字
Anthropic CEO Dario Amodei關于DeepSeek與美國對華芯片出口管制政策的解讀
近日,美國AI巨頭Anthropic的CEO Dario Amodei發(fā)表了一篇長文,分析了中國AI公司DeepSeek的突破及其對美國對華芯片出口管制政策的影響。文章的核心觀點是:DeepSeek的進展并未削弱出口管制政策的必要性,反而凸顯了其緊迫性。
DeepSeek的突破與成本降低
Amodei認為,DeepSeek在降低成本的同時實現(xiàn)了與美國頂尖AI模型相近的性能,但這并非根本性的突破。DeepSeek的成功主要歸功于工程效率的提升,例如在鍵值緩存和混合專家方法上的改進。他指出,DeepSeek的模型成本降低符合AI領域持續(xù)成本下降的趨勢,并非“以小博大”的奇跡。
人工智能發(fā)展的三大動態(tài)
Amodei闡述了理解AI發(fā)展的三大關鍵動態(tài):規(guī)模定律(模型規(guī)模與性能正相關)、曲線偏移(技術創(chuàng)新降低成本,但公司會將節(jié)省的成本重新投入到更大規(guī)模的模型訓練中)、范式轉變(訓練方法的創(chuàng)新,例如強化學習的應用)。他認為DeepSeek的成功正是這三大動態(tài)共同作用的結果。
DeepSeek模型的分析
Amodei分別分析了DeepSeek的兩個模型:DeepSeek-V3(預訓練模型)和R1(加入強化學習的模型)。他認為V3的成本降低符合預期,性能也與美國公司7-10個月前的模型接近,并非顛覆性創(chuàng)新。R1則是在V3基礎上應用強化學習,與OpenAI的o1模型類似,其成本相對較低。他強調,目前多家公司都能生產類似的推理模型,但隨著規(guī)模的擴大,這種局面將會很快改變。
出口管制政策的必要性
Amodei認為,即使成本持續(xù)下降,各公司在AI模型訓練上的投入仍會持續(xù)增加,因為更智能模型的價值巨大。DeepSeek的效率創(chuàng)新最終會被美國和中國公司應用,導致模型訓練成本繼續(xù)攀升。他預測,在2026-2027年,制造出超越人類智能的AI將需要數(shù)百萬芯片和數(shù)百億美元的投入。出口管制是阻止中國獲得大量芯片,從而避免形成AI領域兩極格局的關鍵。
DeepSeek并非出口管制失敗的證據
Amodei強調,DeepSeek的成功并不意味著出口管制失敗。DeepSeek擁有相當數(shù)量的芯片,其成功一部分源于其工程師的才華和努力。他認為出口管制的作用在于限制中國獲得數(shù)百萬級別的芯片,而非數(shù)萬級。DeepSeek使用的芯片中,一部分是尚未被禁止但應被禁止的,一部分是在禁令前發(fā)貨的,還有一部分可能是走私的,這表明出口管制正在發(fā)揮作用。
結論
Amodei最終重申,DeepSeek的出現(xiàn)并非對出口管制政策的否定,反而凸顯了其在維護美國AI領先地位和國家安全方面的必要性。他認為,放松出口管制的想法是毫無道理的。
聯(lián)系作者
文章來源:Founder Park
作者微信:
作者簡介:來自極客公園,專注與科技創(chuàng)業(yè)者聊「真問題」。