六問 DeepSeek!
原標題:開源大模型 DeepSeek 到底開放了什么?
文章來源:人工智能學家
內容字數:11038字
DeepSeek開源大模型深度解析:開放程度、許可證及合規性
本文深入探討了DeepSeek開源大模型的開源程度、許可證類型及其合規性問題。DeepSeek作為一款性能媲美閉源大模型的開源項目,其開源策略備受關注。
1. DeepSeek的性能與版本迭代
DeepSeek經歷了V2、V2.5、V3、R1-Zero、R1等多個版本迭代。其中,V3版本在多個基準測試中展現出優異性能,甚至與領先的閉源模型相媲美。R1版本則通過強化學習而非監督微調提升了模型能力,在部分測試項中超越了OpenAI的o1模型。
2. DeepSeek的開源許可證
DeepSeek在Hugging Face平臺上開放了68個模型和一個數據集。其中,DeepSeek-R1和DeepSeek-R1-Zero模型采用MIT許可證,其余模型則采用DeepSeek許可證(代碼部分仍為MIT許可證)。此外,DeepSeek還基于Qwen和Llama模型蒸餾出6個模型,其許可證分別為MIT、Apache 2.0和Llama許可證。
3. DeepSeek的開放層級
根據LF AI&Data基金會的模型開放框架(MOF),DeepSeek的開放層級尚未達到最高級別。DeepSeek開放了模型架構、模型卡、模型參數、技術報告和評估結果等,但并未開放訓練代碼、推理代碼、評估代碼和數據集等關鍵組件。
4. DeepSeek的使用和分發限制
除R1系列模型外,其他DeepSeek模型受DeepSeek許可證約束,該許可證基于負責任人工智能許可證(RAIL)設計,包含諸多使用限制,例如禁止用于軍事用途、生成虛假信息、歧視特定群體等。而MIT許可證下的R1模型則沒有這些限制。值得注意的是,DeepSeek許可證中明確指出數據未獲得許可。
5. DeepSeek的知識產權許可
DeepSeek許可證授予用戶永久、全球、非排他、免費、免版稅、不可撤銷的版權和專利許可(專利許可存在例外情況)。這些條款與常見的Apache 2.0許可證類似。
6. DeepSeek模型的分發條件
分發DeepSeek模型需遵守多項條件,包括將使用限制納入法律協議、提供DeepSeek許可證副本、保留版權聲明等。未遵守這些條件將構成違約或侵權。
7. 蒸餾模型的額外限制
使用DeepSeek基于Qwen和Llama蒸餾的模型,除了需滿足MIT許可證外,還需遵守Qwen的Apache 2.0許可證和Llama許可證,后者包含商業使用限制。
8. DeepSeek的合規性問題
DeepSeek自身可能并未完全遵守其引用的開源許可證,例如未在所有模型分發材料中附帶許可證副本,未充分履行署名義務等。這并不意味著使用者可以忽視許可證要求,反而更應嚴格遵守,以促進負責任的人工智能發展。
總而言之,DeepSeek的開源策略是復雜且多面的。雖然其模型性能出色,但其開源程度和許可證合規性仍需進一步完善。使用者和分發者都應認真理解并遵守相關許可證條款,共同構建負責任的人工智能生態。
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構