
最近,DeepSeek 被指控“窃取”美国大模型的技术,微软和 OpenAI 甚至展开了调查,怀疑 DeepSeek 通过 API 大量提取数据,可能违反 OpenAI 的服务条款。每次听到这样的指控,都觉得有些无奈——AI 研究本来就是站在前人肩膀上,谁的模型不是基于已有的研究成果发展而来?
这就像一个学生认真学习老师的知识,考试拿了高分,难道就能说他“抄袭”了老师?DeepSeek 如果只是利用 OpenAI 的 API 训练自己的模型,本质上是一种公开学习方式,而非技术“窃取”。更何况,OpenAI 和 Meta 的模型本身也是依赖互联网上的各种数据训练出来的,其中很多数据本就存在版权争议,他们自己也陷入了一堆官司。
模型蒸馏:站在巨人的肩膀上,关键还是创新
DeepSeek 可能采用了 知识蒸馏(Knowledge Distillation) 技术,这是一种常见的 AI 训练方法,其原理是让大模型(教师模型)生成数据,再用这些数据训练一个更小的模型(学生模型)。这样,学生模型能以更少的计算资源,接近教师模型的表现。
如果把 AI 训练比作学习过程,蒸馏的逻辑就像“师徒制”——学生向老师学习思路和方法,但最终能否超越老师,取决于自身的创新能力。历史上,大部分学生都无法超越老师,偶尔有几个天才能青出于蓝。而 DeepSeek 的 MoE(混合专家模型),就是其核心创新点。它通过只激活部分专家组来降低计算成本,使模型推理更高效,这已经远远超出单纯“模仿”ChatGPT 的范畴。
法律风险:蒸馏不等于侵权,关键在数据来源
关于蒸馏是否构成侵权,目前全球并没有明确的司法裁决。大部分 AI 相关的知识产权争议,主要围绕 训练数据的版权问题,例如 Getty Images 起诉 Stability AI 盗用图片训练模型,而不是围绕“蒸馏”本身。
从法律角度来看,蒸馏的合规性取决于 数据的来源:
1. 如果数据是公开的(如 Wikipedia、开源论坛),则完全合法。
2. 如果是自建数据,也没有问题,比如 DeepSeek 自己收集、标注数据进行训练。
3. 如果数据来自 API,则需要看 API 的使用条款。如果 OpenAI 禁止 API 输出的数据用于训练新模型,而 DeepSeek 通过 API 获取了大量数据并用于训练,可能违反 OpenAI 的服务条款,但这属于 合同违约,而非 技术窃取。
换句话说,如果 DeepSeek 真的超出了 API 允许的使用范围,OpenAI 最多可以起诉其 违约,而不是 偷技术。这就像有人用别人的 Netflix 账号看剧,违反了 Netflix 的使用协议,但不能说他“偷”了 Netflix 的影视技术。
AI 竞争的真正焦点:技术还是市场?
无论 DeepSeek 采用了何种训练方式,它的出现已经远超技术本身,而是对 OpenAI 乃至整个 AI 市场形成了实质性冲击。DeepSeek 免费开源,让 AI 变得更可及,而 OpenAI 作为闭源商业化公司,则面临更大的竞争压力。
事实上,这种“技术封锁”在历史上并不陌生:
• 20 年前,西方说“中国人造不出 5G”,结果华为成为全球 5G 领导者。
• 10 年前,他们嘲笑“中国手机只会山寨”,今天小米、华为、OPPO 已在全球市场占据重要地位。
• 今天,他们说“中国 AI 只是模仿”,但 DeepSeek 已经在技术创新、开源共享和市场竞争上形成了自己的特色。
无论外界如何质疑,中国 AI 产业的步伐不会停下。DeepSeek 的问世,带来了四大震撼:
1. 英伟达的算力霸权可能受到冲击——如果低成本 AI 可行,算力需求可能被重塑。
2. 华为昇腾芯片迎来机会——国产 AI 训练需求上升,算力自主成为可能。
3. 美国 AI 企业的市值可能受到影响——资本市场或重新评估 AI 公司的价值。
4. 全球 AI 领域的领导权或将重新洗牌——AI 的未来不再只是美国科技公司的游戏。
结语:创新才是 AI 竞赛的核心
蒸馏技术并不等于“窃取”,DeepSeek 也不是简单的“ChatGPT 复制品”。真正的 AI 竞赛,不是围绕数据来源的争论,而是比拼谁能做出 更高效、更智能、更低成本的模型。DeepSeek 用 MoE 技术在推理效率上做出了突破,未来还会有更多创新。
历史已经证明,中国科技产业能在封锁中成长,能在挑战中突破。20 年前,我们解决了 5G,10 年前,我们做出了全球领先的智能手机,今天,我们在 AI 领域开始站稳脚跟。DeepSeek 只是一个开始,中国 AI 产业的未来,才真正值得期待。