1. 跳转至内容
  2. 跳转至主菜单
  3. 跳转到更多DW网站

DeepSeek用“蒸馏术”构建OpenAI竞争模型?专家:很难制止

2025年1月30日

DeepSeek最新AI模型“价廉物美”,引发科技界震荡。但OpenAI本周三称,有证据表明DeepSeek使用OpenAI专有模型来训练自己的模型,并暗示这可能违反了OpenAI服务条款。美商务部长提名人卢特尼克指责DeepSeek似乎盗用了美国的人工智能技术。新闻可靠性评级机构NewsGuard 称,Deepseek-V3识别假新闻只有17%的准确率。

https://p.dw.com/p/4ppqU
OpenAI称,发现有证据表明DeepSeek使用OpenAI的专有模型来训练自己的模型
OpenAI称,发现有证据表明DeepSeek使用OpenAI的专有模型来训练自己的模型图像来源: Andy Wong/AP Photo/picture alliance

(德国之声中文网)中国AI大模型初创公司DeepSeek(深度求索)1月20日免费开源的一款 DeepSeek-R1推理模型震惊了科技界和政界。该公司称这款新的AI模型性能足以媲美美国顶尖产品,但投资成本却低得多——仅557.6万美元,是OpenAI GPT-4o模型训练成本的不到十分之一。该公司还称,它使用是芯片是英伟达相对低端的芯片及其他低端进口芯片。

DeepSeek的这款AI聊天应用迅速登顶苹果中国和美国应用商店免费APP下载排行榜,同时引发市场对美国在AI领域竞争力的担忧、对美国企业投入天量资金研发AI合理性及这些公司发展前景的质疑,以及对美国对中国的芯片出口管制究竟有没有效的质疑,令美国科技公司股价大幅下挫。美国总统特朗普形容DeepSeek为美国业界“敲响警钟”,并提醒美国要“全力专注于在竞争之中取胜”。

对DeepSeek成本与芯片的质疑

不过,在一些媒体和专家把DeepSeek的“横空出世”称为AI界的“史普尼克时刻”之际,也有声音质疑DeepSeek所公布的开发成本以及所用芯片的规格与数量。

上周,美国人工智能数据服务公司Scale AI首席执行官汪滔 (Alexandr Wang) 在接受 CNBC 采访时对 DeepSeek的说法表示怀疑,称“这款产品的背后,可能使用了数万颗Nvidia(英伟达)的H100芯片”。他说,“DeepSeek显然拥有50,000颗H100芯片,但他们显然不能公开这些信息,因为那会违反美国的出口管制。”汪滔没有为他的说法提供证据。

亿万富翁埃隆·马斯克支持对DeepSeek持怀疑态度的人。他在X上有关亚历山大·王上述说法的帖子下跟帖写道:“显然”(Obviously)。

英伟达(Nvidia)的H100芯片是目前市场上最先进的AI训练芯片之一,但根据美国政府的出口管制政策,H100芯片是不能向中国公司销售的。

DeepSeek蒸馏提炼违反OpenAI条款?

DeepSeek也被一些技术专家怀疑其模型可能从美国先进的模型中学习到了部分成果,即采用了所谓的“蒸馏技术”。该技术是指通过从更成熟、更强大的人工智能模型中提炼数据来训练新的AI模型,由旧模型评估新模型得出的答案的质量,从而有效地转移旧模型所掌握的学习成果。这意味着新模型可以从旧模型中获益,而无需承担构建旧模型所投入的大量时间、算力等成本。

1月29日,OpenAI称,发现有证据表明DeepSeek使用OpenAI的专有模型来训练自己的模型,并暗示这可能违反了OpenAI的服务条款。不过,OpenAI没有进一步列举掌握了哪些证据。OpenAI的服务条款规定,用户可以使用OpenAI的API输出接口将其AI技术与自己的应用程序相结合,但禁止用户“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。用蒸馏输出构建竞争模型涉嫌违反 OpenAI服务条款。OpenAI表示,它将与美国政府合作保护美国技术,但没有详细说明如何合作。

DeepSeek冲击波:中国AI技术赶上美国?

美国商务部长提名人誓言要实施限制

特朗普总统提名的商务部长霍华德·卢特尼克 (Howard Lutnick) 1月29日在在参议院的确认听证会上表示,DeepSeek似乎盗用了美国的人工智能技术,并誓言要加强限制。他说,““我认为他们(中国)只关心自己,并试图伤害我们。因此,我们需要保护自己。”卢特尼克还表示:”我们必须停止帮助他们(中国公司)。Meta的开放平台让DeepSeek可以依靠。他们购买了大量英伟达的芯片,并找到了绕过(美国相关限制)的方法,推动了他们的DeepSeek模式。这一切必须结束。如果他们要与我们竞争,那就让他们竞争,但不要再利用我们的工具与我们竞争了。”

白宫的人工智能和加密沙皇大卫·萨克斯 (David Sacks) 也在周二接受福克斯新闻采访时对 DeepSeek的模型蒸馏表示担忧。

专家:阻止“蒸馏”非常困难

技术专家表示,阻止模型蒸馏可能非常困难,甚至不可能。

人工智能计算公司Groq的首席执行官乔纳森·罗斯 (Jonathan Ross) 表示,该公司已采取措施阻止所有中国IP地址访问其云端存储,以阻止中国公司利用其托管存储的人工智能模型。但是,“这是不够的,因为人们可以找到绕过它的方法”,罗斯说。“这将是一场猫捉老鼠的游戏……我不知道解决方案是什么。如果有人想出办法,请告诉我们,我们会实施。”

China Peking 2025 | Smartphone App DeepSeek
DeepSeek将会给世界带来哪些改变?图像来源: China DeepSeek AIThe smartphone apps DeepSeek page is seen on a smartphone screen in Beijing, Tuesday, Jan. 28, 2025. (AP Photo/Andy Wong)Mediennummer504473561BeschreibungThe smartphone apps DeepSeek page is seen on a smartphone screen in Beijing, Tuesday, Jan. 28, 2025. (AP Photo/Andy Wong)Aufnahmedatum28.01.2025Bildnachweispicture alliance / ASSOCIATED PRESS | Andy Wong

DeepSeek的一项创新是开辟了从一个更大、更强大的模型中获取相对较少的数据样本(不到一百万个)来显著提高较小模型能力的思路。这一新思路可能引来大量初创公司的效仿。

DeepSeek的数据保护引发担忧

德国数据保护机构则希望对DeepSeek在数据保护方面的问题进行审查。DeepSeek的数据保护指南规定,该应用程序会收集大量信息——从IP地址、聊天记录到上传的文件,甚至按键的模式和节奏。鉴于成百上千万人的数据面临高风险,德国有关当局希望了解“哪些个人数据是从哪些来源收集的,以及用于什么目的”。

就在本周三,以色列网络安全公司Wiz发现DeepSeek发生数据泄露。超过一百万条数据记录,包括数字软件密钥和聊天记录,被意外地暴露在不安全的互联网上。这些敏感数据还包括用户对免费AI助手的请求。Wiz联合创始人鲁特瓦克(Ami Luttwak) 称,DeepSeek 立即做出了回应, “在不到一小时的时间内就将其删除。”不过,卢特瓦克表示,“这些数据那么容易被找到,我们相信我们不是唯一发现它的人。”

NewsGuard:Deepseek-V3在虚假新闻传播测试中表现差

新闻可靠性评级服务机构NewsGuard本周三公布的可信度排名报告指出,Deepseek-V3在Newsguard关于虚假新闻传播和检测的测试中表现不佳。Newsguard是在没有互联网连接的情况下对Deepseek-V3进行的测试。在53%的案例中,Deepseek-V3回避问题,30%重复假新闻,导致失败率高达83%,排名倒数第二。
相比之下,ChatGPT-4o、Claude 和 Gemini 2.0 等十大聊天机器人的平均失败率为62%。

据《新闻卫士》报道,令人震惊的是,Deepseek-V3经常在未经询问的情况下重复中国政府的立场——即使是在与中国无关的问题上,在某些情况下甚至使用“我们”的形式来表达北京的观点。

和其他中国人工智能模型一样,该系统对一些虚假新闻并不驳斥或质疑,而是回避问题并转述中国官方的声明。

(路透社等)

© 2025年德国之声版权声明:本文所有内容受到著作权法保护,如无德国之声特别授权,不得擅自使用。任何不当行为都将导致追偿,并受到刑事追究。