苹果应用商店下载量超越ChatGPT，DeepSeek究竟何方神圣？

中国AI初创公司深度求索（DeepSeek）推出的人工智能助手登顶苹果应用商店免费下载榜单，打败一众AI巨头。其推理模型DeepSeek-R1在多项测试中脱颖而出，训练成本却仅为ChatGPT的几十分之一。

https://p.dw.com/p/4pglR

图为DeepSeek应用图标 — 中国AI初创公司深度求索（DeepSeek）推出的人工智能聊天机器人登顶苹果应用商店下载榜，打败一众AI巨头图像来源: CFOTO/picture alliance

（德国之声中文网）就在特朗普宣布5000亿美元投资人工智能领域之际，中国AI初创公司深度求索（DeepSeek）于本周一（1月27日）推出了两个新的AI语言模型：DeepSeek-R1-Zero和DeepSeek-R1。据公司透露，这些模型在某些基准测试中的表现卓越，性能直接对标OpenAI的o1正式版。而其价格仅为o1的几十分之一，且以开源形式向全球开发者开放。

与大多数传统大型语言模型（LLM）不同，DeepSeek-R1采用了一种被称为“模拟推理”（simulated reasoning）的方法。模拟了类似人类的思维链，采用长链推理（Chain-of-Thought， CoT）技术，能够逐步分解复杂问题，并通过多步骤逻辑推理解决问题。这一过程比典型的语言模型耗时更多，但在处理数学、物理和自然科学领域的任务时，能显著提高结果的准确性。

OpenAI的o1模型是2024年9月推出，是首个采用此种方法的OpenAI模型。

令人瞩目的测试成绩

DeepSeek通过多种基准测试评估了其模型性能。

在数学测试Aime 2024中，DeepSeek-R1取得了79.8%的成绩，略高于OpenAI的79.2%。

在Math-500基准测试中，该模型的准确率达到97.3%，超越了所有其他测试系统。

在编程能力测试SWE-bench Verified中，DeepSeek-R1的得分为49.2%，展现了专家级的编程能力。

在常识测试MMLU和GPQA Diamond中，该模型的准确率分别为90.8%和71.5%。在写作和问答基准测试AlpacaEval 2.0中，该模型的胜率达到87.6%。

不过，上述测试结果尚未得到独立验证，因此必须谨慎解读。

该模型数据库使用截至2024年7月的信息进行训练。与OpenAI当前的模型类似，DeepSeek 还可以根据需要整合来自网络的更新信息。但其并不具备生成图像的功能。

人工智能会犯错吗？

开放许可

与硅谷竞争对手开发的专有大语言模型（LLM）不同，DeepSeek是开源的，这意味着任何人都可以访问其应用程序代码，了解其工作原理，并自行进行修改。

其推理模型DeepSeek-R1遵循MIT License开源协议，允许用户自由使用、修改，包括用于商业目的。

“我们正处于一个由非美国公司保持OpenAI最初使命的时代——真正开放的、前沿的研究，赋与所有人权力。”英伟达（Nvidia）高级研究经理Jim Fan在社交平台X上写道。

DeepSeek表示，它“在开源模型中名列前茅”，并且“可与全球最先进的闭源模型相媲美”。

Scale AI创始人Alexandr Wang在X上写道，“DeepSeek给美国敲响了警钟。”

性价比高

DeepSeek-R1的最大版本包含6710亿个参数。公司还提供了多个简化版本，参数范围从15亿到700亿不等，其中最小的版本甚至可以在笔记本电脑上运行。

在商业领域，DeepSeek以极具竞争力的价格进入市场。相比OpenAI的o1版本每生成100万词元（token）需支付60美元，DeepSeek仅需2.19美元，价格仅为前者的5%。

但有限制

然而，DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定，人工智能系统需体现“社会主义核心价值观”。

这就意味着，与百度的“文心一言”（Ernie Bot）等其他中国聊天机器人一样，DeepSeek对政治敏感话题（如天安门事件或台湾独立国家地位等）有限制。例如，当被问及中国领导人习近平或北京在新疆的政策时，它会建议“谈论其他事情”。

测试中，德语版DeepSeek对相关政治敏感问题提供了类似ChatGPT的详细回答。然而，当用英语提问时，AI更倾向于转移话题。

根据ArsTechnica的报道，通过本地部署而非云端版本运行该系统时，可完全绕过政治过滤功能，这得益于其开源许可模式。

香港科大推出AI讲师爱因斯坦亲自授课

极低的训练成本

令人惊讶的是，DeepSeek的开发成本远低于预期。据Jim Fan 称，DeepSeek用了两个月时间，花费 558 万美元训练了其基础模型（V3）。与美国科技巨头在AI领域投入的数十亿美元相比，只能算是九牛一毛。
另外，据新浪财经报道，DeepSeek购买了1万多块英伟达GPU，随后又扩大到5万块。这与OpenAI、谷歌、Anthropic等领先AI实验室动辄超过50万块GPU相比，投入成本低到惊人。

而分析人士一直认为，美国在生产高性能芯片上的关键优势，以及阻止中国获取相关技术的能力，将使其在AI竞赛领域占据上风。

随着DeepSeek的强势崛起，美国和日本主要科技公司股价纷纷下跌。

芯片制造巨头英伟达——世界主要人工智能硬件和软件供应商——上周五在华尔街收盘时下跌超过3%。而日本软银公司——该公司是特朗普宣布的一项5000亿美元AI基础设施建设计划的主要投资者之一——周一股价下跌超过8%。

特朗普的亲密顾问、风险投资家马克·安德森（Marc Andreessen）将其称为“AI的斯普特尼克时刻”（Sputnik moment），指的是当年苏联卫星发射引发美苏太空竞赛。

“DeepSeek R1 是我见过的最令人惊叹和印象深刻的突破之一，” 安德森在社交平台X（前推特）上写道。

担心AI抢饭碗? 教你如何利用AI提升实力

DeepSeek是谁？

DeepSeek是一家位于中国杭州市的人工智能技术研究初创公司“深度求索”。杭州以科技公司密集而闻名。其开发的程序DeepSeek既可以作为APP使用，也可以在桌面端运行。它能够完成许多AI助手可以做到的事情，比如编写歌词、制定个人发展计划，甚至根据冰箱里的食材写出一份晚餐食谱。

它也可以用多种语言进行交流，但DeepSeek向法新社表示，它在英语和中文上的表现最为出色。

然而，无论是编写复杂的代码还是解决困难的数学问题，业内人士对DeepSeek的能力与竞争对手的接近程度感到惊讶。

Alexandr Wang在接受CNBC采访时表示：“我们发现，DeepSeek是表现最好的，或者至少与最好的美国模型相当。”

中美AI领域竞争加剧

DeepSeek R1的发布正值美国政府加强对中国出口AI技术限制之时。OpenAI等企业已警告称，中国的模型未来可能追赶甚至超越美国。

北京领导层已誓言到2030年成为人工智能技术的全球领导者，并计划在未来几年内投入数百亿美元支持该行业。

目前，包括DeepSeek、阿里巴巴以及Moonshot AI在内的至少三家中国实验室，已推出据称可媲美OpenAI o1的模型。

而DeepSeek的成功也表明，中国企业已经开始克服阻碍其成功的障碍。

乔治梅森大学（George Mason University）AI研究员迪恩·鲍尔（Dean Ball）认为，这一趋势表明，中国开发团队正在迅速接近前沿技术水平。他特别指出，DeepSeek的小型版本R1能够在普通家庭电脑上运行，这将有助于推动AI应用的普及与民主化。

“DeepSeek小型模型的卓越性能意味着强大的推理系统会迅速传播，并能在本地硬件上运行——远离任何集中监管（包括美国的出口管制）的视线。”

（综合报道）

地区

主题

分类

苹果应用商店下载量超越ChatGPT，DeepSeek究竟何方神圣？

令人瞩目的测试成绩

人工智能会犯错吗？

开放许可

性价比高

但有限制

香港科大推出AI讲师爱因斯坦亲自授课

极低的训练成本

担心AI抢饭碗? 教你如何利用AI提升实力

DeepSeek是谁？

中美AI领域竞争加剧

令人瞩目的测试成绩

人工智能会犯错吗？

开放许可

性价比高

但有限制

香港科大推出AI讲师 爱因斯坦亲自授课

极低的训练成本

担心AI抢饭碗? 教你如何利用AI提升实力

DeepSeek是谁？

中美AI领域竞争加剧

相关话题

香港科大推出AI讲师爱因斯坦亲自授课