1. 跳转至内容
  2. 跳转至主菜单
  3. 跳转到更多DW网站

苹果应用商店下载量超越ChatGPT,DeepSeek究竟何方神圣?

2025年1月27日

中国AI初创公司深度求索(DeepSeek)推出的人工智能助手登顶苹果应用商店免费下载榜单,打败一众AI巨头。其推理模型DeepSeek-R1在多项测试中脱颖而出,训练成本却仅为ChatGPT的几十分之一。

https://p.dw.com/p/4pglR
图为DeepSeek应用图标
中国AI初创公司深度求索(DeepSeek)推出的人工智能聊天机器人登顶苹果应用商店下载榜,打败一众AI巨头图像来源: CFOTO/picture alliance

(德国之声中文网)就在特朗普宣布5000亿美元投资人工智能领域之际,中国AI初创公司深度求索(DeepSeek)于本周一(1月27日)推出了两个新的AI语言模型:DeepSeek-R1-Zero和DeepSeek-R1。据公司透露,这些模型在某些基准测试中的表现卓越,性能直接对标OpenAI的o1正式版。而其价格仅为o1的几十分之一,且以开源形式向全球开发者开放。

与大多数传统大型语言模型(LLM)不同,DeepSeek-R1采用了一种被称为“模拟推理”(simulated reasoning)的方法。模拟了类似人类的思维链,采用长链推理(Chain-of-Thought, CoT)技术,能够逐步分解复杂问题,并通过多步骤逻辑推理解决问题。这一过程比典型的语言模型耗时更多,但在处理数学、物理和自然科学领域的任务时,能显著提高结果的准确性。

OpenAI的o1模型是2024年9月推出,是首个采用此种方法的OpenAI模型。

令人瞩目的测试成绩

DeepSeek通过多种基准测试评估了其模型性能。

在数学测试Aime 2024中,DeepSeek-R1取得了79.8%的成绩,略高于OpenAI的79.2%。

在Math-500基准测试中,该模型的准确率达到97.3%,超越了所有其他测试系统。

在编程能力测试SWE-bench Verified中,DeepSeek-R1的得分为49.2%,展现了专家级的编程能力。

在常识测试MMLU和GPQA Diamond中,该模型的准确率分别为90.8%和71.5%。在写作和问答基准测试AlpacaEval 2.0中,该模型的胜率达到87.6%。

不过,上述测试结果尚未得到独立验证,因此必须谨慎解读。

该模型数据库使用截至2024年7月的信息进行训练。与OpenAI当前的模型类似,DeepSeek 还可以根据需要整合来自网络的更新信息。但其并不具备生成图像的功能。

人工智能会犯错吗?

开放许可

与硅谷竞争对手开发的专有大语言模型(LLM)不同,DeepSeek是开源的,这意味着任何人都可以访问其应用程序代码,了解其工作原理,并自行进行修改。

其推理模型DeepSeek-R1遵循MIT License开源协议,允许用户自由使用、修改,包括用于商业目的。

“我们正处于一个由非美国公司保持OpenAI最初使命的时代——真正开放的、前沿的研究,赋与所有人权力。”英伟达(Nvidia)高级研究经理Jim Fan在社交平台X上写道。

DeepSeek表示,它“在开源模型中名列前茅”,并且“可与全球最先进的闭源模型相媲美”。

Scale AI创始人Alexandr Wang在X上写道,“DeepSeek给美国敲响了警钟。”

性价比高

DeepSeek-R1的最大版本包含6710亿个参数。公司还提供了多个简化版本,参数范围从15亿到700亿不等,其中最小的版本甚至可以在笔记本电脑上运行。

在商业领域,DeepSeek以极具竞争力的价格进入市场。相比OpenAI的o1版本每生成100万词元(token)需支付60美元,DeepSeek仅需2.19美元,价格仅为前者的5%。

但有限制

然而,DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定,人工智能系统需体现“社会主义核心价值观”。

这就意味着,与百度的“文心一言”(Ernie Bot)等其他中国聊天机器人一样,DeepSeek对政治敏感话题(如天安门事件或台湾独立国家地位等)有限制。例如,当被问及中国领导人习近平或北京在新疆的政策时,它会建议“谈论其他事情”。

测试中,德语版DeepSeek对相关政治敏感问题提供了类似ChatGPT的详细回答。然而,当用英语提问时,AI更倾向于转移话题。

根据ArsTechnica的报道,通过本地部署而非云端版本运行该系统时,可完全绕过政治过滤功能,这得益于其开源许可模式。

香港科大推出AI讲师 爱因斯坦亲自授课

极低的训练成本

令人惊讶的是,DeepSeek的开发成本远低于预期。据Jim Fan 称,DeepSeek用了两个月时间,花费 558 万美元训练了其基础模型(V3)。与美国科技巨头在AI领域投入的数十亿美元相比,只能算是九牛一毛。
另外,据新浪财经报道,DeepSeek购买了1万多块英伟达GPU,随后又扩大到5万块。这与OpenAI、谷歌、Anthropic等领先AI实验室动辄超过50万块GPU相比,投入成本低到惊人。

而分析人士一直认为,美国在生产高性能芯片上的关键优势,以及阻止中国获取相关技术的能力,将使其在AI竞赛领域占据上风。

随着DeepSeek的强势崛起,美国和日本主要科技公司股价纷纷下跌。

芯片制造巨头英伟达——世界主要人工智能硬件和软件供应商——上周五在华尔街收盘时下跌超过3%。而日本软银公司——该公司是特朗普宣布的一项5000亿美元AI基础设施建设计划的主要投资者之一——周一股价下跌超过8%。

特朗普的亲密顾问、风险投资家马克·安德森(Marc Andreessen)将其称为“AI的斯普特尼克时刻”(Sputnik moment),指的是当年苏联卫星发射引发美苏太空竞赛。

“DeepSeek R1 是我见过的最令人惊叹和印象深刻的突破之一,” 安德森在社交平台X(前推特)上写道。

担心AI抢饭碗? 教你如何利用AI提升实力

DeepSeek是谁?

DeepSeek是一家位于中国杭州市的人工智能技术研究初创公司“深度求索”。杭州以科技公司密集而闻名。其开发的程序DeepSeek既可以作为APP使用,也可以在桌面端运行。它能够完成许多AI助手可以做到的事情,比如编写歌词、制定个人发展计划,甚至根据冰箱里的食材写出一份晚餐食谱。 

它也可以用多种语言进行交流,但DeepSeek向法新社表示,它在英语和中文上的表现最为出色。

然而,无论是编写复杂的代码还是解决困难的数学问题,业内人士对DeepSeek的能力与竞争对手的接近程度感到惊讶。

Alexandr Wang在接受CNBC采访时表示:“我们发现,DeepSeek是表现最好的,或者至少与最好的美国模型相当。” 

中美AI领域竞争加剧

DeepSeek R1的发布正值美国政府加强对中国出口AI技术限制之时。OpenAI等企业已警告称,中国的模型未来可能追赶甚至超越美国。

北京领导层已誓言到2030年成为人工智能技术的全球领导者,并计划在未来几年内投入数百亿美元支持该行业。

目前,包括DeepSeek、阿里巴巴以及Moonshot AI在内的至少三家中国实验室,已推出据称可媲美OpenAI o1的模型。

而DeepSeek的成功也表明,中国企业已经开始克服阻碍其成功的障碍

乔治梅森大学(George Mason University)AI研究员迪恩·鲍尔 (Dean Ball)认为,这一趋势表明,中国开发团队正在迅速接近前沿技术水平。他特别指出,DeepSeek的小型版本R1能够在普通家庭电脑上运行,这将有助于推动AI应用的普及与民主化。

“DeepSeek小型模型的卓越性能意味着强大的推理系统会迅速传播,并能在本地硬件上运行——远离任何集中监管(包括美国的出口管制)的视线。”

(综合报道)

© 2025年 德国之声版权声明:本文所有内容受到著作权法保护,如无德国之声特别授权,不得擅自使用。任何不当行为都将导致追偿,并受到刑事追究。

德才 德才是德国之声中文网集体笔名之一。@dw_chinese