北京青年报

DeepSeek超越ChatGPT，登顶苹果美国区免费APP下载排行榜

澎湃新闻 2025-01-27 09:04

1月27日，由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。

苹果美国区应用商店

苹果APP Store中国区免费榜

Deepseek来自国产大模型公司深度求索，系量化巨头幻方量化旗下大模型公司。1月20日，该公司正式发布推理大模型DeepSeek-R1。一经推出，DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。

作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。目前，在国外大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名已经升至全类别大模型第三，与OpenAI的ChatGPT-4o最新版并列，并在风格控制类模型（StyleCtrl）分类中与OpenAI的o1模型并列第一。

更令市场惊讶的是，据DeepSeek介绍，R1的预训练费用只有557.6万美元，在2048块英伟达H800 GPU（针对中国市场的低配版GPU）集群上运行55天完成，仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示，R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。此外，DeepSeek不仅将R1训练技术全部公开，还蒸馏了6个小模型向社区开源，允许用户借此训练其他模型。

英伟达高级研究科学家Jim Fan表示，DeepSeek-R1可能是“首个展示了RL（强化学习）飞轮可以发挥作用且能带来持续增长的OSS（开源软件）项目”。其中，“飞轮”用来形容AI系统中自我强化、正向循环的过程。DeepSeek的论文显示，不同于过去AI模型往往依赖于监督微调（SFT，指AI模型通过已标注的数据进行训练），R1完全由强化学习驱动，证明了直接强化学习是可行的。

Jim Fan写道：“我们正处于一个奇特的时间线上，一家非美国公司正在践行OpenAI最初的使命，即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”

编辑/樊宏伟