北京青年报

超越OpenAI o1! DeepSeek-R1升至全球风格控制类第一，“中国模型”震动华尔街

21世纪经济报道 2025-01-26 07:40

距离深度求索推理大模型 DeepSeek-R1 发布已经过去约一周时间。

然而，在海外社交媒体，乃至于华尔街上， DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。

1月24日，在国外大模型排名 Arena 上，DeepSeek-R1 基准测试已经升至全类别大模型第三，其中在风格控制类模型（StyleCtrl）分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分，略超 OpenAI o1 的1352分。

这是继 DeepSeek-V3 在剔除 OpenAI o1 等闭源模型排名开源模型类第一后，DeepSeek-R1 向全球最强 AI 大模型的再一次进击。

就在 Arena 放榜之后，全球关于 DeepSeek 的讨论再次升级。惊叹，溢美，甚至阴谋论都层出不穷。与此同时，美股市场 AI经济的狂欢，也开始在 DeepSeek 的影响下颤动。

美股的警钟

就在 DeepSeek-R1 获得风格控制类模型得分第一之后，鲜有发声的图灵奖得主，Meta AI 首席科学家 Yann LeCun 24日在社交媒体上表示：“当人们看到 DeepSeek 的表现，惊呼‘中国AI正在赶超美国’，但这种解读有误。更准确的结论是：开源模型正在超越闭源系统。DeepSeek的成功得益于开放生态，其创新基于前人成果的持续迭代。

DeepSeek-R1 的发布，宛如一颗沉重的石子打入AI行业与AI投资的湖水之中，甚至开始令越来越多人警觉 AI 投资可能存在的泡沫。

美股大V “THE SHORT BEAR”在社交媒体上表示，DeepSeek 创造了一个 AI 巨头们的痛苦时刻，而投资者必须对此敲响警钟。

“如果击败 OpenAI 所需要的金额是 5500万美元（包括5000个 H800 GPU和500万预训练费用），那么这个行业的商业化会比很多人预想的要快很多。”

该博客还指出：“根据红杉，美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。如果不跟进（投资支出）就会被淘汰，那么大额资本支出以保持竞争力就是必要的——但现在看来，这种冒险行为变得越来越无利可图。”

包括海外媒体 Vital Knowledge，德国世界报知名市场评论员 Holger Zschaepitz，都不约而同地把 DeepSeek 称之为“美国股市最大的威胁”。

海外知名财经博客 Zerohedge 24日撰文，称 DeepSeek 的出现和其廉价的训练成本，正在对美国此前宣布的5000亿美元AI基建计划形成巨大的打击。

网络社群里，越来越多的人把 DeepSeek 的出现与近期英伟达的回调联系在一起。

1月24日，英伟达股价大跌3.12%，报142.62美元/股，创下公司在年初 CES 展产品不及预期表现后的最大跌幅。

人红是非多

DeepSeek 火到什么程度？海外社交媒体已经对其进行“花式赞美”，称其不仅成本便宜，甚至只不过是一家对冲基金（幻方量化）的副产品。

当然，人红是非多——一个侧写来自于关于DeepSeek阴谋论的不断出现：一部分北美AI从业者普遍不相信 DeepSeek 的预训练费用只有区区不到 550 万美元。

一个极端例子是 AI 科技初创公司 Scale AI 创始人 Alexandr Wang——其在2025年达沃斯论坛上接受采访时，在未经任何证实的情况下声称 DeepSeek 囤有五万张英伟达 H100 GPU，但因为芯片禁运并未对外公布。

也有AI行业人士怀疑，DeepSeek可能存在过度拟合基准测试，在实际使用中可能会表现不佳。

“让硅谷的AI模型创业者相信这些数字是不现实的，许多人一年的工资都比 DeepSeek 的训练费用高。”有人对此评论道。

好在，DeepSeek 选择了最为开放的 MIT 标准作为开源协议。训练成本是否真的如此之低，有待公论。

近期，一则来自 Meta 匿名员工的消息称，Meta 内部近日启动了一项通过 DeepSeek 开源论文复现其大模型的工作，试图挖掘其是否真的只需要极低的预训练成本。

而届时，DeepSeek 是否真的能改变整个AI经济的模型架构，可能将会有一个分晓。

编辑/樊宏伟