北京青年报

国产大模型，烧出个未来？

中国基金报 2024-06-30 18:42

OpenAI的一个动作，国内大模型厂商又卷起来了。

OpenAI近日推送的邮件信息显示，自7月9日起，OpenAI将采取额外措施，阻止来自不在OpenAI支持的国家和地区列表中的API（应用程序编程接口）流量。

随后，包括百度、商汤、智谱AI在内的多家大模型公司宣布提供“零成本”迁移服务。

与此前“大降价”抢市场类似，国内大模型厂商依然在“价格战”上打得火热。几乎一夜之间，大家就在“零成本”上达成了共识。

国内大模型从“以分计价”大跨步迈入“以厘计价”，又飞速跃入“免费纪元”。

业内人士分析称，大模型厂商降低使用成本不仅是为了扩大市场份额，也为了吸引更多用户，增加数据收集，繁荣应用场景，推动大模型更好落地。

棋至中局，“卷”低价显然不是破局之道。

如果大模型不能为企业创造业务价值，那么价格无论低到什么程度，都没有企业愿意买单。因此也有人认为，价格战是敲响行业同质化竞争的警钟，新的竞赛逻辑已悄然而至。

“烧钱是共识，但烧钱终究得带来用户增长。这是讲了好多次的故事了，到大模型这里，套路没变。”一位关注大模型领域创业机会的投资人说。

正因如此，大模型厂商的竞争让人感觉愈发熟悉。

地铁站、机场、楼宇电梯，大模型厂商迅速成为街头广告的甲方。不少人坦言，团购、共享单车、网约车的感觉又回来了。

只是，大模型毕竟与共享单车不一样。

无论是ofo，还是摩拜，给消费者提供的服务并不根本不同，可大模型，还远没有到能够让消费者感觉好用的时候。

技术关如果还没过，拼价格，能烧出个未来？

一夜之间，集体免费

随着OpenAI发出的一封邮件，国产大模型厂商纷纷打出“免费牌”，争抢潜在用户。

例如，百度智能云千帆推出大模型普惠计划，帮用户实现0成本切换，还将为新注册企业用户提供0元调用、0元训练、0元迁移、0元服务等服务。

商汤科技也宣布推出大模型“0元购”计划，即日起，成为商汤“日日新SenseNova”新注册企业用户，将获得涉及调用、迁徙、训练等多项免费服务大礼包，商汤将为“日日新SenseNova”新注册企业用户赠送5000万Token（最小数据单元）包，提供从OpenAI到“日日新SenseNova”的迁移系列培训等服务。

智谱AI方面同样表示，将面向OpenAI API用户提供特别搬家计划，为开发者提供1.5亿Token（5000 万 GLM- 4 + 1 亿GLM- 4- Air）和从OpenAI到GLM（智谱AI自研大模型）的系列迁移培训；为高用量客户提供与OpenAI使用规模对等的Token赠送计划（不设上限）、与OpenAI对等的并发规模、匹配高等级会员政策、备案培训和辅助等。

百川智能方面称，将开放平台接口完全兼容OpenAI API；赠送1000万Token；Assistants API免费使用等服务。此外，零一万物宣布发起“Yi API二折平替计划”，面向OpenAI用户推出了平滑迁移至Yi系列大模型的服务。此外，零一万物API还将提供Prompt（提示词）兼容调优服务支持。

“零成本”迁移服务看似仅是争抢OpenAI的客户。可就在一个月前，国内大模型厂商已经掀起了一轮集体降价。

卷到极致是降价

“黑马”DeepSeek-V2大模型以2元/百万输出Tokens的价格，打响国内大模型价格战的“第一枪”。紧接着，智谱AI、字节跳动、阿里云、百度、腾讯云、科大讯飞等大模型厂商纷纷跟进，有的不仅降价，甚至直接免费。

5月6日，幻方量化旗下的DeepSeek-V2率先降价，其API定价仅为GPT-4-Turbo的近1%，每百万输入tokens仅需1元，输出仅需2元。

随后，智谱AI将旗下入门级大模型 GLM-3-Turbo的价格降低到0.001元/千tokens。同时开放平台新注册用户获赠提升至2500万tokens，此前为500万tokens。

大模型“价格战”自此打响，互联网大厂开始入局。字节跳动发布的豆包大模型宣布实施0.0008元/千tokens的“行业最低价”；腾讯也对混元大模型进行了大幅降价，新用户还免费享受1年模型资源包。

紧接着，百度、阿里云、科大讯飞等主流国产大模型厂商直接将旗下主力模型免费开放。不难看出，降价幅度和范围较大的大模型均出自资源丰富的互联网企业。

至于为什么降价，各家公司给出的理由基本覆盖以下几方面：降低使用门槛，助推商业落地；积累客户，提升竞争力；增加数据，提升性能。

例如，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光公开表示：“阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

科大讯飞则表示，焕新的价格体系将帮助开发者降低调用成本，驱动产品创新验证，解决真实世界的刚需。

华泰证券则从两方面进行了分析。一方面，DeepSeek V2证明了确实可以通过注意力机制优化，大大减少所需缓存的量，降低成本和提高效率。另一方面，即使没有技术上的降价逻辑，通过降价手段吸引开发者，目前看仍是抢占生态的重要手段。

降价“跑马圈地”，圈的不只是用户，还有开发者。申万宏源认为，这轮降价的一大动机是争抢国内开发者群体以形成开发生态。“用户、数据、模型性能形成的数据飞轮效应为大模型迭代升级重要推动因素，降价吸引开发者群体构筑生态为大模型厂商的当务之急。”申万宏源指出。

海通国际则认为，AI推广的重要因素分别是模型性能和价格，目前模型性能正持续迭代，而此次“价格战”开始，使得AI使用成本迅速下降了一个数量级，或助推AI商业落地持续加速。

棋至局中，何为胜负手？

放眼海外，大模型价格战也在上演。OpenAI在春季发布会上推出了新一代旗舰AI模型“GPT-4o”，用户不用注册且功能全部免费。

众所周知，训练大模型需要高昂的费用和大量的研发投入。所以降价和免费的口号喊得响，自然引起市场轰动。

但很快有人意识到，或许“免费的”才是“最贵的”，因为对互联网企业来说，以价换地早已不再新鲜。参照以往的发展逻辑，待到商业生态成熟，跑出巨头，再进行新一轮的提价。

有业内人士向记者坦言：“现在低价或免费的都不是最新模型了，真正好的模型都不免费。价格战必然是亏本赚吆喝，最终还是要回归价值。”

在他看来，真正能在市场竞争中胜出的大模型需要考虑三个因素，价格+模型效果性能+持续的服务能力。对现阶段来说，价格还是一个很诱人的点。但往后发展，模型效果性能和持续服务能力的影响比重会逐渐提升，价格的影响会逐渐降低。

“企业还是更关注大模型的投入有没有提升现有业务场景体验，创造更多价值。比如，一个app调了大模型就会看用户留存是不是增加了，使用代码助手大模型的企业就会在乎写代码的效率有没有提高。”上述人士表示。

他进一步表示，大模型未来大概有三个发展方向：通用的大模型会往参数量更大，更通用的方向尝试；各垂域出现巨型模型蒸馏后的小模型，以解决垂域的特定问题；为了保护隐私，小模型更多地部署在PC/手机端侧。

还有券商人士分析称，和其他行业一样，大模型的“价格战”也是警钟，说明行业发展同质化严重，大家不能再一味堆参数、拼算力、比价格。显而易见的是，行业整体降价的门槛不高，真正困难的是让大模型助力企业提升经济效应，实现商业落地，这也是各模型厂商应该关注的核心。

编辑/樊宏伟