国产大模型,烧出个未来?
中国基金报 2024-06-30 18:42

OpenAI的一个动作,国内大模型厂商又卷起来了。

OpenAI近日推送的邮件信息显示,自7月9日起,OpenAI将采取额外措施,阻止来自不在OpenAI支持的国家和地区列表中的API(应用程序编程接口)流量。

随后,包括百度、商汤、智谱AI在内的多家大模型公司宣布提供“零成本”迁移服务。

与此前“大降价”抢市场类似,国内大模型厂商依然在“价格战”上打得火热。几乎一夜之间,大家就在“零成本”上达成了共识。

国内大模型从“以分计价”大跨步迈入“以厘计价”,又飞速跃入“免费纪元”。

业内人士分析称,大模型厂商降低使用成本不仅是为了扩大市场份额,也为了吸引更多用户,增加数据收集,繁荣应用场景,推动大模型更好落地。

棋至中局,“卷”低价显然不是破局之道。

如果大模型不能为企业创造业务价值,那么价格无论低到什么程度,都没有企业愿意买单。因此也有人认为,价格战是敲响行业同质化竞争的警钟,新的竞赛逻辑已悄然而至。

“烧钱是共识,但烧钱终究得带来用户增长。这是讲了好多次的故事了,到大模型这里,套路没变。”一位关注大模型领域创业机会的投资人说。

正因如此,大模型厂商的竞争让人感觉愈发熟悉。

地铁站、机场、楼宇电梯,大模型厂商迅速成为街头广告的甲方。不少人坦言,团购、共享单车、网约车的感觉又回来了。

只是,大模型毕竟与共享单车不一样。

无论是ofo,还是摩拜,给消费者提供的服务并不根本不同,可大模型,还远没有到能够让消费者感觉好用的时候。

技术关如果还没过,拼价格,能烧出个未来?

一夜之间,集体免费

随着OpenAI发出的一封邮件,国产大模型厂商纷纷打出“免费牌”,争抢潜在用户。

例如,百度智能云千帆推出大模型普惠计划,帮用户实现0成本切换,还将为新注册企业用户提供0元调用、0元训练、0元迁移、0元服务等服务。

商汤科技也宣布推出大模型“0元购”计划,即日起,成为商汤“日日新SenseNova”新注册企业用户,将获得涉及调用、迁徙、训练等多项免费服务大礼包,商汤将为“日日新SenseNova”新注册企业用户赠送5000万Token(最小数据单元)包,提供从OpenAI到“日日新SenseNova”的迁移系列培训等服务。

智谱AI方面同样表示,将面向OpenAI API用户提供特别搬家计划,为开发者提供1.5亿Token(5000 万 GLM- 4 + 1 亿GLM- 4- Air)和从OpenAI到GLM(智谱AI自研大模型)的系列迁移培训;为高用量客户提供与OpenAI使用规模对等的Token赠送计划(不设上限)、与OpenAI对等的并发规模、匹配高等级会员政策、备案培训和辅助等。

百川智能方面称,将开放平台接口完全兼容OpenAI API;赠送1000万Token;Assistants API免费使用等服务。此外,零一万物宣布发起“Yi API二折平替计划”,面向OpenAI用户推出了平滑迁移至Yi系列大模型的服务。此外,零一万物API还将提供Prompt(提示词)兼容调优服务支持。

“零成本”迁移服务看似仅是争抢OpenAI的客户。可就在一个月前,国内大模型厂商已经掀起了一轮集体降价。

卷到极致是降价

“黑马”DeepSeek-V2大模型以2元/百万输出Tokens的价格,打响国内大模型价格战的“第一枪”。紧接着,智谱AI、字节跳动、阿里云、百度、腾讯云、科大讯飞等大模型厂商纷纷跟进,有的不仅降价,甚至直接免费。

5月6日,幻方量化旗下的DeepSeek-V2率先降价,其API定价仅为GPT-4-Turbo的近1%,每百万输入tokens仅需1元,输出仅需2元。

随后,智谱AI将旗下入门级大模型 GLM-3-Turbo的价格降低到0.001元/千tokens。同时开放平台新注册用户获赠提升至2500万tokens,此前为500万tokens。

大模型“价格战”自此打响,互联网大厂开始入局。字节跳动发布的豆包大模型宣布实施0.0008元/千tokens的“行业最低价”;腾讯也对混元大模型进行了大幅降价,新用户还免费享受1年模型资源包。

紧接着,百度、阿里云、科大讯飞等主流国产大模型厂商直接将旗下主力模型免费开放。不难看出,降价幅度和范围较大的大模型均出自资源丰富的互联网企业。

至于为什么降价,各家公司给出的理由基本覆盖以下几方面:降低使用门槛,助推商业落地;积累客户,提升竞争力;增加数据,提升性能。

例如,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光公开表示:“阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

科大讯飞则表示,焕新的价格体系将帮助开发者降低调用成本,驱动产品创新验证,解决真实世界的刚需。

华泰证券则从两方面进行了分析。一方面,DeepSeek V2证明了确实可以通过注意力机制优化,大大减少所需缓存的量,降低成本和提高效率。另一方面,即使没有技术上的降价逻辑,通过降价手段吸引开发者,目前看仍是抢占生态的重要手段。

降价“跑马圈地”,圈的不只是用户,还有开发者。申万宏源认为,这轮降价的一大动机是争抢国内开发者群体以形成开发生态。“用户、数据、模型性能形成的数据飞轮效应为大模型迭代升级重要推动因素,降价吸引开发者群体构筑生态为大模型厂商的当务之急。”申万宏源指出。

海通国际则认为,AI推广的重要因素分别是模型性能和价格,目前模型性能正持续迭代,而此次“价格战”开始,使得AI使用成本迅速下降了一个数量级,或助推AI商业落地持续加速。

棋至局中,何为胜负手?

放眼海外,大模型价格战也在上演。OpenAI在春季发布会上推出了新一代旗舰AI模型“GPT-4o”,用户不用注册且功能全部免费。

众所周知,训练大模型需要高昂的费用和大量的研发投入。所以降价和免费的口号喊得响,自然引起市场轰动。

但很快有人意识到,或许“免费的”才是“最贵的”,因为对互联网企业来说,以价换地早已不再新鲜。参照以往的发展逻辑,待到商业生态成熟,跑出巨头,再进行新一轮的提价。

有业内人士向记者坦言:“现在低价或免费的都不是最新模型了,真正好的模型都不免费。价格战必然是亏本赚吆喝,最终还是要回归价值。”

在他看来,真正能在市场竞争中胜出的大模型需要考虑三个因素,价格+模型效果性能+持续的服务能力。对现阶段来说,价格还是一个很诱人的点。但往后发展,模型效果性能和持续服务能力的影响比重会逐渐提升,价格的影响会逐渐降低。

“企业还是更关注大模型的投入有没有提升现有业务场景体验,创造更多价值。比如,一个app调了大模型就会看用户留存是不是增加了,使用代码助手大模型的企业就会在乎写代码的效率有没有提高。”上述人士表示。

他进一步表示,大模型未来大概有三个发展方向:通用的大模型会往参数量更大,更通用的方向尝试;各垂域出现巨型模型蒸馏后的小模型,以解决垂域的特定问题;为了保护隐私,小模型更多地部署在PC/手机端侧。

还有券商人士分析称,和其他行业一样,大模型的“价格战”也是警钟,说明行业发展同质化严重,大家不能再一味堆参数、拼算力、比价格。显而易见的是,行业整体降价的门槛不高,真正困难的是让大模型助力企业提升经济效应,实现商业落地,这也是各模型厂商应该关注的核心。

编辑/樊宏伟

最新评论