没有太多征兆,国内大模型突然进入价格战模式。
可追溯的源头似乎是5月6日幻方量化旗下DeepSeek发布的DeepSeek-V2,其价格做到GPT-4-Turbo的近百分之一。5月11日,智谱接棒,个人版GLM-3Turbo调用价格下降5倍。
掀起高潮的主力则是云厂商,5月15日,字节豆包主力模型将其在企业市场的定价做到0.0008元/千tokens,喊出较行业平均价格便宜99.3%。而在5月21日,国内两大头部厂商阿里和百度也入场了。
“通义千问9款模型齐降价。GPT-4级别主力模型Qwen-Long价格直降97%,击穿全球底价。”阿里云宣布。百度智能云则直接宣布文心大模型两大主力模型ERNIE Speed和ERNIE Lite免费。
这一波大模型降价潮还有卷入更多厂商的迹象。5月22日,科大讯飞宣布讯飞星火Lite API(接口)永久免费开放,讯飞星火顶配版API价格不足百度文心一言ERNIE-4.0和阿里通义千问Qwen-Max的五分之一。
“降价正常且必然。”国内主流大模型厂商大模型产品经理范哲(化名)告诉第一财经记者,但这对大模型厂商造成了压力,如果一家比较大的厂商降价,其他厂商可能也躲不过。
“只要有一家降价都得跟,要不然估计就会掉队。” 新浪微博新技术研发负责人张俊林有类似的判断,他告诉记者,其背后是大模型技术和能力等各方面已经趋同,厂商间没有特别强的壁垒。
为何降价
大模型价格战已变得火药味十足。
“友商大模型公司提出各种降价主题,我觉得要遵循降价基本原理。降价目的是普惠市场,在中国什么样的公司真正有能力、有资本降价,要看模型基模能力是否领先、有没有推理资源、当下模型是不是已有很多用户在使用、大模型是不是最核心业务。”5月21日,阿里云相关负责人在武汉AI智领者峰会表示。
字节跳动挑起价格战后,阿里云此番表态颇有反击的意味。
5月21日下午,百度智能云加入战局,宣布文心大模型两大主力模型全面免费。阿里云很快又发了一条微博,称“通义已开源12款模型,全部免费下载”。此番回应针对的似乎是走闭源、多款模型收费路径的百度。
(记者根据公开资料整理的大模型降价情况)
按照阿里云的说法,此次降价是希望加速AI应用的爆发。但记者了解到,对于降价的目的和作用,业内有不同看法。
张俊林认为,价格低才能促进应用发展,因为便宜所以会有更多应用。一名国内互联网大厂大模型开发人员也告诉记者,大模型厂商此时降价,是希望用低价鼓励用户在更多场景探索落地。现阶段对大模型厂商而言,通过定价赚钱不是最主要的因素,最重要的是先把应用场景铺开,把流量做上去。
猎豹移动董事长兼CEO傅盛有类似的看法,他认为,降价目的不是为了用户更多地直接使用,而是为了吸引开发者,现在各大模型App基本都免费,但用户量涨不动了,大家都认识到仅提供聊天窗口不可能让用户越用越多,必须让开发者参与进来。
“降价会催生应用,因为做应用的成本低了。” 范哲告诉记者,但降价并非万能,降价主要能吸引到B端用户,但面向C端时逻辑不同,更多要靠好产品吸引。
大模型应用厂商创始人刘俊(化名)则不认可国内这波大模型降价的意义。“我认为这波国内大模型降价对应用没有太大影响。就像电费即使免费,也不会对新能源汽车产业产生本质的影响。现在大模型行业本质的问题是,足够坚实的应用场景还不够多。”刘俊向记者表示。
此外,刘俊认为,国内大模型和GPT-4、Claude 3的差距还不小,国内GPT-3.5能力级别的大模型降价甚至免费很正常。现在行业内都在“卷”,不用这些厂商的大模型而选择自建模型,也能达到差不多的水平。要是能把GPT-4o能力的模型做出来而且免费,才是真的厉害。
傅盛则认为,国内大模型厂商降价还有其他考虑。“有人说这是大模型行业互相‘卷’,有人说这是泡沫的先兆,而我认为一个行业已经‘卷’到让所有人发呆的时候,威胁可能不来自这个行业。这次公有通用大模型发生如此激烈的斗争,真正的竞争压力来自开源、本地化、私有化的大模型,因为用户直接可以免费使用且数据安全。”傅盛认为。
傅盛观点的现实基础在于,字节、百度、阿里都不只卖大模型,卖的还是云上算力资源,而随着更多大模型开源,用户免费获取开源大模型后可自由选择部署在云上或私有服务器上。随着Llama 3 8B(80亿参数)等小参数模型能力变得更强,业界则已在探索手机等端侧直接运行大模型,试图摆脱云算力。
此外,多名业界人士都认为,价格战之所以现在会发生,是因为厂商意识到彼此的差异难以拉开。
“降价估计会引发连锁效应,因为在技术路径差别不是很大的情况下,坚持高于市场的价格不太现实。”范哲告诉记者。
近日接受第一财经记者采访时,针对大模型是否难以做到差异化,万兴科技董事长吴太兵也表示,未来任何一个领域的大模型数量都不会特别多,特别是文本大模型,其数据量级相对较小、训练成本相对较低、通用性较好,所以集中度会比较高。“同样的数据你算和他算,在算法差别不大的情况下,差别不会太大。” 吴太兵认为,最后是否形成壁垒效应看的则是谁的数据多、资金投入大。
谁得益、谁受伤?
大模型降价后,这些厂商能否抢夺更多用户、培育起蓬勃的应用生态还有待观察。仅从算力资源来看,字节、阿里、百度作为云厂商不需向外购买云算力,讯飞、字节、阿里等厂商资金实力也较创业企业雄厚,降价显得较有底气。
依托云上大规模算力集群效率等优势,字节、阿里近期已透露算力成本有所降低。字节的方式是优化模型结构、将单机推理改为分布式推理、混合调度云计算算力,阿里云则构建了弹性的AI算力调度系统并结合百炼分布式推理加速引擎。以上国内互联网大厂大模型开发人员告诉记者,据其了解,大模型开发完成后边际成本低,只要用户规模能上来,价格低一点影响不大。
但对创业公司而言,在商业模式还未跑通的情况下,算力仍是一笔难以忽视的支出。
与以上大模型厂商“大方”降价形成对比的是,近日大模型独角兽月之暗面在花钱购买更多算力、收取费用以保障部分用户算力供应之间,选择了后者。今年3月以来,月之暗面旗下智能助手Kimi用户大量涌入导致高峰期算力不足,Kimi近日开始测试付费打赏功能,打赏者可在一定期限内拥有高峰期算力保障。
目前,除了智谱降低GLM-3Turbo调用价格,此轮大模型降价潮还没卷入太多创业企业。零一万物创始人兼CEO李开复5月21日表示,不应在行业内按照ofo的烧钱打法重蹈覆辙,价格战是一个“双输”的打法,零一万物目前没有价格调整的计划。
不过,随着降价潮继续,做基础大模型的创业企业或许不得不面对趋于激烈的竞争环境。
张俊林告诉记者,现在已到了通过价格战淘汰掉一些大模型选手的时候,预计今年下半年还会继续淘汰一批。“如果是创业做应用,大模型降价是件好事情,如果做的是基础模型,则会很难。如果做不出特色或者应对竞争被迫跟着降低成本,会很难受。”张俊林认为。
投资界对于基础大模型创业企业面临的境况早有预判。其中持悲观态度的金沙江创投合伙人朱啸虎去年表示“ChatGPT对创业公司很不友好,未来两三年内请大家放弃融资幻想”。朱啸虎近日提及对大模型应用的乐观态度,称“大模型应用会迅速爆发,推理成本再降一个数量级就会出现AI时代国民应用”,但与此同时也预判 “不是深度绑定大厂的模型公司基本已出局”。
“人家(大公司)有现金流,源源不断,创业公司背后就算站着明星投资机构,财力也很难比拼,还没有先发优势,你怎么拼得过人家?除非瞄准差异化需求,做垂直细分的赛道。”在互联网大厂和创投机构有多年从业经历的王先(化名)告诉记者,大模型创业公司拿着技术找应用,要找对方向并不容易,“就像做AI代码助手这类产品,现在可能是可行的,但当互联网大厂把产品延伸到这个领域后,很快就能打败创业公司。创业公司不能跟大厂直接对抗。”
王先认为,大模型创业公司要形成壁垒和完整的商业链条,把现金流做起来,这时候才能说是安全的,否则在市场竞争中永远不安全。
傅盛则认为,这次大模型大降价基本宣告了大模型创业公司必须寻找新的商业模式。“降得最凶的都是有云服务的大公司,(他们)通过大模型来获取云用户,羊毛出在猪身上,降得起。而大模型创业公司没有这样的生态,必须另寻商业模式。”傅盛表示。
编辑/范辉