大模型价格战打得几近疯狂。
5月21日上午,阿里云宣布通义千问GPT-4级主力模型Qwen-Long降价97%,1块钱可以买200万tokens。
这一举动颇有些剑指字节的味道。此前,字节跳动5月15日发布豆包大模型,宣布其主力模型市场定价为0.0008元/千tokens,较行业平均价格便宜99.3%。阿里云降价后,其API输入价格从0.02元/千tokens(文本单位)降到了0.0005元/千tokens。
但尽管降价97%,阿里云的价格优势也仅维持了几个小时。21日下午,百度智能云便宣布文心大模型两大主力模型全面免费,立即生效,包括ERNIE Speed和ERNIE Lite。
“只要有一家降价都得跟,要不然估计就会掉队。”针对大模型厂商近期降价,新浪微博新技术研发负责人张俊林对第一财经记者表示。激昂又惨烈的价格战背后,大模型厂商有许多不得不跟的理由。
大模型掀起降价潮
事实上,这一轮大模型降价潮从5月起就初露端倪。
5月6日,幻方量化旗下DeepSeek(深度求索)发布第二代MoE(专家模型)DeepSeek-V2,API(接口)定价每百万tokens输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。
5月13日,智谱大模型开放平台上线新的价格体系,入门级产品 GLM-3 Turbo 模型调用价格下调80%,为1元/百万tokens。随后,OpenAI推出GPT-4o,价格为GPT-4 Turbo的一半,输入、输出每百万 tokens收费5美元、15美元。字节豆包大模型随之加入降价潮。
而随着阿里云4款通义千问商业化模型和3款通义千问开源模型的不同程度降价以及文心大模型两大主力模型的全面免费,大模型厂商似乎正在“榨干”自己的利润空间。
为什么大模型能有如此幅度的降价?对此,阿里云方面表示,这主要因为公共云的技术红利和规模效应带来的成本和性能优势。通过模型和AI基础设施两个层面的不断优化。
Canalys云分析师章一则对第一财经记者表示,中国客户群体其实对价格特别敏感,大模型厂商的降价,更多是为了吸引更多客户使用大模型。同时,许多降价的大模型厂商也是云厂商,云厂商让大模型降价最本质的目的还是拉动云消费。
在不断击穿底价甚至免费的“激进”策略下,大模型厂商“抢阵地”的决心远超其对短期利润的渴望。章一分析,中国厂商本身做生意比较擅长采用的手段是低价打入市场,再通过走量的形式把成本铺开。目前,中国B端市场实际使用AI的客户比并不高,通过降价,大模型厂商希望降低使用其大模型的门槛。
5月21日,针对阿里云宣布通义千问GPT-4级主力模型降价,字节跳动火山引擎相关负责人向第一财经记者回应称,非常欢迎通义千问大模型降价,共同助力企业以更低成本探索AI转型,加速大模型应用场景落地。
光降价并不够
大模型的降价背后,值得关注的是,其背后算力成本的下行也是行业趋势。
阿里云表示, 弹性的AI算力调度系统,并结合百炼分布式推理加速引擎,阿里云优化了大规模推理集群,大幅压缩了模型推理成本并加快推理速度。
腾讯云近日也提及大模型算力成本下降情况。 腾讯集团副总裁蒋杰透露, 针对 低端卡算 力 低、显存小的不足, 腾讯使用自研 Angel训练推理平台,调度 异构卡集群 ,万亿大模型推理成本比开源减少70%。
火山引擎总裁 谭 待 此前 表示,字节通过优化模型结构、将单机推理改为分布式推理、混合调度云计算 算 力等降低成本。 DeepSeek 相关负责人则在知乎上解释 ,DeepSeek-V2兼顾成本和效果基本靠的都是模型结构创新 。
但降价之外,大模型领域还需要更多新故事。
阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在今天提起大模型降价的行业趋势时表示,价格战要遵循市场的基本原则,降价一定要普惠于市场,以推动市场的发展为目标,“不以流量博噱头”。
什么样的企业可以用降价普惠市场、推动市场发展?刘伟光提到了四个原则:首先,要普惠市场,模型的的基模能力要足够领先;其次,要看模型有没有真正的推理资源;其三,当下的模型是不是有很多客户在使用,能够产生商业价值;最后,大模型是不是这家公司主要的业务,企业有没有战略定力。
针对如何看待大模型价格战、腾讯是否会降价的问题,腾讯云副总裁、腾讯云智能负责人吴运生近日在采访中则未直接回应。“我们这几天也关注到业界的相应情况。其实我们是把大量精力投入到底层大模型能力提高、让用户真正用起来之中。”吴运生向第一财经等媒体表示。
“最后一公里”的问题仍横在大模型面前。”章一分析,大模型降价潮可能在短期内吸引一部分客户,但长期来看,要吸引更多用户,大模型仍面临着如何产生更多落地价值的问题。
大模型究竟能给客户的实际业务带来什么价值?AI的生产力能否让客户在实际过程中降低成本、提升企业的效率和实际效益,这才是对客户来说另一个层面上的省钱,也是大模型商业化落地进程中的重要问题。无论是国内还是国外,大模型落地产生价值的故事仍不够完整。
编辑/范辉