“万一砸了四五千万美金做出来别人开源了呢?”
金沙江创投主管合伙人朱啸虎曾对通用大模型泼了一盆冷水,他对外称不会投场上任何一家中国大模型公司,因为“没戏”。这一度在AI创投圈引发热议。
看向业界,更多投资机构仍然在真金白银下注,只红杉一家就投了智谱AI、MiniMax和月之暗面,高瓴、启明创投、达晨财智等机构同时投了智谱AI,深创投、顺为资本投了百川智能,真格基金、砺思资本则押注了月之暗面。
2021年,在ChatGPT还没面世引发这轮AGI革命时,云启资本就已经为MiniMax签下了“第一张支票”,成为其天使投资人。在获得第一批牌照的8家大模型里,中金资本也“差不多投了一半”。 资本市场正处寒冬期,但在众多的不确定性里,大模型带动的AGI似乎是某种意义上投资的共识。
云启和中金资本都在科技领域有深入布局,AI大模型是两家机构共同的关注点。就AI与大模型投资的思路与趋势判断,第一财经记者与云启资本合伙人陈昱、中金资本董事总经理张清进行了一场对话,他们认为,在通往AGI的路上,通用大模型的布局有其必要性。
来自调研机构FutureSearch的最新数据称,OpenAI的年化营收达到了34亿美元。投资人的判断是,至少在AI赛道中,这种量级的资金和这种确定性是过去多年少有看到的,这或许也是一个“天花板”很高的赛道。
大模型投资“风险可控”
2021年初,在大模型还是非共识时,陈昱和MiniMax创始人闫俊杰见了一面, “他当时就成功说服了我大模型才是通往AGI的一条比较好的路径。”陈昱在那时决定押注MiniMax。
“那时我们判断,大模型如果真的有一天能实现通用人工智能,它的想象空间是巨大的。所以我们在早期碰到闫俊杰这样优秀的人才的时候,我们是希望在他身上去赌一把的。”第一次见面时,闫俊杰就在和陈昱解释大模型和若干个小模型能够产生的效果差异,并且成功“游说”了他。
云启的风格一直是投早、投小、投前沿科技。“一般来说,我们都会是给创业公司去写第一张支票(的机构)。”在标的选择上,陈昱提到,会更注重团队技术的领先性,期待能够做出一些比较颠覆的技术和应用,“看人,以及看这个人做的事。”
与云启相比,中金资本看重团队技术背景、独特的一些专利所构筑的壁垒,但同时也看企业目前的商业进展。
在这轮通用大模型的投资里,中金资本也没有缺席,“第一批牌照的8家,差不多都投了一半,没拿牌照的公司也投了一些。”张清提到。
对通用大模型的投资如何平衡其风险?在阐述投资逻辑时,张清对第一财经记者提到了通用大模型的确定性与天花板。
技术有一定的范式,也会走出一定的模式,“但凡你能对这个模式有更深的洞察,你就能够往前走一些,我们靠推演提高胜率来进一步投资,而规模也是一个相对量。”张清认为,企业需要有一定的造血能力,虽然通用大模型耗费的资金很多,但至少在这次大模型浪潮中,这个赛道的企业能取得的收入是较为领先的,其他公司或许离收入还更远。
如果目光看向海外做一个比较,OpenAI 2023年的营收已经奔着100亿人民币去了,“在AI赛道当中,这种量级的资金和这个确定性是过去很多年很少看到的。”张清判断,从这个维度看,通用大模型是比较重要的。
2023年12月就有媒体消息称,由于明星产品ChatGPT的迅猛增长,OpenAI的年化收入达到16亿美元。就在今年7月,AI调研机构FutureSearch发布了一份报告,其中提到OpenAI的年化营收将达到34亿美元,OpenAI每月的付费用户约为988万名。
在确定性之外,天花板也很重要,如果大模型真的到了AGI,那赛道的未来是不可限量的,不过,悖论也存在:有那么多AGI吗?张清提到,对于有很高天花板的领域,就可能要进行一个portfolio(组合投资)的布局。
在投资人的视角,目前大模型的投资风险还是可控的。一方面,很多大模型创始人并不是埋头只顾奔赴AGI这一件事情,他们同时也在找一些场景做商业化。同时,AGI的“盘子很大”,是一个大家共同参与分散风险的事,从这些维度看,投资通用大模型,风险较大是一方面,同时还在可控范围,且可能性更大。
投资人朱啸虎此前提出,通用大模型没有投资价值,因为未来开源最终会追平闭源。作为躬身入局者,陈昱也投过较多的开源项目,在他看来,“开源和闭源本质上没有太大区别,只不过开源可能会利用一些社区的杠杆,但这并不意味着开源没有商业模式。”
以欧洲大模型独角兽Mistral AI为例,一开始团队秉持的是开源路线,不过,随着规模的扩大、更多的融资,Mistral AI越来越向闭源靠近,团队在年初发布的旗舰大模型Mistral Large就采取了闭源路线,既不开放也不免费。对此Mistral创始人Arthur Mensch曾解释称,在构建商业模式和坚持开源价值观之间找到一个平衡点是非常微妙的,“我们希望创造新的事物、新的架构,但是还想向我们的客户提供一些额外的产品和服务。”
“从这点来看,其实开源公司和闭源公司并没有太大的区别。”陈昱认为,只不过开源大模型会给一个额外的选项:如果不用企业的云服务也不想接受开源的技术支持,开发者自己仍然可以使用,但如果要用好,最后还是会去寻求原厂的支持。此外,也有部分开源模型会和云厂商合作,通过提供推理服务获得分成。
陈昱认为,未来开源和闭源两种模型可能都会存在于市场里,开源模型相当于给了一个免费试用的过程,同时很多开源模型也会“两条腿走路”,开源一个相对来说参数量较少、中杯或小杯的模型,但是超大杯的旗舰模型用于做商业化。
大厂VS独角兽胜负难料
过去一年半时间里,中国大模型独角兽公司迅速融资、成长,据不完全统计,第一梯队独角兽的融资金额至少已达200亿人民币,目前行业已初步形成6家独角兽大模型公司对阵BAT等大厂十几个基座大模型的格局。
在大厂与独角兽的赛跑中,谁能胜出?这是两种完全不同风格的路线,大厂的出发点是,用大模型技术将旗下整个应用场景重新做一遍,创业公司的打法则是,先从基座出发,将模型往应用上做。
在张清的视角里,创业公司的业务或许会更聚焦,但大模型是资本密集型赛道,众多的不确定性导致结果难料。
“很多科技创业过程中,经常是创业公司能获胜。”背后的一个逻辑是,大厂往往有很多业务,会有支持也会有掣肘,张清认为,理论来说创始人的重心应该会放在主要业务的稳定性、现金流,或者发展的战略等问题上,在这期间,很多创业企业能够走得比较领先。
同时,对于大厂来说还有一个性价比、考评的问题。张清认为,大厂有它的优势,某种意义上也反映出它的劣势,所以在很多以往行业的讨论中,创业企业胜的是更多的。
但大模型有一些差异的点在于,这个赛道需要拼资源、拼资金。只需要看微软向OpenAI投的130亿美元就能很直观地知道,这不是一般人玩的游戏。
退一步看,中国的创业企业工作效率很高,或许不需要到百亿美元,但客观的规律也要走,“该买卡还是要买卡,该付的费用还是要付。”张清认为,这样资本密集型的创业赛道,不是随便一个人就能广泛成功的,加上有的大厂有决心能拿出这样量级的资金投入,谁是最后的王者在这个阶段还很难预判。
现在大家都可以想到的是,会有几个种子选手未来会往后走,但最后,很重要的一个前提是,“会不是AGI,什么时候是AGI,如果到AGI这个层面,很多因素可能就不一样了。”
陈昱认为,“大厂肯定是有优势的。以API服务为例,大厂可以实现Token几乎免费,但从云计算上去赚钱。这种模式对于创业公司很难做到。”
5月,国内大模型厂商掀起价格战,主力就是云厂商,以致大模型甚至直接跨入免费时代。最初是字节跳动对外发布豆包大模型,以大幅低于行业价格的商业定价,打响了首波价格战,接连几天内,智谱、阿里云等相继宣布大幅下调大模型API调用价格,随后百度更是宣布文心大模型的两款主力模型全面免费。
在这轮价格战中,折射出的一个问题是,厂商的大模型技术和能力等各方面趋同,厂商间并没有特别强的壁垒。“我是觉得到最后,大家不能无节制地去打价格战,重心还是得放在模型的质量上,这才是一个比较可持续的商业模式。”陈昱说。
一定程度上,中国的创业公司和大厂目前还在伯仲之间。抛开未来不可预测的AGI不谈,产业落地或许是未来竞争的分水岭,“选择什么样的场景、什么样的落地去实现商业化,我觉得是对整个企业的发展和未来谁能胜出至关重要的方面。”
应用层有更多投资机会
“去年一级市场的投资集中在几个基础大模型上,接下来两三年的机会在AI应用上,特别是怎么利用基础大模型的能力,对应用做投资。”陈昱认为,目前市场上大模型供给已经比较充足,独角兽创业公司和大厂的一系列基座模型基本能满足当下的应用开发需求。因此,基础模型层的投资新机会所剩无几。
对于未来应用层的投资机会,陈昱认为,无论C端还是B端都具有巨大的潜力,具体方向上,生产力提升、科学研究、具身智能、娱乐、消费电子是云启会重点关注的领域。
陈昱的一个观察是,目前社交软件的AI应用落地进展相对较快,团队发现,“大模型很大一部分消化量,差不多500亿到1000亿的Token是消化在情感陪伴类的社交软件上。”类似社交、娱乐应用等C端场景有较大的机会,可以给用户提供情绪价值。
目前行业普遍在做的生产力提升上有很多场景。在搜索场景上,大模型颠覆了传统的搜索引擎,在工作场景中可以帮助内容生成提高效率,在任务的自动化上,大模型也可以通过AI Agent有效辅助完成相对复杂的重复性任务,陈昱表示,这些也是值得关注的应用方向。
第二个大的方面是科学研究(AI For Science),利用大模型辅助科学发现,“如新药研究、化学路径的合成、新材料的发现,甚至还有数学定理辅助证明,这些都可以加速研究人员拓宽科学的边界,改善大家的生活。”陈昱介绍。
此外,时下热门的具身智能也是云启关注已久的方向。陈昱认为,得益于大模型以及强化学习等技术的发展,具身智能的泛化性和通用性优势有望落地。
2024年被称为生成式AI落地的元年,行至过半,目前的落地情况符合投资人的预期吗?
“有符合预期,也有低于预期的地方。”陈昱表示,符合或超出预期的地方是,模型自身降本叠加价格战影响,大模型的使用价格在急剧下降,低于预期的方向则是,大模型基础能力的进展比大家想象中更缓慢,但应用最后还是依赖于基础模型的能力,如果基础模型没有更好的能力,应用就很难做出更好的用户体验。
“所以我们还是期待于基础模型能力的一个进化,就像今年,大家下半年就会非常期待多模态模型的落地开花。”陈昱说。
在某种意义上,张清认为,兼顾技术与落地是一件不容易的事情,“向着技术和理想在走,另一方面落地也要走,由于这样的分散,使得模型落地进展可能不像大家想象的那个曲线一路往上走,但正如雨后春笋一样,大量的落地是在行业里展开的。
编辑/樊宏伟