近期,OpenAI推出AI文生视频模型Sora,凭借超过一分钟的生成视频时长和逼真的视频质量引起了轰动,成为了讨论的热点,并将投资者的关注焦点再次引到了AI视频赛道。
近日,天风全球前瞻产业研究院联席院长孔蓉做客澎湃新闻《首席连线》节目,带来对文生视频在技术和应用层面的分析与展望。
Sora震撼在哪里
“到了去年年底,其实作为当时硅谷、然后基本整个产业交流的一个结论,大家也认为在2024年,AI视频会有比较大的变化和突破。”孔蓉表示。
孔蓉指出,此前出现的包括Pika和Runway在内的AI视频模型,其生成视频的时长相对比较短,在几秒到十多秒不等,内容更多集中于动画、动漫领域的一些生成,并且存在一致性的问题,经常在镜头中有不连贯的表现。
相比之下,Sora的演示视频展现出了三大显著进步:能够生成时长六十秒的视频,在生成真实世界的视频内容时能够做到更好的一致性跟连贯性,以及在整个内容呈现里展现出了高质量:“它的确也有一些bug,大家看视频时其实能够发现一些问题,但是整体上他已经在往所谓的模拟现实世界的环境这条路上去走了,而且目前初期看到的这个效果还是非常让人惊艳的。”
孔蓉表示:“所以跟原有的这个产品去比,不论是说从时长还是说从这个质量,或者是说它要达到的这个模拟现实世界的水平,都让我们觉得是非常震撼的。”
比较有趣的一点在于,OpenAI的Sora报告显示,其背后的部分核心概念和算法其实都是谷歌最先提出来的。是什么让OpenAI似乎总能够在技术层面领先于其他有经验的大厂?
孔蓉表示,虽然是谷歌最早发表了关于Transformer架构的论文,但谷歌当时采用的是另外一种路径。而对于OpenAI这种创业公司,他们的愿望是在整个比较宽松的环境里面,按照自己的意图去做出能够真正实现AGI(通用人工智能)的产品:“(OpenAI)他们没有什么包袱,可以相对有一个宽松的创新环境。当然,我们还是认为谷歌目前的技术实力、技术储备依然是很强的,但是大公司可能考虑得更多,包括推出之后对于社会的影响,对于公司原有业务的一些影响。”
孔蓉也指出:“我认为OpenAI可能还有一些秘密武器,我们现在可能看到的只是它其中的一部分。OpenAI后续可能还会有一些模型上比较惊艳的能力,可能会逐步地释放出来。”
关注影视、广告、电商等应用领域
在Sora的应用方面,毫无疑问,最受影响的影视行业正在密切关注其可能带来的变化。
孔蓉表示:“我们其实觉得这种新技术和新的变化,它一定带来的是行业的这个重要的机会,只是说你能不能很好地去应用这样一个技术……在影视娱乐领域有大量的创意工作者,原本他可能要组建一个团队,包括做视效、做特效的、做画面的,然后花几个月时间去生成一个内容。但是现在我们看到,这样一个模型可能会让产出的时间变得很短,原来几个月的时间,现在可能用一周或者是更短的时间,就能够去产出一部内容。”
另外,Sora也可能使得影视团队的规模缩小,几个人的团队就能够去产出一部不错的影视内容。业内可能也会关注Sora能不能首先被运用到短视频,然后再应用到更长的内容上去。
除了影视行业,孔蓉还提到了Sora为广告、电商等需要视频素材的行业带来的机遇。如果Sora能够产出AI加3D场景,之后在游戏领域也会得到很好的应用。
对于具体的未来投资领域展望,孔蓉认为,首先,AI视频将会提升对算力的需求。然后就是应用领域,包括上面说到的影视、广告和电商行业,还有影视中间再细分出来的IP公司:“IP公司本身是围绕着这个IP,可以生成不同形态的内容,不断围绕IP去做动画、动漫、真人、文字或视频的内容。但是原来因为受制于整体内容制作的效率,可能产出的效率没这么高。现在有了AI视频工具的进步,它可能对于这些IP公司来说,就让整个IP变现的商业价值可能会进一步放大。”
此外,孔蓉还谈到了AI视频为XR(扩展现实)领域带来的机遇。加上不久前,苹果首款MR(融合现实)头显Vision Pro的推出,也让大家开始期待内容生态的发展:“我们现在看到了AI视频制作的这些高精度的内容,不管是2D的、还是未来可能会产生3D的内容,就可以应用在头显里,其实也会带来整个XR板块的机会。”
实现AGI的预期时间在不断缩短
为什么今年年初以来,AI概念股能够一直保持上涨趋势?
孔蓉认为,虽然目前除了ChatGPT以外,尚未看到特别突出的C端AI爆款应用,但是能够在企业端和产业端观察到与AI的切实结合,并带来效率的提升:“效率提升带来了企业竞争力的提升,就会带来潜在的市场份额的提升。如果你不用上这种能提升生产效率的最先进的工具,可能就会落后。在这样的一个背景下,包括大厂和我们看到的一些传统应用都非常快地达成了一个共识,就是要开始投入这件事情。”
在这样的判断下,尽管资本界在去年三、四季度展现出了对AI的犹豫和不坚定态度,但在今年一月,随着一些大厂和巨头发布的财报依然表现出对AI的重视,加强了大家的信心,并推动相关股票继续表现良好。
2024年,仍然有许多AI大事值得投资者们关注。孔蓉指出,从OpenAI的GPT5、谷歌的Gemini到Meta的LLaMa,都会加强整个市场对整个AI领域的预期,以及它前进的脚步。
另一个备受瞩目的话题则是AGI(通用人工智能)。孔蓉谈到:“其实去年年底,我在市场跟大家交流的时候,一直提到2024年可能是一个AGI的元年。这个元年不是说我们2024年就会实现AGI,而是说会有AGI的突破。整个人工智能的能力,可能会往通用人工智能这条路上进一步地靠近。”在这次的产业革命中,对作为基础设施的算力的投入是相对确定性的。
什么是真正的AGI?孔蓉认为,就像人一样,首先AI要具备很强的理解能力,然后要有很强的所谓记忆能力,还有决策能力。目前,AI的理解能力的确在不断增强,记忆能力也有进步,但仍停留在分钟的水平。至于尚处于初期的决策能力,未来的AI除了能够听懂用户的意思、进行对话交流和完成一些简单的任务以外,还要能够完成一个相对需要一定环节跟流程的任务。
而近几年来,业内人士对于实现AGI的预期时间都在不断地缩短,Sora的出现也毫无疑问进一步缩短了大家的判断。“去年我在硅谷跟一些技术圈的人在交流的时候,大家认为整个这个AGI的时间可能在缩短,有百分之五十的概率会在2028年,也就是我们讲距今三四年左右的时间可能会实现,那么就比原来讲的十年甚至以上的时间缩短了。”孔蓉表示。
编辑/樊宏伟