可灵AI推出全球首部AIGC单元剧 行业早期仍需“反复抽卡”
第一财经 2025-06-26 14:01

科幻、历史、奇幻、荒诞喜剧等多元题材,首次汇总于一部AIGC单元剧集产品中。6月25日,快手科技可灵AI与星芒短剧联合出品、影视出品公司异类Outliers团队制作的全球首部AI单元故事集《新世界加载中》举行首映礼。

实际观影过程中,记者发现,《新世界加载中》剧集内容创新、科幻元素丰富,通过详细动作脚本与首尾帧技术,解决了快速连续的打斗动作难以衔接流畅的难点。但同时,剧集存在人物一致性不足、人物情感情绪表达欠缺、群像画面中人脸崩坏等问题。

采访环节,可灵AI产品及运营负责人李杨强调视频模型的早期状态,当下AI创作尚未达到一键生成、拿来即用的程度,需要创作者通过AI工具反复写prompt(提示词)、调prompt、抽卡、调视频,非常考验创作者的创造力与韧性。视频生成领域的“抽卡”是指由于生成效果具有不确定性,用户需要多次尝试。因此目前可灵AI的消费群体主要是相对专业的创作者。

可灵AI在商业化方面进展迅速,此前官方披露ARR(年度经常性收入)超1亿美元,高盛预测可灵AI 2025年收入规模将超1.2亿美元,目前其他竞品厂商暂未有超过该数据的公开披露。但在技术表现上,李杨表示,可灵AI在稳定性、运动表现、清晰度等方面仍有一定问题。目前团队重点聚焦语义遵从、运动表现等方面进行完善,比如运动速度、质量、美感、自然度,以及符合物理规律的程度等。

即便如此,可灵AI自发布后持续占据视频模型行业头部位置。根据Artificial Analysis视频生成榜单,谷歌Veo系列和快手可灵系列分别位于文生视频、图生视频的一二位,东方证券分析师认为二者的技术实力位于T0梯队。两相对比,谷歌在今年5月发布的Veo3视频大模型新品,基于更强的音视频同步生成、参考图视频生成、相机控制视频生成等功能,在创作者群体中引发热议。

对此,李杨表达了对谷歌Veo3技术能力的认可,她对记者表示,谷歌Veo3音视频同步生成功能的确令人惊艳,而可灵AI考虑的视角更偏向技术落地与产品体验,例如Veo3的音效同步生成功能虽然带来便捷,也同时,由于音效很难通过prompt保持一致,因此会带来音色方面的不可控性。可灵AI选择的路径是尽早与用户群体进行交互,了解用户的需求,并针对性迭代更新。

整体来看,李杨认为不论是可灵AI还是其他视频大模型,虽然起点与速度不同,但都在一个大的起点范围内,未来行业还有非常多事情去做,待模型的基础表达、稳定性、可控性均达到临界点之后,才会诞生更多更新的实用型产品形态。

编辑/范辉

相关阅读
快手发布全球首部AI单元故事集,总时长180分钟
北京青年报客户端 2025-06-26
引入聊天机器人 Gemini 2.5 Pro加持 谷歌重塑搜索AI能力
澎湃新闻 2025-05-21
累计生成1.68亿个视频 可灵AI 2.0面向全球发布
北京青年报客户端 2025-04-16
中国网络视听大会观察:AI赋能降低创作门槛,多方协同应对“AI+视听”新风险
新华社 2025-03-31
为Sora氪金200美元后,AI创作者们后悔吗?
第一财经 2024-12-19
谷歌推出新一代视频生成模型Veo 2
新华社 2024-12-18
谷歌新动作!大幅更新生成式AI 推出视频模型VEO 2和最新版Imagen3
每日经济新闻 2024-12-17
快手张迪:半年迭代16次,可灵AI用户超600万
北京青年报客户端 2024-12-13
最新评论