北京青年报

可灵AI推出全球首部AIGC单元剧行业早期仍需“反复抽卡”

第一财经 2025-06-26 14:01

科幻、历史、奇幻、荒诞喜剧等多元题材，首次汇总于一部AIGC单元剧集产品中。6月25日，快手科技可灵AI与星芒短剧联合出品、影视出品公司异类Outliers团队制作的全球首部AI单元故事集《新世界加载中》举行首映礼。

实际观影过程中，记者发现，《新世界加载中》剧集内容创新、科幻元素丰富，通过详细动作脚本与首尾帧技术，解决了快速连续的打斗动作难以衔接流畅的难点。但同时，剧集存在人物一致性不足、人物情感情绪表达欠缺、群像画面中人脸崩坏等问题。

采访环节，可灵AI产品及运营负责人李杨强调视频模型的早期状态，当下AI创作尚未达到一键生成、拿来即用的程度，需要创作者通过AI工具反复写prompt（提示词）、调prompt、抽卡、调视频，非常考验创作者的创造力与韧性。视频生成领域的“抽卡”是指由于生成效果具有不确定性，用户需要多次尝试。因此目前可灵AI的消费群体主要是相对专业的创作者。

可灵AI在商业化方面进展迅速，此前官方披露ARR（年度经常性收入）超1亿美元，高盛预测可灵AI 2025年收入规模将超1.2亿美元，目前其他竞品厂商暂未有超过该数据的公开披露。但在技术表现上，李杨表示，可灵AI在稳定性、运动表现、清晰度等方面仍有一定问题。目前团队重点聚焦语义遵从、运动表现等方面进行完善，比如运动速度、质量、美感、自然度，以及符合物理规律的程度等。

即便如此，可灵AI自发布后持续占据视频模型行业头部位置。根据Artificial Analysis视频生成榜单，谷歌Veo系列和快手可灵系列分别位于文生视频、图生视频的一二位，东方证券分析师认为二者的技术实力位于T0梯队。两相对比，谷歌在今年5月发布的Veo3视频大模型新品，基于更强的音视频同步生成、参考图视频生成、相机控制视频生成等功能，在创作者群体中引发热议。

对此，李杨表达了对谷歌Veo3技术能力的认可，她对记者表示，谷歌Veo3音视频同步生成功能的确令人惊艳，而可灵AI考虑的视角更偏向技术落地与产品体验，例如Veo3的音效同步生成功能虽然带来便捷，也同时，由于音效很难通过prompt保持一致，因此会带来音色方面的不可控性。可灵AI选择的路径是尽早与用户群体进行交互，了解用户的需求，并针对性迭代更新。

整体来看，李杨认为不论是可灵AI还是其他视频大模型，虽然起点与速度不同，但都在一个大的起点范围内，未来行业还有非常多事情去做，待模型的基础表达、稳定性、可控性均达到临界点之后，才会诞生更多更新的实用型产品形态。

编辑/范辉