阶跃星辰联合吉利首次开源视频生成模型和语音模型
北京青年报客户端 2025-02-18 19:40

2月18日,上海阶跃星辰智能科技有限公司发布消息称,公司与吉利汽车集团联合开源了两款阶跃 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。目前,已经可以在跃问 App 内体验。

据介绍,阶跃星辰是吉利汽车集团的科技生态战略合作伙伴。在两款大模型的研发过程中,双方展开了深度合作,在算力算法、场景训练等领域优势互补,显著增强了多模态大模型的性能表现。

“开源的初心,是希望跟大家分享最新的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。”阶跃星辰介绍,根据技术报告中的评测结果,阶跃 Step-Video-T2V 的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;而阶跃 Step-Audio 则是业内首款产品级的开源语音交互模型。

阶跃 Step-Audio能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征,同时也能支持不同角色的音色克隆,满足影视娱乐、社交、游戏等行业场景下应用需求。

阶跃 Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。

文/北京青年报记者 宋霞
编辑/李涛

相关阅读
年轻人的事业!6家上海人工智能企业畅想“模范生”新征程
澎湃新闻 2025-05-06
大模型“六小虎”变阵
上海证券报 2025-04-19
生数科技朱军:视频模型更期待“ChatGPT时刻”
第一财经 2025-03-30
“APUS 智草”大模型为中医药行业注入活力
北京青年报客户端 2025-03-10
大模型驶入汽车圈 开源后阶跃星辰披露落地案例
第一财经 2025-02-23
2025全球开发者先锋大会在沪开幕 中国开源参与者数量位居全球第二
中国新闻网 2025-02-22
多模态实力领跑开源大模型!阶跃星辰与吉利宣布联合开源两款多模态大模型
北京青年报客户端 2025-02-18
Deepseek、Kimi争相对标o1,初创公司能打破“技术”和“用户”二选一魔咒吗?
每日经济新闻 2025-01-22
最新评论