近日,一家专注于虚拟人技术领域的公司中科深智发布GenSense数智姜尚大模型,基于该模型提供端到端的3D虚拟人服务。
中科深智较早在虚拟人业务上布局,此前也打造出电商直播服务系统、生成式虚拟人实时动作表情驱动业务中台等。但从用户的感知上来看,虚拟人不够“真实”、不会互动,一直是行业希望突破的瓶颈。
中金研报指出,若虚拟角色在AI等技术助力下实现与用户实时智能互动,用户将获得更具真实感的体验。在AIGC风靡全球之后,虚拟人被认为是较为实际的落地场景之一。
GenSense数智姜尚是针对垂直领域、和虚拟人端到端应用而专门设计的大语言模型。公司在发布会上演示了数智姜尚大模型在数学运算、逻辑推理、日常对话等领域的互动表现。
中科深智CTO宋健向媒体介绍称,该模型相当于虚拟人的“大脑”,为其提供实时互动能力支撑。中科深智此前积累了跨多模态深度学习算法——CLAP算法,而GenSense数智姜尚大模型可以对外界互动作出实时反馈、并直接驱动虚拟人进行表达。
但公司不希望止步于“虚拟人”。
据中科深智介绍,GenSense数智姜尚大模型的特点是更“轻”,公司在发布现场重点将20亿参数量级版本的大模型和同ChatGPT及其他知名大模型进行了同场测试,来验证参数量级差别较大的情况下实际体验差距并不大。
因此公司称,数智姜尚大模型主打的特点是轻量级、可私有化部署,也适用于对数据安全性要求更高的金融、医疗、政企、能源等行业,让用户进行私有化部署应用。宋健认为,此类领域大多存在数据敏感性高等特点,而市场上大多数大模型产品由于对算力要求较高,难以进行私有化部署,导致无法满足此类客户的需求。
在大模型让整个产业链为之振奋之时,不同定位的厂商需要找到属于自己的蛋糕。眼下,从应用入手可能是中小厂商较快入局的机会。如上所述,中科深智的路径是基于虚拟人业务发布大模型,再以此布局其他场景。
一位行业人士向界面新闻指出,大模型爆发后,有的公司在芯片上发力,有的公司在做基础设施和应用,而绝大部分会聚焦在应用层面,得以实现突破。这也是“AI+虚拟人”如此受关注的原因。
同时,各路玩家就此迎来更多直接的较量。ChatGPT面世之后,不少涉足虚拟人业务的上市公司陆续宣布接入AI大模型;如科大讯飞、商汤这样的知名公司,也在近期发布大模型的同时展示了其在虚拟人、数字员工生成上的效果。
几家厂商介绍的共性特点是:大模型辅助下,虚拟人制作的成本更低、交互能力更好。短期内,虚拟人行业可能会因此出现一些变化,但不同公司的大模型具体对比如何,还需更多案例来检视。
界面新闻 佘晓晨