记者观察:大模型逐鹿下半场,超级应用仍未“敲门”
中新经纬 2024-07-06 18:29

以按下应用加速键为标志,大模型竞争进入下半场。

在移动互联网时代,App成为超级应用。在大模型时代,会不会出现新的超级应用?超级应用又可能是什么?这一问题,或许可以从2024世界人工智能大会(下称大会)上找到答案。

2024世界人工智能大会7月4日-6日在上海举行。中新经纬 摄

中新经纬记者在大会展览馆走访后发现,相比于去年观众们普遍关注“大模型能干什么”,今年观众们对于大模型的关注也渐入“深水区”。“这个图生视频结果真不真?”“虚拟口语教练以前也有,基于大模型做的有什么不一样?”他们在关心,大模型未来将以怎样的形式影响他们的生活。

类比于用户通过App享受移动互联网带来的便利,各大模型厂商也在积极探索大模型时代“App”。

去年,以ChatGPT、文心一言为代表,大模型“内卷”的主战场是图文问答,今年以来,大模型文、图生成视频受到关注。

大会期间,快手视频生成大模型“可灵”展示了其图生视频的能力。上传蒙娜丽莎图片后,记者输入“蒙娜丽莎用手戴上眼镜”文字后,不久后就可生成5秒钟蒙娜丽莎戴眼镜的视频,让名画中的人物活了起来。

7月6日,可灵AI网页端上线,可灵AI基础模型也迎来升级,推出更加清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力,同时,创作者单次生成的文生视频时长增加至10秒。

与人进行实时、准确交互,也是目前大模型在应用侧瞄准的场景。

7月5日,商汤科技发布了所见即所得模型“日日新5o”,带来一种全新的AI交互模式,即实时的流式多模态交互。

比如对着它随手画一只小兔子,“日日新5o”能很快识别“这是一只可爱的兔子”,工作人员又画了一个微笑表情,它从这个平静的表情中捕捉到了笑意,工作人员又改了一笔把嘴巴画大增添了舌头,“日日新5o”看到后立马说道“这表情开心多了”。

据商汤科技介绍,它就如同真人聊天一样在交流对话,这种交互模式特别适用于实时对话和语音识别等应用。

在大会展览馆,随处可见的还有基于大模型的各种数字人,这也有可能是大模型时代的超级应用。

腾讯展示了基于优图实验室自研算法打造的有智能、有形象、可交互的“数智分身”,其中在医疗行业数智人展台,腾讯把AI技术充分融入就诊全流程,在诊前为患者提供智能导诊、预问诊;在诊中模拟医生形象,提供实时交互,实现在线问诊;在诊后为患者提供合理的用药提醒和智能随访。

今年“618”期间,京东发起了一场特殊的“总裁数字人直播”活动,多位企业创始人或CEO通过京东云言犀化身数字人下场直播。

京东云言犀相关负责人在大会期间接受中新经纬采访时说,大模型的颠覆性应用,不可能从通用大模型的优化中产生,必然是技术进步与产业积累的结合,数字人可能成为AI时代的颠覆性产品。团队在京东“618”的数字人直播中,发现观众接受程度很高:不仅已经跨过了“恐怖谷”效应,而且人均观看时长接近2分钟。这意味着大部分观众已普遍接受了数字人主播。

“618期间数字人直播时长超40万小时,观看人次超1亿、交互超500万次,这给了我们很大的信心。”上述负责人说。

不过,在讨论大模型时代的超级应用是什么时,也不要忽视硬件,硬件本身就是最直接的应用。

大会期间,有些厂商也展示了一批装配了大模型的硬件产品。例如,联想AI PC中的“天禧”个人大模型,是基于阿里通义千问等通用大模型打造;有道词典笔X7内置了子曰教育大模型的两大原生应用——虚拟人口语私教Hi Echo和AI全科家庭教师小P老师;小米旗下的人工智能助手“小爱同学”与阿里云通义大模型展开合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地。

在各厂商积极探索大模型时代的超级应用可能是什么时,与会企业负责人也给出了一些前沿的思考。

对于未来的AI应用长啥样,百度创始人李彦宏最看好的方向是智能体,因为“开发最简单”。

李彦宏表示,随着基础模型的日益强大,开发应用也越来越简单,其中,最简单的就是智能体,只要用“人话”把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,“比互联网时代制作一个网页还简单”。

李彦宏认为,医疗、教育、金融、制造、交通、农业等各领域,未来都会依据自己的场景和特有经验、规则、数据等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。

蚂蚁集团董事长兼CEO井贤栋持相似观点。他认为,为了破解通用大模型落地严谨产业面临的三个“能力短板”,即领域知识相对缺乏、复杂决策难以胜任、对话交互不等于有效协同,蚂蚁选择了构建专业智能体生态的路径,“从我们的实践来看,专业智能体是大模型落地严谨产业的有效路径。”

井贤栋还指出,未来智能化的用户体验,一定不是只靠一个大模型,而是需要全行业深度协作,需要很多的专业智能体共同参与、各司其职。

对于智能体,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示,智能体的本质回归了大语言模型的初衷——人类输入不精确的自然语言,大模型能够用统一的方式去应对,而智能体提供的正是端对端的解决方法。吴运声说:“这是一种可以解决广泛问题的技术路线,所以业界对智能体的研究非常多。”

猎户星空董事长傅盛表示,人工智能的应用是核心,应用就是真正帮助人们解决各种实际问题、以各种AI技术为底层的App、硬件、软件。“只靠用户和大模型去聊天,并不能解决我们的大多数问题,这就是为什么所有人都在谈应用。”

在7月5日举办的腾讯论坛上,腾讯集团副总裁蒋杰在发言时表示,应用场景是未来大模型决战的必然战场。但当前大模型的落地主要集中在生产工具和提效方面,距离真正的业务创新还有一定距离,缺少杀手级的应用。

编辑/樊宏伟

最新评论