北京青年报

记者观察：大模型逐鹿下半场，超级应用仍未“敲门”

中新经纬 2024-07-06 18:29

以按下应用加速键为标志，大模型竞争进入下半场。

在移动互联网时代，App成为超级应用。在大模型时代，会不会出现新的超级应用？超级应用又可能是什么？这一问题，或许可以从2024世界人工智能大会(下称大会)上找到答案。

2024世界人工智能大会7月4日-6日在上海举行。中新经纬摄

中新经纬记者在大会展览馆走访后发现，相比于去年观众们普遍关注“大模型能干什么”，今年观众们对于大模型的关注也渐入“深水区”。“这个图生视频结果真不真？”“虚拟口语教练以前也有，基于大模型做的有什么不一样？”他们在关心，大模型未来将以怎样的形式影响他们的生活。

类比于用户通过App享受移动互联网带来的便利，各大模型厂商也在积极探索大模型时代“App”。

去年，以ChatGPT、文心一言为代表，大模型“内卷”的主战场是图文问答，今年以来，大模型文、图生成视频受到关注。

大会期间，快手视频生成大模型“可灵”展示了其图生视频的能力。上传蒙娜丽莎图片后，记者输入“蒙娜丽莎用手戴上眼镜”文字后，不久后就可生成5秒钟蒙娜丽莎戴眼镜的视频，让名画中的人物活了起来。

7月6日，可灵AI网页端上线，可灵AI基础模型也迎来升级，推出更加清晰的高画质版，以及首尾帧控制、镜头控制等全新编辑能力，同时，创作者单次生成的文生视频时长增加至10秒。

与人进行实时、准确交互，也是目前大模型在应用侧瞄准的场景。

7月5日，商汤科技发布了所见即所得模型“日日新5o”，带来一种全新的AI交互模式，即实时的流式多模态交互。

比如对着它随手画一只小兔子，“日日新5o”能很快识别“这是一只可爱的兔子”，工作人员又画了一个微笑表情，它从这个平静的表情中捕捉到了笑意，工作人员又改了一笔把嘴巴画大增添了舌头，“日日新5o”看到后立马说道“这表情开心多了”。

据商汤科技介绍，它就如同真人聊天一样在交流对话，这种交互模式特别适用于实时对话和语音识别等应用。

在大会展览馆，随处可见的还有基于大模型的各种数字人，这也有可能是大模型时代的超级应用。

腾讯展示了基于优图实验室自研算法打造的有智能、有形象、可交互的“数智分身”，其中在医疗行业数智人展台，腾讯把AI技术充分融入就诊全流程，在诊前为患者提供智能导诊、预问诊；在诊中模拟医生形象，提供实时交互，实现在线问诊；在诊后为患者提供合理的用药提醒和智能随访。

今年“618”期间，京东发起了一场特殊的“总裁数字人直播”活动，多位企业创始人或CEO通过京东云言犀化身数字人下场直播。

京东云言犀相关负责人在大会期间接受中新经纬采访时说，大模型的颠覆性应用，不可能从通用大模型的优化中产生，必然是技术进步与产业积累的结合，数字人可能成为AI时代的颠覆性产品。团队在京东“618”的数字人直播中，发现观众接受程度很高：不仅已经跨过了“恐怖谷”效应，而且人均观看时长接近2分钟。这意味着大部分观众已普遍接受了数字人主播。

“618期间数字人直播时长超40万小时，观看人次超1亿、交互超500万次，这给了我们很大的信心。”上述负责人说。

不过，在讨论大模型时代的超级应用是什么时，也不要忽视硬件，硬件本身就是最直接的应用。

大会期间，有些厂商也展示了一批装配了大模型的硬件产品。例如，联想AI PC中的“天禧”个人大模型，是基于阿里通义千问等通用大模型打造；有道词典笔X7内置了子曰教育大模型的两大原生应用——虚拟人口语私教Hi Echo和AI全科家庭教师小P老师；小米旗下的人工智能助手“小爱同学”与阿里云通义大模型展开合作，强化其在图片生成、图片理解等方面的多模态 AI 生成能力，并在小米汽车、手机等多类设备落地。

在各厂商积极探索大模型时代的超级应用可能是什么时，与会企业负责人也给出了一些前沿的思考。

对于未来的AI应用长啥样，百度创始人李彦宏最看好的方向是智能体，因为“开发最简单”。

李彦宏表示，随着基础模型的日益强大，开发应用也越来越简单，其中，最简单的就是智能体，只要用“人话”把工作流说清楚，再配以专有知识库，即可做出一个很有价值的智能体，“比互联网时代制作一个网页还简单”。

李彦宏认为，医疗、教育、金融、制造、交通、农业等各领域，未来都会依据自己的场景和特有经验、规则、数据等，做出各种智能体，将会出现数百万量级的智能体，形成庞大生态。

蚂蚁集团董事长兼CEO井贤栋持相似观点。他认为，为了破解通用大模型落地严谨产业面临的三个“能力短板”，即领域知识相对缺乏、复杂决策难以胜任、对话交互不等于有效协同，蚂蚁选择了构建专业智能体生态的路径，“从我们的实践来看，专业智能体是大模型落地严谨产业的有效路径。”

井贤栋还指出，未来智能化的用户体验，一定不是只靠一个大模型，而是需要全行业深度协作，需要很多的专业智能体共同参与、各司其职。

对于智能体，腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示，智能体的本质回归了大语言模型的初衷——人类输入不精确的自然语言，大模型能够用统一的方式去应对，而智能体提供的正是端对端的解决方法。吴运声说：“这是一种可以解决广泛问题的技术路线，所以业界对智能体的研究非常多。”

猎户星空董事长傅盛表示，人工智能的应用是核心，应用就是真正帮助人们解决各种实际问题、以各种AI技术为底层的App、硬件、软件。“只靠用户和大模型去聊天，并不能解决我们的大多数问题，这就是为什么所有人都在谈应用。”

在7月5日举办的腾讯论坛上，腾讯集团副总裁蒋杰在发言时表示，应用场景是未来大模型决战的必然战场。但当前大模型的落地主要集中在生产工具和提效方面，距离真正的业务创新还有一定距离，缺少杀手级的应用。

编辑/樊宏伟