北京青年报

潮流｜AI大模型多行业落地 “具身”成为新方向

北京青年报客户端 2023-08-03 13:00

2022年底，诸如ChatGPT、Midjourney、Stable Diffusion等大型模型的相继亮相，掀起了人工智能大模型的发展热潮。国内企业如百度、商汤、360、云知声、科大讯飞等也纷纷发布了各自的成果，推动了人工智能技术在各行各业的落地应用。

AI大模型展露巨大潜力

AI大模型在语言理解、图像识别、自然语言处理等领域展现出巨大的潜力和迅猛的发展趋势。它能够帮助企业和机构加快创新步伐，提高效率，降低成本。例如，在自然语言处理领域，大模型可以用于机器翻译、文本摘要、智能客服等应用场景；在图像识别领域，大模型可以提供更准确的图像识别和分析能力。

速途网与大模型之家联合发布的一份报告显示，根据预测，到2023年全球人工智能大模型市场规模将达到210亿美元，并在2028年达到1095亿美元。中国作为全球人工智能大模型市场的重要参与者，预计到2023年中国大模型产业市场规模将达到147亿元人民币，并在2028年达到1179亿元人民币。

“小说生成电影”成为可能

人工智能大模型的发展，会带来哪些改变呢？其一，将引发人工智能算力的革命。大模型参数量的增加导致训练过程的计算需求呈现指数级增长。为了快速训练大规模模型，需要强大的计算能力来支持高效的分布式训练和并行计算。随着硬件设备的进步，如高性能计算机和分布式计算平台的普及，将成为支持更大规模的模型训练和迭代的重要方式。

其二，将引发人工智能多模态、多场景的革命。随着传感器技术的发展和物联网的兴起，大量的多模态数据，如图像、视频、声音等被广泛采集和应用。大模型可以利用这些多模态数据进行跨模态学习，从而提升其在多个感知任务上的性能和表现。这意味着，一本小说生成一部电影，或者一部电影转化成一部小说都将成为可能。

并且，大模型具有强大的泛化能力，可以在不同模态和场景之间实现知识的迁移和共享，将其应用扩展到不同的领域和场景。

其三，通过结合多模态数据和智能算法，大模型能够赋能多个行业，为行业提质增效提供助力，推动数据与实体的融合，改变行业发展格局。

例如，在法律领域，大模型可以作为智能合同生成器，根据用户的需求和规范，自动生成合法和合理的合同文本；在娱乐领域，大模型可以作为智能剧本编剧，根据用户的喜好和风格，自动生成有趣和吸引人的剧本故事；在工业领域，大模型可以作为智能质量控制器，根据生产数据和标准，自动检测和纠正产品质量问题；在教育领域，大模型可以作为智能学习平台，根据知识图谱和学习路径，自动推荐和组织学习资源。

最后，大模型将引发用户习惯的革命。统计数据显示，目前已有很高比例的人群了解大模型，并且有相当比例的人群已经使用过。特别是在一线城市，人们对大模型的了解和使用的欲望更加普遍和强烈。

“具身AI”是新技术方向

“具身Al”或成为大模型发展的新技术方向。值得关注的是，具身Al与人形机器人并不是一码事。具身智能最大的特质就是能够以主人公的视角去自主感知物理世界，用拟人化的思维路径去学习，从而做出人类期待的行为反馈，而不是被动地等待数据投喂。这一技术方向的发展将进一步提升大模型的智能水平，拓展其应用场景，以及深化与人类的互动。

以自然语言交互的大模型为例，它们不仅具有对话的能力，还能够感知和理解环境中的物体和事件，以及根据人类的意图和需求做出合适的反应。通过人机对话，大模型可以给机器人发命令、理解机器人的反馈、分解任务变成动作、帮助机器人处理图像、声音等多模态的数据，指导机器人改正错误、提高机器人的学习能力等。

文/北京青年报记者陈斯
编辑/王静